自己紹介

自己紹介

データアナリストのねこぼです。本ブログは統計、機械学習、データ分析に関する中で私が面白そう・役立ちそうと思ったテーマを主に取り上げます。自身の備忘録としての意味合いが強いのでご容赦ください。内容に関しては誤りがある可能性が高いため、もしお気...
時系列分析

知ってるつもりの時系列分解(STL,decompose)

時系列データの分解方法を調べる機会があったのですが、調べた限りではSTLまたはdecompose(古典的分解と呼ばれることも)が使われることが多いようでした。それぞれの主要なコードおよび動作の違いに関してまとめました。なお、通常はグラフ化な...
統計

今さら聞きづらい、因果推論における多重共線性

統計的因果推論を勉強するとしばしば多重共線性は基本的に考慮しなくてよいという記載がある。同時に回帰分析を学習したことがある人だと「あれ、それっていいんだっけ?」と思うのは自然なことだと思う。ここでは因果推論における回帰分析の前提条件を確認後...
統計

【R】相関や時系列の架空データを生成する

新しい理論を導入する際、架空のデータを用意できると色々と便利です。ただ自分で1から書こうとすると面倒なのも事実。なので本ページのコードをコピーすればある程度使えるような形に整理してみました。基本のコード■同じものを繰り返すrep(c(1,2...
その他

WordPressでLatexを使う

本ページの内容は以下の内容を自分用に抜粋したものです。MathJax-LaTeX使い方~一覧~応用まとめ事前準備インストールWordpress上でLatexを使うプラグイン「MathJax-LaTeX」を導入します。MathJax-LaTe...
統計

一般化線形モデル入門の門の前まで

一般化線形モデルに関して情報の整理を試みます。理解が怪しいので後日追記予定。一般化線形モデル【結論】モデル内のどこかに線形予測子をもつ統計モデルのことです。係数βjと変数Xを乗じた各特徴量の総和を求める上記のZを「線形予測子」と呼び、一般化...
統計

今さら聞きづらい、決定係数のまとめ

決定係数に関する情報をまとめています。本ページは断りなく更新する場合があります。決定係数の考え方決定係数(R2値)という名前はなんとなく知っているものの、その考え方を説明するのって意外と難しいですよね。まず本章では決定係数の考え方について私...
機械学習

【R】【tidymodels】RandomForestによるクラス分類

tidymodelを使ったサイトは意外と少なく、苦労したので記録として残しておきます。※本記事は以前私が別サイトでまとめた以下の記事を追記・修正したものです。tidymodelRandomForestによるクラス分類 パッケージのインストー...
可視化

今さら聞きづらい、Seabornのまとめ

データの可視化はデータ分析の基本ですが意外と大変だと思います。そこで今回はPythonのSeabornを使って可視化する方法を整理しました。初歩的な部分は割愛してますので気になる方は文末の参考リンクよりご確認ください。Seabornのインス...