時系列分析に関する応用的なトピック
このnoteで最もアクセス数が多い記事がコレなんですが
その後も良い情報があると加筆修正してたんですが、1頁に収めるには情報量が多くなったので、上記を主、周辺的な話題をこちらに整理します。
生存時間解析・信頼性解析
は結果的に顧客の要件に合致せずPJで採用しなかったけれど、少なくともコンセプトはデータサイエンティストなら押さえておかないといけないものだと思う。もっと良い記事や論文があれ積極的に追加したい。
説明変数を組み込んだ時系列モデル
VAR(ベクトル自己回帰)はマクロ経済モデルに取り組んだときは多用したな、RのMTSライブラリだっけな。「RegARIMA」は知らない。
状態空間モデル
は多少は使ったことがある。ただ、他の時系列モデルと比べて必ずしも予測精度が良いわけではなく、僕が感じた一番のメリットは欠損値がある時系列データを穴埋めしながら逐次的な予測をうまくやってくれるところかな。
事例調査では、政府統計データを使ったナウキャスティング(足元予測)でよく使われていた。3か月ごとに発表される政府統計(その発表月が違うものもある)を月次のデータと一緒に使って月次予測するときとか。
「Pythonではじめる時系列分析入門」を読む ~第5部 第6章 状態空間モデルの分析事例~
僕がやってた時はRだとdlmとか3つほどライブラリを試したけど、最近だとこんなRライブラリがあるらしい。
ブームの頃には状態空間モデルもProphetも信奉者がいて(SE崩れの自称データサイエンティストが最低限のお作法もなく流行りの手法を振り回してたとも言うww)困った時期があったなぁ、という思い出とともに。
AutoML
は時系列でもある、ということでメモ。
automlって訳じゃないがPythonだとmlforecastやStatsForecastというライブラリがあるらしい。なんかRのcaretにたいするpycaretのような、初心者にとってわかりやすいけど、深いことをやろうとすると痒い所に手が届かないライブラリっぽい気もするが。。。
適用の観点、事例など
もう少し込み入った統計モデル
因果推論を絡めたり、まぁいろいろ派生はありますよね。
LLM活用
で何とかしようという話題も出てきている。研究動向を調査・整理してくれている記事は以下の2つ、とても理解しやすい。
あとは適用事例・論文を
他の情報を見たい方は、目次ページへ
仕切り直しで収集情報の整理から|くすぐったがり|note