
AI人材育成講座 第6回 時系列予測と因果推定
「全部を理解してから使えるようになる必要はない。手元で出来るところから使って理解する所からやる」

前回の質問から

ゴールを明確化した方が良い。
満足度が良い?
次回来店までの頻度や、満足度アンケート、リピート率、MEO評価など
直接と関係なくても、別の数値化できる別の指標も考えてみる(因果をどう考えるのは、人間)
満足度が将来の目標か?病院の儲けを最大化するには?などテーマを考え直す、取れるデータからやるという形になる。

問題解決はルーチンワーク
目の前の問題を言語化して、理想状態との差分をAIに説明して、解決方法を考えさせてそれを繰り返す。
人間側で知識をつけて、さらに解決方法を編み出す。
本当に前に進んでいるのがわかるようにちゃんと聞いていきことが重要。
出ているエラーが「同じことを繰り返しているエラー」なのか「進んでいるために起こっているエラー」なのかを人間が判断する。
同じエラーが堂々巡りになるのは、入力が足りない→さらに必要な追加情報を与えてあげて、解決に繋いでいく。

時系列と因果推計

前回時間がなくて触れられなかった分析(覚える必要は全くない)


時系列予測


未来を予測するとはどういうことか?
連続したデータからその傾向を分析して、今後起こる事象を「予測」する。
予測とは周期を解析して、その法則に気がつくこと

専門家の予測が当たりやすいのは、「言葉にできないものも含めて」たくさんの法則性を感覚的に理解しているから
AIにこの法則性を見つけ出してもらい、それを将来の予測に当てはめる!

よくあるデータの取り方
Trend(傾向):全体的な傾向(そもそも増加傾向なのか、減少傾向なのか)
Seasons(周期):周期的な変化はないか?(日曜日が多いとか、夏が多いとか)
Residual(残渣):傾向、周期を取り除いた残りのデータ
熟練者のAIの使い方
AIが足りないことをわかっていた上で、かつ自分の直感もある上でAIに問いを投げかけて、その差分で自分の直感を磨く
実際にAIに情報を与えて、予測するAIを作る

まずはシンプルにグラフを作ってみて、その傾向をざっくりみていく。
どのような分析ができるかを考える。それによって使いモデルが変わる。
論文で統計をやるときに、まず最初にやるのは散布図を作ってその形の傾向を自分で考えて、証明すべき問いが思った通りになっているからちゃんとみる。
ということをやってたな(思い出)。これをやらないと、AIが弾き出された答えが、正しいかどうかを「直感的に」判断できない。



Thinkingも観れると、これ見ながら合わせて勉強できるので非常に面白い。
ただ、結構こっちを馬鹿にした感じがあるのでそれを笑いながらやれる胆力が必要。

トレンド、季節性、残渣に分けると、このような結果になる。
因果推論
時系列+販売数(結果)のみkら予測するのではなく、他のパラメーターを考えてみる。

Grenger因果推論:普通の因果は「雨が降ったら地面が濡れる」と物理的に直接関係のあるものを指す。Grenger因果推論は、直接的な関係はないが、統計的に因果がある結果になる「気温が上がると、アイスクリームの売り上げが上がる」ようなもの
だからと言って、特殊なことをする必要はなく、AIに「他のパラメーターも入れるんで、それの因果関係も考えて推論の情報として使ってよ」という感じで入れるだけです。

通行人、来店数、Webアクセス数は因果関係がありそう
気温や湿度は因果関係がなさそう
その辺諸々をぶち込んで、予測のグラフを作ってもらう

最終的にこのような感じで未来予測がされる。破線が予測値でオレンジの色塗りが95%信頼区間。
この予測が結局どれくらいの精度なのか?

何を言ってるかわからないのでAIに教えてもらう



結論。「この推論からくるデータは、ほぼ信頼に値しない」
データが足りないとか、考え方が悪いとか外れ値だった山に何か情報があるとか、もう少し人間側で考えることがありそうですね!
さて、問題です。ではこの予測が信頼できると判断されるとした時、我々人間はどのような行動をすべきなのか?
リアルと目的をしっかり考えた上で、結果を出すなりデータを作るなりする必要がある。
今回のポイント
AIにコードを書かせて、その結果の調整をしてを繰り返す。何が問題なのかを言語化して、こちらの意図をしっかりした情報として与えてあげることが重要です。
何より、AIにやらせながら結果を見て話し合うカンパ先生と、いずくね先生がめちゃくちゃ楽しそう!(気持ちめっちゃわかる)