データサイエンティストの仮説思考⑤:データを予測する力を身につける
読書ノート(130日目)
前回に続いて
今回もこちらの本からです。
この読書ノートでは全5回に分けて
①データを読む力
②データを説明する力
③データを分類する力
④データから法則を見つける力
⑤データから予測する力
を紹介できればと思います。
では、今日は⑤データから予測する力
についてです。
今回はデータを予測するときの
注意点や手順に関する内容でした。
ちなみに本書での予測手法は
単回帰分析が紹介されていました。
特に、外挿という考え方は
言葉よりも図を見た方が分かりやすく、
本書の図が最も分かりやすかったのですが
(私のスマホのカメラ撮影技術では
該当のページを上手く撮影できず…汗)
代わりとして以下を紹介します。
つまりは、予測するときに使ったデータの
範囲外のことを予測するときは信頼性が低い
ということですね。
例えば、モノの値段でも
値上がりや値下がりした際に
常に直線的に購入数が動くわけではなく、
ある価格帯を下回ったら
一気に購入数が増えたり、
または…
安すぎて警戒されて購入数が伸び悩んだり
と実際のデータに無い範囲のことは
予測は難しいということですね。
(この例え話によって、かえって
伝わりにくくなっていましたらスミマセン…)
今週はかなりバタバタな一週間で、
この後も明日からの仕事の準備をしたいため
今日はこの辺で!
今回も全5回にお付き合いくださり、
ありがとうございました!!😂
それでは皆さんも
良い週末をお過ごしください~!😉✨