5/29 データ分析の流れ
1課題 ゴール 仮説の設定
2データ収集
3データの確認と理解
4データクリーニングと前処理
5データの分析
1達成すべきゴール
データありきではなく目的があってから必要なデータが集められる
明確なゴールが必要
2課題に必要なデータを集める
3よく確認しデータに馴染むことで分析できるようになる
4不正確や欠損などそれらをきれいにクリーニングする
5
1から4を通して分析手法に適合するようにデータを変形させる
1番時間がかかるのが5
習得するのに時間がかかるのもデータ分析である
pythonの技術的な操作
単回帰分析や重回帰分析など統計学の知識
それぞれ必要で時間が掛かる
それでも1番大事なものは
課題 ゴール 仮説の設定であることを忘れずに