データ分析関連 書籍レビュー 1
はじめに
今回は資格のための勉強ではなく、データ分析系の実務で活かす知識を得るために読んだ書籍を4冊、レビューを残したいと思います。
なお、上から順に読みました。
入門 統計的因果推論
Judea Pearl (著), Madelyn Glymour (著), Nicholas P. Jewell (著), 落海 浩 (翻訳)
入門 統計的因果推論 | Judea Pearl, Madelyn Glymour, Nicholas P. Jewell, 落海 浩 |本 | 通販 | Amazon
おすすめ度:★★☆☆☆
因果推論系の知識がほぼない状態で購入してみました。
データというのは全体で確認される統計的な関係が部分集合の取り方によっては解釈が逆になる(Simpsonのパラドックス)ということが起きるので、
全体の変数の関係をグラフィカルモデルという、点と矢印で変数と因果の方向を表現するもので表現した後、その形がどうなっていたらどういう計算を行って比較をして解釈をすればよいかが書いてあります。
因果推論ってこういうものなんだなということは学べますが、
実務においてはそもそもグラフィカルモデルを作るのが難しかったり、変数が多かったりするのであまり実務的ではない感じがしました。
あと全体的にちょっと難解です。文字に対して図が少ない気がしたのでもう少し図を多めに使って丁寧に説明してほしいなと思ってしまいました。
統計学が最強の学問である
西内 啓 (著)
統計学が最強の学問である | 西内 啓 |本 | 通販 | Amazon
おすすめ度:★★★★★
かなり実務的でわかりやすく統計学の利用シーンや業種による考え方の違い等をデータ分析全体を俯瞰した目線で書いてあり、非常によかったです。
前述のSimpsonのパラドックスも重回帰やロジスティック回帰で防げると記載があり、機械学習のやっていることの意味や解釈方法という、かなり重要な内容が書いてありました。
統計学が最強の学問である[実践編]――データ分析のための思想と方法
西内 啓 (著)
統計学が最強の学問である[実践編]――データ分析のための思想と方法 | 西内 啓 |本 | 通販 | Amazon
おすすめ度:★★★★★
”統計学が最強の学問である”で触れられた重回帰分析についてより具体的、実務的に掘り下げてあり、非常にためになりました。
資格などで理論的な内容を学ぶ際は理想的な状況を想定されることが多いですがこの本では現実的な状況での考え方を学べたので非常に役に立ちました。こういう内容の本をもっと読んでいきたいと感じました。
クラスター分析やt検定の内容もあります。
これからもこの本を見てデータの利用シーンを想定しながらネットで練習用のサンプルデータを探して機械学習の練習を進めていこうと思っています。
ただしPythonなどのコードに関しては全く触れられていないので別で調べる必要があります。
統計学が最強の学問である[ビジネス編]――データを利益に変える知恵とデザイン
西内 啓 (著)
統計学が最強の学問である[ビジネス編]――データを利益に変える知恵とデザイン | 西内 啓 |本 | 通販 | Amazon
おすすめ度:★★★☆☆
人事、マーケティング、オペレーションの3つを例にしてなぜ統計学を使うかをわかりやすく解説してあります。
ただ、実際にはそれらのすべてではなく、あてはまってもどれか1つの状況に置かれているという状況かと思うのであてはまらない利用シーンの細かいところについては参考程度になってしまうのと、分析の活用をビジネスの根本的な改善に向けて書かれているので、経営者等ビジネスの方針を大きく変えることのできる人ならよいですが、担当者レベルでは手の届かない話が多い気がしました。
この本では実践編では触れられていなかった決定木についてちょっとだけ記載があるのですが、その部分が重回帰とクラスター分析と決定木の利用シーンの違いを整理するのに非常に役立ったので、そこの部分でおすすめ度を上げました。
さいごに
以上、書籍の購入を検討されている方に少しでもご参考になれば幸いです。