データ分析関連 書籍レビュー 2
はじめに
資格のための勉強ではなく、データ分析系の実務で活かす知識を得るために読んだ書籍のレビュー2回目です。今回は3冊。
なお、上から順に読みました。
実践マーケティングデータサイエンス
おすすめ度:★★☆☆☆
実際のデータを使って、前処理、ロジスティック回帰、決定木、LightGBMをpythonのコードでハンズオンで学べるものになっていました。
ハイパーパラメータの調整と評価に関しても少しありますが、ハイパーパラメーターを変えた時にAUCがどう変化するかの確認をpythonでやっているだけで、理論的な深堀はほぼないものとなっていましたので、機械学習を解釈して使えるようになりたい人向けではなく、とりあえずpythonで機械学習をやるにはどういうコードになるのかを知りたい人向けといった印象でした。
ただしpythonのコードに関しても、基本的なコードについての説明はないので、基礎を知らない場合は追いつけないと思われます。
岩波データサイエンス Vol.3
岩波データサイエンス刊行委員会 (編集)
おすすめ度:★★★★☆
因果推論、効果検証に関して非常に理解が進みました。
データにどのようなバイアスが存在する可能性があるか、バイアスが存在するときにどのように効果検証をすべきかの手法が幾つも書いてあります。
内容は少し理解が難しいところもあり、一度読んだだけでは理解できないものもありましたが、何度か熟読することで理解できました。
ある程度現実目線で書かれており、実際の業務との関連を考えながら読むことができました。
業務で効果検証を行う人にはかなりお勧めできます。
強いて言うならIPWの計算の詳細などは参考文献を参照してくださいとあったのでその内容も書いてほしかったなと思いました。
機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック
森下 光之助 (著)
おすすめ度:★★★★★
その名の通り機械学習を解釈するテクニックが学べました。
重回帰やロジスティック回帰の場合は回帰係数やオッズ非などで解釈ができますが、ランダムフォレストやニューラルネットワークなどのブラックボックスモデルでも使える手法が4つ(PFI, PD, ICE, SHAP)書いてあります。
そのようなブラックボックスモデルでの解釈の話は初めて勉強できたのでめちゃくちゃためになりました。
内容はわかりやすく、理解しやすかったです。それほど難しいことをやっているわけでもないと感じました。
機械学習を業務で使っているもしくは使いたい人にはかなり役立つと思います。
pythonのコードも書いてあるのでハンズオンでも学べて非常によい本でした。
さいごに
以上、書籍の購入を検討されている方に少しでもご参考になれば幸いです。