
機械学習、データ分析必読本の売れ行き上位20冊
Amazonアソシエイト2024-01-01〜2024-12-31の決算
2,457アイテムを販売させていただき、264,529円+メンバー紹介報酬7,750円=272,279円でした。
色々Qiitaとnoteに記事を書いておりますが、上位を見るとほぼ
この記事によるものかと思います。質量ともに間違いないリストと自負しておりますので、まだの方はご笑覧ください。
売上20位までは下記です。
何でもかんでもディープラーニングをすればよい、みたいな記事が氾濫していて、ビジネスに役立たせるためのデータ分析支援をしている現場にいた人間としては戸惑っておりました。それを正す意味でも記事を書いており、下記書籍を特に推奨していたので、うれしいです。
データ分析でうまくいっていない方には参考になる点が多々ある書籍たちと思います。
1位 分析者のためのデータ解釈学入門 データの本質をとらえる技術 72冊
データサイエンスの記事などでは数学や、機械学習モデルの話がほとんどでデータをどう解釈するかが疎かになっています。テキストでもここまで明示しているものはないですね
ソシムさんの原色本シリーズはどれも良いですが出色の出来と思います
2位 データ分析・AIを実務に活かす データドリブン思考 66冊
同じくデータサイエンティストの記事などでほとんど置き去りにされている、「ビジネスの実務に活かすためにデータ分析を実施するんだよ」の観点の本です
データサイエンティスト協会のチェックリストでもビジネス・データサイエンス・データエンジニアリングの3つが必要とされていながらビジネスの観点で語っている記事や書籍は少ないです
ビジネスは意思決定の連続である。とおいて、その意思決定に役立たせるためにデータ分析をするんだと明快です
3位 Python機械学習プログラミング PyTorch&scikit-learn編 impress top gearシリーズ 63冊
まずは数式よりも色々なデータやアルゴリズムに慣れろ派です。その観点では良い本ですね
私は古い版で学びましたがずっと改版している良書です
4位 AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出] 42冊
2位『データ・ドリブン思考』にも関連しますが、データ分析プロジェクト全体について俯瞰的に解説する本はありませんでした
外注する時の単価は?なんて下世話ですが重要なことも書いてあります
データサイエンティストよりも、データ分析PJを外注する担当者の方がより役立つ本かもしれません
5位 「原因と結果」の経済学―――データから真実を見抜く思考法 36冊
因果推論を考えるならば必読ですね
「結果を比較」では正しく施策の効果を測れないよ、では正しく測るにはどうしたら良いかを初心者向けに丁寧に解説しています
6位 データ分析に必須の知識・考え方 統計学入門 仮説検定から統計モデリングまで重要トピックを完全網羅 36冊
1位『分析者のためのデータ解釈学入門』に関連します。統計学を機械学習とごっちゃにされている方が多いです。そして統計学のテキストと機械学習のテキストに書かれていることが全然違うので戸惑うのではないでしょうか
統計学はデータの構造を知るもの、機械学習は予測をするもの
構造を知れば予測もできるようになる
予測をするためにはデータ構造を知らないといけない
の観点で似てくるのですが、あくまでも重心は上に書いた通りです。通常の統計学のテキストですと機械学習を意識していないのでわかりにくいのですが、本書はデータ分析に対して統計学をどう使うかという観点で書かれているので、考え方がわかりやすいのではと思います
7位 基礎から学ぶ統計学 35冊
統計学は厳密だが難しい本か、絵時でわかりやすいが実務とかけ離れている本が多く、本格的に実務に使うための入門的な本が手薄でした
本書は農学部(なので数学にあまり強くない学生)向けの講義を元にしたテキストであり、要点をしっかり押さえながらもわかりやすさ重視で進めています
統計検定2級よりちょっと下、基礎固め的なレベル間です
隠れた名著『バイオサイエンスの統計学』の図解でのわかりやすさを記述統計から2群の検定に絞った感じでしょうか
8位 データ視覚化のデザイン 33冊
データ可視化は軽視されがちですね
最近やっとデータ可視化の本も増えてきましたが、その中でも一番本質をコンパクトに示している本と思います
何を描くかではなく、何を描かないか ←これ重要
9位 妥協しないデータ分析のための 微積分+線形代数入門 定義と公式、その背景にある理由、考え方から使い方まで完全網羅! 29冊
データ分析に必要な数学とはどいうものか、通常の微分積分+線形代数のどこを主に使うのか、そしてそれがデータ分析の場面にどう使われるのかを知る という本を求めているならば本書が現状No.1と思います
10位 指標・特徴量の設計から始めるデータ可視化学入門 26冊
8位『データ視覚化のデザイン』はどう伝えるかであり、本書はそのためにどうデータを扱うかですね
11位 統計学のための数学入門30講 (科学のことばとしての数学) 25冊
わー、よい本なのに品切れなのかー
9位『妥協しないデータ分析のための 微積分+線形代数入門』が出たので優先度はやや下がりましたが、そちらは問題演習がなく本書はあるのでまだ有用度はそれほど落ちてないかと
随分助けられました
12位 データ分析失敗事例集 失敗から学び、成功を手にする 24冊
失敗学という学問があるらしいですがそれのデータ分析でこれをやってくださるとは
成功事例だけだとバイアスがかかり、因果関係が歪むとデータ分析はいいますが失敗事例を出してくれることはまずなかった
本書はもっともっともっと売れて評価されていい
13位 これなら分かる最適化数学: 基礎原理から計算手法まで 23冊
11位『統計学のための数学入門30講』と合わせ機械学習にどう数学が使われるかの隠れたお役立ち書です
9位『妥協しないデータ分析のための 微積分+線形代数入門』が出ましたが本書は問題演習もあり、有効性が失われてないです
ただタイトルが分かりにくいので、機械学習のためのとかでリニューアルされないかな
14位 Kaggleで勝つデータ分析の技術 20冊
本来はKaggleに勝つためのノウハウの本のはずですがデータ分析の精度向上の観点が満載で評価が高いですね
機械学習の観点だと2019年と古い本ですが本質を書いているので、古びた点はあるもののまだまだ有用性は落ちていない。でも本当はこれの第2版が欲しいところ
15位 はじめてのパターン認識 18冊
2012年の本なのですね驚き
機械学習ブーム前の本ですが、簡単な本では逆にわからず、難しい本では難しくてわからずの人たちの救世主ですね
Amazon書評で低評価の人たちを見ると、分かってないのに低評価をつけている見本市のようになっています
16位 DX時代のデータマネジメント大全 DX、データドリブン経営、データ利活用から理解する 17冊
データ分析案件で客先に行くと、データがない、ない、ない!
ビックデータって何だったんだろうって言うくらいデータがないです
いやあるんですけれどデータ分析に耐えうるようにデータを保管していないから使いないわけですね。そこら辺を目的に応じてデータを整理しようぜってことです
16位 なぜ「戦略」で差がつくのか。―戦略思考でマーケティングは強くなる― 17冊
マーケティングの勉強の必要があり手に取ったのですが衝撃を受けました。マーケティングだけでなくビジネス全てに役立つと思います
皆「戦略」の意味がわかっていない。共通認識を持たないままで「戦略」と称した願望みたいなものを語ってませんか
本書が一押しではあるのでもう少し売れてもよいと思いますが、また別のところで書きますか
16位 見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑 17冊
だって数式だけでイメージできないじゃないですか
基本的な機械学習アルゴリズムの仕組みを図解で示してくれています
また、ユーザーにアルゴリズムを説明しなきゃいけない時の参考書としてもお役立ちです
19位 改訂新版 前処理大全〜SQL/pandas/Polars実践テクニック 16冊
最近は類書が増えましたが、初期に出た本書が一番詳しいと思います
Rが消えて大量データ対応のPythonライブラリPolarsに対応した版です
実際に使うときはググっておしまいかも知れませんが、そもそもそういうことができるって知っていないとググることもできませんよね
一読すると知らないテクニックが満載です
20位 本質を捉えたデータ分析のための分析モデル入門 統計モデル、深層学習、強化学習等 用途・特徴から原理まで一気通貫! 15冊
良書連発のソシムさん原色本シリーズ
データを解釈し、統計学や機械学習の基礎を身につけたら、それら道具を使ってどうデータを料理するかの本です