
統計学初心者の文献リスト
統計学初心者の私がインターネットの海から見つけて実際に読んだテキストのうち、有用だったものをシェア。ひとまずは自分の中で評価が固まりつつある、基礎理論の本に絞って書く。随時更新(?)。
※ゆるふわ本はググればいくらでも出るので、その後に読みたい or 持っておきたい本を集めています。数学寄りの本が多いのは私の好みというだけであって、このルートを通らなければいけないということでは勿論ない。
※レビューや価格推移等の確認用にAmazonリンクを貼っているが、Springer 本家の電子版は寛大にも DRM free なので、もし買うならそっちがおすすめ。
おすすめの本あったら教えてください。
数理統計学
Theory of Statistics, Schervish
測度論ベースの数理統計本。Definition - Theorem - Proof - Example という標準的な数学書スタイル。標準的な数理統計本の範囲(~大標本理論)+ 階層モデル + 測度論周りの Appendix という構成。Spinger から front matter が無料で落とせるので詳細はそっちを見て。
この範囲で数学サイドが気になったら最初に相談する本。通読より辞書的に使う方がたぶん初学者向き。鈍器気味な本だが、他の本がこれは書かなくていいでしょと略しがちな基礎的な部分に手厚いので、なんだかんだで手放すに至らない。Appendix にある条件付き期待値・確率周りの基礎的な結果が証明付きでズラーっとあるので、ここらへんに自信ないなら Schervish 読みなよーと勧めている。
測度論ベースの数理統計本としては他に Shao の Mathematical Statistics (↓)があるが、Notation が標準からかけ離れていてるのと、問題集か?と思うほど重要な結果が演習として読者に投げられていて、だいぶ人を選びそう。Solution Manual 的な本も出ているが、そのカバー範囲は中途半端だったと記憶している。やっぱり人を選びそう。
範囲を適切に決めてセミナーの題材にするのはアリかもしれない。たとえば、Schervish にはないノンパラの章とかで。
Theoretical Statistics: Topics for a Core Course, Keener
Schervish から測度論の技術的なところの議論を省いて(たとえば、出くわした集合の可側性とか、積分と微分記号を入れ替える際の"under suitable regularity"の具体的な条件とか。)統計学の本筋に近いところに集中した本。 Shervish よりだいぶ薄いが、ノンパラや計算科学の周りのトピックもあり、守備範囲はかなり広い。Springer にある目次見て。
通読するならこれを推したい。"数理"統計を求める多くの読者が満足できる数学的議論を提供しながら比較的読みやすく、到達点も割と高いという、なかなか巧妙なバランスを保った本だと思う。注意点としては、技術的な議論を避けてはいるものの、議論のレベルを大幅に下げているわけではないので、劇的に易しくはなっていなさそうなところ。
なお、Amazon レビューでは誤植の多さが指摘されているが、普通に読んでいれば気付く微笑ましいレベルなので、気にする必要もないはず。完全ではないが Errata も出ている。マイナーなようだけど、もっと評価されてもいいんじゃないかなあ。
現代数理統計学の基礎, 久保川
Shervish や Keener からさらに数学的な敷居を下げた数理統計本。悪名高き測度論は出てこない。代表的な確率分布等の初等的な話題に手厚く、6章:統計的推定に入るまでに本文の約4割を費やしている。が、それ以降のコンパクトな記述のおかげでページ数の割に内容は豊富。適合度検定についての分布収束の結果もあるし、GLS に EM-アルゴリズムに MH 法もある(最後の確率過程パートは個人的には微妙だと思っているが…)。サポートページがとても充実しており、演習問題(追加の演習もある!)の解答が全てある。
おそらく、必要な予備知識が微積と線形代数だけ(それ以外に何かあった?)なので敷居が低い上に、標準的な題材と発展的な題材の区分けが注意深くされており、初学者を挫折させまいとする著者の気概を感じる。教養レベルの数学が分かる人にとっては、本格的な数理統計本の一冊目として有力候補に挙がるはず。コンパクトな記述は復習しやすく、そこも美点。基礎的な演習問題がたくさん載っていることもあって、演習書としても重宝する(私の用途は主にこれ)。
よく比較される類書として竹村「現代数理統計学」がある。ざっくりした印象としては、竹村本は統計学を説明するのに数学が出てくる本で、久保川本は数学徒が親しみやすいスタイルで統計学を説く本。竹村本は統計学の本としての意識が相対的に強く、久保川本は数学としての意識が強い。読者のバックグラウンドに応じて好みの方を選べば良いと思う。
多変量解析
多変量解析入門――線形から非線形へ, 小西
本当にタイトル通りの多変量解析の入門書。標準的な多変量解析の各トピックのイントロをこれでもかと優しく書いた本。モデルの動機、概念のお気持ち、数式の意味の解説…etc. と他書では省略されそうなことが長々と書かれている。その丁寧さの反面、到達点は低く、あくまで最初の街における足がかりを提供するのみ。たとえば、主成分分析が固有値問題の解として得られることは書かれているが、主成分を最尤法で推定する方法は書かれていない。
東大出版の多様体の基礎をラノベと評した知人がいたが、それならば、この本は文字の多い数理系の Vtuber あたりだろうか。微積(積分すらいらないかもしれない)と行列演算ができれば読める。Amazon レビューを真に受けると肩透かしに遭う(私は遭った)ので重ねて言うが、到達点は全然高くない。あくまで困ったときの副読本として位置付けるべき。入口のアイディアを掴むための本と思えば優秀。
An Introduction to Multivariate Statistical Analysis, Anderson
私が知る範囲で最も数学的にちゃんとしている多変量解析の本。Definition - Theorem - Proof - Example という標準的な数学書スタイル。多変量正規分布から判別分析・主成分分析・因子分析etc. まで、多変量解析の古典的な結果が初等的な(つまり測度論的確率論を使わず)証明付きでたくさん載っている。辞書。
ど忘れしたり、分からないことに出会ったら、開く本としての位置付けは Schervich と一緒。微積と線形代数(≠行列演算)と統計学の初歩が分かればだいたい読める。古本で安いのを見かけたら買い。
時系列解析
Time Series: Theory and Methods, Brockwell & Davis
ざっくり言えば、ヒルベルト空間の枠組で ARMA 過程を扱うことに特化した本。Definition - Theorem - Proof - Example という標準的な数学書スタイル。Springer から front matter が無料で落とせる。
ヒルベルト空間の幾何学的な性質を利用できるので大変議論の見通しが良い。もともとは ARMA 過程を定める方程式の解の存在・一意性や推定手法が知りたくて手にとった本だけど、純粋に面白くてその後もちょいちょい読んでいる。ARMA に特化しており、Hamilton の Time Series Analysis(↓)のような広範な題材を扱う本ではないことに注意。
Introduction to Time Series and Forecasting, Brockwell & Davis
同著者陣営の学部生向けの本。構成が非常に似ているので、上の本で躓いたら類似箇所を読むとヒントが得られるかも?数値例が豊富で上の本の計算演習本としても使えそう。
おまけ: 機械学習
統計的学習理論 (機械学習プロフェッショナルシリーズ), 金森
数理統計の Decision Theory 的に、つまり損失関数とデータを所与としたときの損失最小化問題の解として、判別関数を選ぶという発想の本。最後に多値分類に拡張するものの、主眼は二値分類。
議論のレベルを抑えながら、数理的題材の重要性を読者に認識させることにそれなりに成功した(よね?)とても希少な和書。ブラックボックス的に使っている機械学習パッケージの裏側の数理を知りたくなったのなら読んでおいて損はない。薄いのですぐ読める。
PRML のアレさ(伝われ)に辟易として、もう少しまともな本はないものか…と探した末にたどり着いた本。数理的にちゃんとした機械学習の本が日本語で読める日はよ!
Support Vector Machines (Information Science and Statistics), Steinwart & Christmann
統計的学習理論(金森)の執筆において大きな影響を持ったであろうと勝手に想像している本。確率論と関数解析で記述する機械学習の研究書。例の如く、Springer から front matter が無料で落とせる。
SVM に特化した本なので機械学習本としてのリーチは限定的なものの、比較的標準的な解析学的議論でコアとなる性質の多くを引っ張り出してくれるので、事前知識に慣れてさえいればかなり効率的に美味しい知識が得られる。(思い返せば、今まで読んだデータサイエンスの本で一番解析学的だったのがこの本かもしれない。ほとんど関数解析とか確率論の本を読んでる感覚。)
第4章が丸々RKHS に当てられていて、後で必要な基本性質が全部ここで証明されている。約50ページとコンパクトに収まっているので機械学習用のRKHSの知識の入手先として、ここ単独でも価値があるかもしれない。
一般的な機械学習入門
「一般的な機械学習入門」が大幅更新。
— 人工知能・機械学習ニュース [公式] (@A_I_News) May 16, 2021
下記READMEからの紹介抜粋です
・入門の章:数学科学部レベルの解析学全分野を習得した人にはわかりやすい機械学習入門
・発展の章:筆者や注目している研究者による機械学習の数学的先端研究の内容@rinnarua
一般的な機械学習入門 https://t.co/2Vovdgfp8i
おまけ: 深層学習
何もわからん。
おまけ: 数学
知っておくと便利な数学達。おまけなので、私の好きな本を並べる。
※ 初学者向きではないものが含まれていることに注意。書く気になったら大雑把な書評つけるかも。
集合・位相
Topology, Munkres
微積
Principles of Mathematical Analysis, Rudin
線形代数
線形代数の世界―抽象数学の入り口, 斎藤
Linear Algebra and Its Applications, Lax
確率論
Probability and Measure, Billingsley
Probability with Martingales, Williams
Diffusions, Markov Processes, and Martingales: Volume 1, Foundations, Rogers & Williams
Diffusions, Markov Processes and Martingales: Volume 2, Itô Calculus, Rogers & Williams
関数解析
Functional Analysis, Rudin
Functional Analysis, Sobolev Spaces and Partial Differential Equations, Brezis