【書評:☆☆☆☆★】統計学が最強の学問である[数学編]
「統計学が最強の学問である」シリーズのなかの一冊で、統計学や機械学習に必要な数学の解説書です。
統計学を学び、今後は機械学習にも手を伸ばそうとしている身として、要求される数学レベルを概観しておきたいという目的で購入しました。
中学数学レベルからスタートしますので前半はわりと退屈な内容ですが、後半は難易度が上がります。
後半のダイジェストはこんな感じ。
●感染症の流行を説明する単純なモデルとして、新規感染者数がそれまでの感染者数yと非感染者数(N-y)に比例するという微分方程式を考えると、累積感染者数はロジスティック関数で表される。
●最尤法で尤度関数の1階条件を考えるとき、関数f(x)の積の微分を考えるのは難しいが、対数尤度に変換すると和の微分で考えられる。
●重回帰モデル(yi=β0+β1・x1i+β2・x2i+・・・+βp・xpi+εi)を線形代数で表現するとy=Xβ+εと書ける。
●重回帰モデルの偏回帰係数を求めるには、ε=yーXβの二乗和を考えたのちに列ベクトルβで偏微分する。ただし、実際問題としては数学的に正規方程式を解くのではなく、最急降下法などのアルゴリズムでコンピュータ演算の繰り返しにより力技で解く。
自分で書いてて何ですが、まだ1度しか読んでいないので理解の怪しいところも多々。統計検定2級程度の知識でこれなので、本書冒頭のコンセプトとは異なり相応の前提知識が必要な気がします。
最終的にディープラーニングやバックプロパゲーション(誤差逆伝播法)にまで足をのばす本書。読んでよかったことは間違いありませんが、自分の数学の弱さを再認識しました。
個人的には、指数関数・対数関数の微積分といった高校数Ⅲあたり、大学の線形代数あたりの強化が必要そうです。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?