海外の大学の統計学部で学ぶ統計学(1)
日本には続々とデータサイエンス学部なる部門が誕生していますが、いまだに統計学部はできておりません。先日滋賀大学のDS学部のホームページで講師募集していました。人材不足に悩まされているのかなと思います。今後もおそらく統計学部の誕生の望みは薄いと思うので、海外に道を探す学生も増えると思います。今回は私が学んだ海外の大学の統計学部で学んだ科目をを紹介します。
私が履修したのはBS statistics という学士取得を目的としたカリキュラムです。先に断っておくと私の学んだフィリピン大学の統計学部のプログラムは少々古く他の国で組み込まれてる”コンピューターサイエンス”の部分が若干弱いと思います。ご承知の上参考にしていただければと思います。
1年目
”記述統計学”
一年目の最初に学ぶこの科目は、いわゆる平均や分散、データの尺度(nominal,ordinal, interval, ratio) 、 歪度と尖度、箱ひげ図諸々。。。以下本文を貼っておきます。こちらの内容は他の学部にも開かれており、ほとんどの学部で必修科目になっております。ちなみに同時期に数学17という微積以前の高校数学を復習する授業も並行して履修します。
”基本統計手法”
1年目後期の授業でStat 114の延長のような授業です。正直ほとんど覚えていませんが、のちに線形回帰(Stat 136)やANOVAのような分散を見るときのテーブルを若干触ります。
”統計数学”
一年目の最大の鬼門がこの統計数学です。日本だと測度論の基礎の部分に当たる科目だと思います。完全加法族、可算加法族、(σ-)加法族、σ-集合代、σ-集合体などの定義とおそらく”簡単な"照明を行います。
ガチでむずがしくなんども講師のオフィスを訪ね、教えを請いました。
実際に卒業までに117の知識を使ったかと言われると、疑問ですが、数学はむずかしいよ、と気づかせてくれた授業であることに違いはありません。
一年目は統計の基礎的な部分が多く、4年間を通して使う知識固めのような授業です。授業についても厳しくなく、誰も落第はしませんでした。ただし、統計数学は簡単に単位取得できません。現地の同級生でも、手こずっている人が多かった為、難しい内容なのかなと思います。
2年目
”確率論”
分布の数式表現を覚え、確率である証明をする、これの連続です。
ベルヌーイ試行からはじまり、一様分布、二項分布、ポイソン分布、負の二項分布、指数分布、幾何分布、正規分布および標準正規分布、ガンマー分布、ベータ分布、、、様々な分布を嫌という程扱う科目です。平均、分散を導く問題や、公式とパラメータが与えられそこから別の分布に変形させる作業をひたすらやっていたと思います。下の図は分布別にどの分布に変化するかダイアグラムにまとめたものです。
当時は余裕がなかったですが、覚えておいけばもっと楽できたのかなと思います。ちなみにこの時点で私は伊藤清氏の確率論を買いました。
”プログラミング”
統計学部では今後使われる言語の勉強も少し触ります。これらの授業は入門からRaw dataを使って分析するところまで行います。Microsoft Excel 、R、Visual stodio、SPSS、SASと一通り学びます。以降の授業でもよくつかうRについては少し丁寧に習いますが、全部を網羅することは不可能なので自習して使える分析を増やしていく必要が大いにあると感じます。海外の他の大学や日本のデータサイエンス学部はこのプログラミングの部分により時間を割いている印象です。
3年前期
”線形代数”
驚かれる方も多いかもしれません。多くの統計学部では一年時に線形代数を習うと思いますが、私の大学はこの時点で習います。私の学んだ大学が特殊だとおもわれます。Shayle R. SearleMatrix algebra useful for statisticsをメインテキストブックとして使いました。私が日本で線形代数を学んでいなかった為、基礎から進めてくれて助かったと記憶しています。高校で線形代数をやっていてもこの時点で忘れていたと思いますが。。。
最初は基礎からスタートし、学期末には下の画像のような問題を”手作業で”を解きました。
”パラメータ統計推定”
交換留学できていた韓国からの学生がこの科目を必死で取り組んでいたのを覚えている。3年目の鬼門となった科目。実際危うく落第だったし、クラスの1/3ほどは落第した。
標本分布(Sampling Distributions )
点推定Point estimation (MLE, MME, UMVUE, sufficiency & completeness)
信頼区間Confidence Interval (PQM, GPQ)
仮説検定Hypothesis Testing (MP, UMP, showing MLR)
この科目で要求されている知識。UMVUEやBLUEも同時期に勉強した。
この時期のノートを見直して見ると、よくやっている自分に感動すると同時にまるっきり忘れている自分に呆れます。全く使わんだろうという部分も含めすこし見直してみようと思います。
ひとまず時間の区切りが良いので今回はここまで。しばらくしたら3年後期で学んだ、回帰、サンプリングデザイン、ベイズ統計と4年時の多変量解析、時系列分析、実験計画法、カテゴリカルデータ解析(Categorical data analysis)について書こうと思います。