見出し画像

【片足が】統計検定1級中間報告【沼にハマった】

導入的なもの

やあみんな!クリスマスの予定はどう?(初手から自分を刺す)
はいどうも、データアナリストの怠惰る力です。
普段はX(イーロンのおもちゃ箱)に生息しています。

私は数年前からずっと統計検定1級を受けているのですが、ついに今年統計数理の方だけ合格してました。(私が受験番号を間違えている可能性には目をつむります。)

趣味ぐらいの志でだらだらと取り組んでいたので「もぅマヂ無理。 リスカしょ…」となるほどの追い込み方はしなかったものの、いざ振り返ると結構色々なあがきをやってたなと思いました。
せっかくなのでまだ中途半端な結果ではありますが、ここまでやってきたことを振り返ろうと思います!

辛くても(ロドリがいなくても)自傷行為はやめようね!!

本文に行く前に、私はあまりブログを書く人間でもないので、初めに簡単な自己紹介をしておきます。

  • 性別:男

  • 年齢:30代前半

  • 身長:171cm(この前健康診断に行ったら伸びてた)

  • 住所:トーキョーのベッドタウンの一角のアパート

  • 出身:関西

  • 学歴:地方国公立大修士卒(理論物理専攻)

  • 仕事:とあるマーケティング業界でデータアナリシス

  • 年収:この前鷹入りしたあの人のポスティング譲渡金よりは高い

  • 趣味:野球観戦、サッカー観戦、フットサル

  • 支持政党:虎党

  • 好きな女性のタイプ:黒髪でメガネをかけた巨乳のタンクトップのお姉さん(泣きぼくろ付き)

それでは振り返っていきましょう!!


2021年(初受験):数理 ×、応用(理工) ×

雑感

私はコロナが流行りだす少し前ぐらいに2級の方を受けておりまして、こちらはすんなり合格できました。
あの時のノリでやれば片方ぐらいは受かるだろという気持ちで挑みましたが、半分も解答欄を埋められなかった記憶があります。

生憎当時の問題用紙を捨ててしまったのでうろ覚えですが、統計数理ではノーマークだったベイズ統計と線形代数の問題が出てきて「お前は何を言っているんだ」と脳内ミルコ・クロコップがぶち切れてたのを覚えてます。

統計応用では理工を選択しましたが、統計検定としては珍しく機械学習(決定木モデル)の問題が出てきました。
当時の私はデータサイエンティスト職に転職したばかりで、たまたまこの辺のインプットに勤しんでいたため意外に解けた覚えがあります。
それでも合格には至りませんでしたが、何気にこの年が一番応用問題の合格に近づいてたかもしれません。

ちなみに当時の転職話にご興味ある方はこちらをご覧ください!(露骨な宣伝)

当時の勉強

2級を受けた頃に東京大学出版会の統計学入門で一通り勉強していたため、ここまでの知識をベースにもう少し難しめの本でも読もうかなと思っていました。

で、選んだ本がこれ。

そうだね!みんなだいすき集合論に厚い数理統計本だね!!(なお測度論は特に出てきません)
大体一念発起で「統計検定1級受けるぞ!〇るぞ!!ぶっ〇すぞ!!!」ってなった人は竹村先生か久保川先生の数理統計本から始めるのがスタンダードなのですが、何故か私はネットのレビューなんか無視して完全にフィーリングで選んでしまいました。

じゃあこの本が書店によくある怪しい有名人の帯付きの自己啓発本ぐらい使えないのかと言われると全くそんなことはなく、マイナーながらとても有用な書籍だと思います。
事象と確率、確率分布などの基礎的な所から分散分析のような応用的な所まで、統計数理の出題範囲は一通り押さえてありますし、演習問題も豊富にあります。
ただ最初に言ったように集合論に触れながら論理展開していたり、情報量やエントロピーのような情報理論も扱っていたりして、統計検定の勉強としてはオーバーワークになってしまう感は否めませんでした。
また演習問題も豊富なのですが、略解しか載っていないためこちらの点でも初学者の最初の一冊としては厳しかったのかなと考えています。

個人的には測度論や計算機科学をしっかり学ぶ機会が来たらまた読み直したい一冊だなと思います。(来るとは言ってない。)

結局この年は上記の一冊を通読した後に公式過去問を直近2年分程度解いて試験に臨みました。

2022年(受験なし)

この年は当時の仕事に関連して機械学習をしっかり学ぶ必要が出てきたため、一旦数理統計からは離れていました。
あとKaggleやSIGNATEなどのデータ分析コンペにもはまって毎日コーディングばかりしていました。

この時にパターン認識や自然言語処理の初等的な内容を学びましたが、思ったよりも機械学習って数理統計の範囲に掠ってなくて、統計検定を受けてもまともに回答を書ける気がしなかったのでこの年はスキップしました。
まあしかしこの年に機械学習にのめりこんだことで昨今のAI界隈の話題に何とかついていけるようになったし、コーディング技術は上がったし、オブジェクト指向を意識できるようになったし(元SEとは思えない発言)、有益な一年でありました。

え?じゃあデータ分析コンペの成績はどうだったのかって?
まあそれはいいじゃないですか…笑
どうせメダルもまともにとったことないんだろって?
HAHAHA. そんな不躾なことを聞いてくる方には来年贔屓球団のエースが無理やりポスティングでアメリカに行って次の年にソフトバンクホークスに入団する呪いをかけますね!

F(ふらっと)A(アメリカ旅行)

2023年(2回目):数理 ×、応用(社会科学) ×

雑感

2021年よりも準備が雑で爆死しましたが、阪神が日本一になったので結果オーライです。

統計数理では重回帰分析と検定の問題が目に入って速攻で切ったのを覚えてます。
今にしてみれば手を付けられない問題でもなかったと思いますが(いややっぱ重回帰はめんどそう…)、この年は後述の書籍を一通り読み込んだだけで明らかに問題慣れしておらず、計算ミス&時間切れになりました。

統計応用については、この年から選択科目を社会科学に変更しています。
私はマーケティング業界でデータアナリストとして働いているため、「業務に掠ってる分野の方がけっこう解けんじゃね?」と立浪元監督ばりの素晴らしい判断でこちらの科目に変えました。
しかし蓋を開けてみると経済とか金融系の問題ばかり出てくるし、時系列分析の範囲からマルチンゲールの問題が出てくるしで「ここはどこ?私は誰?」状態になってました。

←自信ありきで試験を受けるワイ 問題用紙に目を通したワイ→

当時の勉強

この年やったことは竹村先生の「現代数理統計学」を通読したのみです。

前回受験してから1年のブランクがあったので、統計学を思い出すためにまずはこれを読み込もうと思ってたらほんとに読み込むだけで1年が終わりました。
しかも章末の演習問題すら手を付けられずで、タイガースの日本一に狂喜乱舞してたらいつの間にか試験日を迎えてました。

これの14日後には試験だったという事実

というわけでこの年は前半早々にペナントを独走する贔屓球団の試合を見漁り、仕事についても新しいことにチャレンジしていてこちらのインプットもしなきゃいけないという状況だったので、統計検定については半ば捨てゲー感が否めませんでしたね。

それで竹村先生の「現代数理統計学」はどうだったのかというと、いやーびっくりするほど読みやすかったですね。
既に別の本で一通り数理統計を学んでいたから読みやすかったというのはあるでしょうけど。
構成についても最初に1次元の確率変数から入って、多次元、標本分布と徐々にステップアップしてくれるので頭に入りやすいなと思いながら読んでました。
また稲垣統計とは違って集合論的な話題には一切触れず、確率測度や確率空間は暗に認めた上で書かれていました。(まあこれがスタンダードな構成なんだろうけど。)
一部の数学ガチ勢の方には物足りないのかもしれませんが、まあ実務では測度論にまで立ち入ってデータ分析を思考する場面がありませんからね…

統計検定の教材としての目線で考えるなら、結構早い段階でややマニアックな話題(リスク最適性、十分統計量の完備性 etc…)に触れていて、資格試験の勉強を目的としているなら飛ばすべき箇所が多いなとは思いました。
また色んな話題に触れている分、若干テキストの分量がボリューミーなのも好みがわかれるかもしれません。
演習問題については比較的問題数が少なめなので、他の問題集で補いながら使うのが推奨されていますね。(結局私はやりませんでしたが。)

2024年(3回目):数理 〇、応用未受験

雑感

去年の惨状と今年の勉強の進み具合を鑑みて統計数理のみに集中しました。
統計応用は特にトラブルとか無ければ来年受け直そうと考えてます。

流石に3回目の受験ともなると統計学の知識はもちろん、試験システムの理解や戦略まで洗練されてきたので、鮮やかな判断の速さで最初の3問を脳死で解きました。
4問目は初手からガンマ分布関数のグラフを5パターン描けとか書かれてて「ヒェッ」っと言いながら切りました。
5問目は順序統計量の問題で、これはこれで面白そうと思いましたが、なんとなく計算量多そうだなと感じてこれもスキップ。
消去法で残った3問を解きましたが、結局3問目に取り組んでいる途中で時間切れになりました。

回答した分は余すところなく点数がもらえてるだろうと手応えはありましたが、4年もかけて取り組んだ割にはおそらく7割程度の正答率だったというのが心残りではありましたね。(まあこんなもん受かった奴が等しく勝者だろうという気もしますが。)
あと第2問が二次元の円上で順序統計量を考える問題で、ちょっと目新しく感じて楽しかったです。

当時の勉強

4年目にして初めて久保川先生の「現代数理統計学の基礎」を手に取りました。

既にここまでで2冊も別の本で数理統計を学んだこともあり、正直目新しさはなかったのですが、全体的にコンパクトにまとめられてるなと感じました。
最初の9章までで統計数理に必要な範囲が綺麗に無駄なくまとめられています。
ただコンパクトにまとめられてる分、行間を埋めなければいけない箇所が結構あるため、初学者が最初に読むべき本であるのかは好みが分かれる所なのかなとも思います。(ただし稲垣統計よりは間違いなく推奨できる。)

またこの書籍の素晴らしい所は何より演習問題の手厚さで、統計数理の内容のみではありますが総計200問以上の良質な演習問題が詳しい解説付きで用意されています。
久保川先生はこの書籍以外にも様々なレベルの数理統計学の書籍を書かれており、各本の演習問題についてもサポートページに解説をまとめられています。
準1級以下のレベルの試験を受ける方にもとても有用なコンテンツだと思うので、勉強されるときはぜひ利用されるのをお勧めします。(突然の回し者ムーブ)

結局今年は上記の書籍の演習問題をひたすら解き続けました。
これしかしていないのに格段に数理統計への理解が進んだ気がするので、やはり紙とペンを持ってしっかり手を動かすのは大事なんだなと気づかされましたね。
ただ上記の通り総計200問以上の問題量があったので、1年通してやり切るだけでも時間的にカツカツだったりしました。

あと仕事場でも空いた時間を使って演習に取り組んでいたので、オフィスの片隅でルーズリーフを出してゴリゴリ謎の数式を書く限界独身おじさんの構図が完成してしまい、一時期職場から若干浮いてました。皆様もお気を付けください。

まとめ

まだ道半ばではありますが、ここまで取り組んできたことを雑多に書き起こしてみました。
初手で使う本を間違ったかなとか野球に時間を取られすぎたとか紆余曲折がありましたが、結局の所「どの程度計算用紙に向かって問題に取り組めたか」というのが重要だったのかなと思います。
これに関しては筋トレと同じで、ほんとに取り組んだ分だけ血肉になって自分に返ってきたと実感したので、この成功体験はこれからも大事にしていきたい所存です。

何はともあれ1級の片方に合格してしまったので長くとも10年はこの資格から逃げられなくなりました。
片足が沼にハマってしまったというお気持ちがしないでもないですが、こうなったらちゃんとゴールできるように最後まであがき切ろうと思います。

まあ来年にはさらっと統計応用にも合格して、年収2000万になって、都内85階建タワマンに住んで、可愛い彼女ゲットして、Suicaに常時10万以上入れて、ランボルギーニムルシエラゴに乗って、彼女にフルパワーでドアを閉められて別れを決意してやりたいと思います!
ではまた!!

最後に(という名のゆる募)

来年からまた科目を理工に戻して統計応用の勉強をしていこうと思っているのですが、肝心の教材がわからず現在探しています。(特に演習問題が豊富なタイプの教材が見当たらない…)
この記事を読んでいただいた心優しき統計学のプロの皆様、何かいい教材がありましたらご共有いただけると大変助かります。
是非よろしくお願いします。

いいなと思ったら応援しよう!