統計検定準1級合格体験記
統計検定準1級に合格しました!
とは言っても2回不合格になってようやくの合格です。
統計検定準1級の合格までの過程や思い出を書いていこうと思います。
超長文になります。ですので覚悟して読むもよし、適当に流し見するもよし、ちょっとでも目にとめて頂けると嬉しいです。後半では2級のことについても触れるので2級の試験合格を目指している方は「統計検定2級の復習」だけでもご覧ください。
はじめに
どんな勉強をしたのかも書いていこうと思っていますが、私は合格までに3回試験を受けています。なので例えば「1か月で合格!」とか「最短で合格しました!」みたいな記事にはなりません。
また、合格に至るまで色々な書籍や動画コンテンツを購入しています。なので「お金をかけずに合格!」という内容にもなりません。また、私の勉強法で必ず合格するというわけでもありません。たまたま私にはこの勉強法が合っていたというだけで万人に受け入れられる勉強法ではないかもしれませんので予めご了承ください。
スペック
35歳男性の社会人です
地方国立大学の経済学部を卒業しました。
数学は文系なので数学ⅡB まで履修しました。(部分積分とか置換積分とかネイピア数の存在とか線形代数の知識とかは準1級の勉強を通じて初めて知りました。)
現在は医療事務の仕事をしています。
データ分析とは無縁です。
プログラミングは何もわかりません。(これから勉強したい。)
統計検定2級は今年の2月に取得済み。(61点でギリギリ1回で合格でした。)
なぜ受けようと思ったのか
何となくデータ分析の仕事に漠然とした興味があり、その中で統計学の知識が必要となることを知りました。そこで統計検定2級を受験したのですが、統計学が面白い!と思って、もっと高みに行きたいと思い、統計検定準1級も受けようと思ったのがきっかけです。
勉強期間
後述する教材の統計学実践ワークブックに取り掛かったのは今年の4月からなので5か月かかっています。
統計検定準1級について
難易度
私にとってはとても難しい試験でした。後述しますがたくさんの挫折ポイントがあります。ネットでは20%程度と書かれていますが、CBTになったので本当かどうかはわかりません。
挫折ポイント
① 試験範囲が広い
めちゃくちゃ範囲が広いです。覚えることも理解することも統計検定2級の比ではありません。メインで使う教材の統計学実践ワークブックは全32章で構成されていますが、超あっさり書いて32章です。内容によっては1章分で1冊本が書けるのでは・・・?と思う内容もあります。
② ワークブックの内容が難しい
何度も繰り返し述べているメインで使う教材である統計学実践ワークブックの内容が難しいです。
最初の章は確率や条件付き確率、期待値、分散などで「2級と変わらないじゃん」と思って次の章に行くと、いきなり「生存関数とはうんたらかんたら」と書いてあって、急に話が変わって「同時確率密度関数とはうんたらかんたら」と書かれ、最後に「確率母関数とはなんとかかんとかでモーメント母関数とはなんだのかんだの」とかよくわかんないことが書いてあります。ちなみに2章の始めの生存関数とかいうのは急に話が終わったかと思ったら19章でまた出てきたりします。そんなことばっかりです。
そしてその章の内容を理解して、章末に記載されている例題を解いていくというのが基本的な勉強の流れになるのですが、初見じゃさっぱり解けません。こんなのを32章分続けていきます。気が狂いそうになりますね。
③ 試験そのものが難しい
単純に試験が難しいです。ただでさえ範囲が広いのにその中でもマニアックなことを聞いてきたり引っ掛け問題みたいな出題をします。「ワークブックに書いていたような気がするけど・・・これ出すの・・・?」みたいな問題が出ます。ちなみにあんなに苦労して解いたワークブックの例題からそのまま出題されるというような優しいことは私が受けた全3回の試験ではありませんでした。悲しいね・・・。
1回目の試験まで
まず、使用した教材を記載します。
使用教材
① 日本統計学会公式認定 統計検定準1級対応 統計実践ワークブック
必須です。これをメインに据えて勉強を進めていきます。これを理解していくことが統計検定準1級の合格に直結すると言っても過言ではありません。
ただし、先にも書きましたがこの内容がめちゃくちゃ難しいです。これを理解するために様々なコンテンツや書籍にあたりました。以下にまとめます。
② Yuya Kawaguchiさんの動画
初見では解けないワークブックの例題を板書付きで丁寧に解説してくださっています。川口先生の動画が無ければ私はずっとワークブックの例題を解くことは出来なかったでしょう。
ちなみにFacebookに統計検定準1級受検者の方々が参加されているFacebookグループも運営もされていてこちらのFacebookグループに参加すると動画では解説しきれない問題の解法メモを見せていただくことが出来ます。参考になりました。
③ JB_semioneさんのnote
この方も例題の解法メモを公開してくださっています。めちゃくちゃきれいです。そしてめちゃくちゃわかりやすいです。これが無料で見られる時代に生まれてよかった・・・。
個人的に圧巻だったのは28章分割表の問28.2の逸脱度の計算です。何度やっても数字が合わずに絶望していた私を救ってくださいました。解けたときは思わず「すげぇぇぇ!」と声が出ました。
また31章ベイズ法の問31.4をちまちま計算してうんざりしていたところを条件付き分布の期待値と分散の公式を使うという発想でめちゃくちゃ簡単に解けることを気づかせていただきました。 本当にありがとうございました。
この他にもワークブックどこまでやったの?という記事も読んでいて「わかるわ~」とか「ここ難しいんだよね~」等と共感しながら読ませていただきました。それを読むことで「合格者の方もここは理解があっさりしていたんだな」とか「ここは重点的にやったほうがいいんだな」などと理解することが出来ました。
④ 多変量解析法入門
統計検定準1級は大きく4つに分類されていて
1.確率と確率分布
2.統計的推測
3.多変量解析法
4.種々の応用
に分けられるのですが、その中でもこの本は多変量解析法の導入本として最適でした。実際に手を動かして計算することで理解を深めることが出来ました。ただ、ワークブックはこれ以上に難しいことを書いていて、「この本の内容はわかるのにワークブックはよくわかんないや」となることが結構ありました。
多変量解析法はワークブックでいえば22章から26章までが該当するのですが、おそらくこれらを全て網羅した本はないと思います。その上めちゃくちゃあっさり書いていて多変量解析からは何度も逃げ出したくなりました。
ちなみに今でも23章の問23.3は解けません。というより解いていません。例題で諦めたのはこれと30章の問30.1です.
⑤ 経済・ファイナンスデータの計量時系列分析
おそらくワークブックで一番ページが割かれている27章時系列分析の導入本として1章から3章まで読みました。定常性とAR過程、MA過程、ARMA過程を抑えるには1章から3章までで十分です。導入本として最適でした。
⑤ Syleirさんのブログ
時系列分析で詰んでいる人は必ず見たほうがいいです。こんなにわかりやすく時系列分析を解説しているサイトは他に知りません。ワークブックでは何を言っているの?となるところを嚙み砕いて説明して頂いて、結局何をしたいのかといういわゆる「お気持ち」の部分を丁寧に書いてくださっているのでワークブックの読み込みもすんなりいきました。計量時系列分析→Syleirさんのブログの接続で時系列データは得点源にできるようになりました。
⑥ 道具としてのベイズ統計
31章 ベイズ法の導入本として購入しました。導入本としては非常に優れていてベータ・二項モデルやポアソン・ガンマモデルの理解が捗りました。比例の記号の∝は初めて見て「めちゃくちゃ便利じゃん!」と感動しました。最後の方にMCMCについても記載されているのですが当時の私の頭では何を言っているのかさっぱりわからず「まぁいいや」と思って途中で読むのをやめてワークブックを読み進めていきました。結果MCMCで詰みました。
⑦ 【みやもと統計講座】統計検定準1級「まずはここから」得点力向上講座その1
https://www.udemy.com/course/toukei-kentei-grade-pre-1-v01/learn/lecture/38500248?start=1#overview
自分の中で合格点に到達するには先に述べた
1.確率と確率分布
2.統計的推測
3.多変量解析法
4.種々の応用
のなかでも確率と確率分布、統計的推測でしっかりと点数を取りきることだと思い、その確率と確率分布の理解を深めるために購入しました。
最初の確率計算の問題で図を用いて確率を出すのですが、初めての知識で「革命だ・・・」と部屋でつぶやいた記憶があります。他にもモーメント母関数や確率母関数を問題として解くならこうすればいいんだなと発見の多い講座でした。
⑧ 図解即戦力 機械学習&ディープラーニングの仕組みと技術がしっかりわかる教科書
統計検定準1級では機械学習の分野が出題されます。
しかし、何の知識もない人がワークブックを読んでサポートベクターマシーンだのニューラルネットワークだのクロスバリデーションだのと言われてもさっぱり意味が分からないと思います。私はわかりませんでした。
この本は数式なしで図解で機械学習の内容を記載しています。ワークブックでよくわかんないカタカナが出てきたら辞書替わりに調べてみると記載されていて「なんだそういうことか」となることが多かったです。
以上を駆使して何とかワークブックを読み進めていき、例題を解くことを目標としました。
途中まで行って、「一旦、前に解いた章を復習するか」と意気込んでさっぱり解けなくなっていた時は絶望しました。これも挫折ポイントです。そしてどこまで遡ればいいのかわからなくなり、全然前に進めないという負のループにはまります。これも統計検定準1級受検者あるあるだと思いたいです。
結局、約300ページあるワークブックを1周するのに1か月以上かかりました。
自分は本当に物覚えが悪いのだなと思いながらも行ったり来たりして少しずつ前に進んでいける感じは勉強の面白さなのかもしれません。
話がそれました。ワークブックを2周したところで1回目の試験を申込みました。当時は6月ごろだったと思います。約1か月後に試験があるからもう1周ワークブックいけるなと思い、再度ワークブックを周回しました。
1回目の試験
結果
不合格でした。
59点で悔しいという気持ちもありましたが、正直手応え的にはもっと悪いと思っていました。難しかったです。
ワークブックの細かいところから出題されて、「ここはノーマークだった」とか「知らんがな」とか心の中で呟いていました。
1回目の不合格を踏まえて
この不合格を受けて、「知識不足だった。とにかく細かいところも出るんだ。なんならメジャーなところからの出題の方が少ない。知識をあいまいなままにするのはよくない。」と反省し、とにかくワークブックを読み込みました。
例題からは全くと言っていいほど出題されず、章の一文にさらっと書いてあるようなことが出題されました。
そこでChatGPTを使って細かい一文についても質問し、作問してもらい、ワークブックを復習しました。正直、過学習と言ってもいいと思います。例題に関して言えば問題を見ただけで「あぁこの解き方ね」とさらっとわかってしまうレベルになりました。前は1周するのに1か月以上もかかっていたのに、この頃には数日あれば読めるレベルになっていました。
これだけやれば2回目こそ受かるだろうという思いで2回目の試験を迎えました。
2回目の試験
結果
不合格でした。
それもただの不合格ではありません。前回よりも大幅に点数が下がっての不合格でした。惨敗です。
言い訳をすると単純に問題がめちゃくちゃ難しかったです。全然解けませんでした。個人的に統計的推測がここまで取れないのは本当に落ち込みました。
ここが一番の挫折ポイントだったと思います。これだけワークブックを周回してこの結果とは・・・いったい何をやればよいのだろうと途方に暮れました。
2回目の不合格を踏まえて
色々悶々とした結果、「2回目の試験はインプットに寄りすぎていたのかもしれない。ワークブックの過学習を思い切ってやめてみよう。とにかく問題を多くこなしてみよう」という結論に至りました。また、次の目標を立てました。
1.確率・確率分布と統計的推測を高得点で安定させる。特に統計的推測は絶対に落とさない。
2.多変量解析から逃げない
これらを実践するために以下の参考書や演習書に取り組みました。
① ガイダンス確率統計 基礎から学び本質の理解へ
私は確率の問題で集合の記号と条件付き確率が一緒に出題されるとさっぱり解けないという弱点に気づけました。(2021年の過去問の記述1のような問題です。)
その弱点を克服するためにこの参考書の1章から3章までを周回しました。問題のレベル自体はものすごく難しいわけではないけれど、考えて解くという点で過学習対策になったと思います。そして何より解いていて楽しかったです。
② 統計検定準1級 公式問題集(過去問)
今更かよ!とツッコミを入れたくなる気持ちもわかります。これには理由があって・・・
ネットを見るに、ワークブックと過去問は問題が似ているからあまり意味がないという記事をよく目にしていたため、あえてやっていませんでした。
しかし実際にやってみると初見の問題も多くて、CBTの問題よりは簡単だけど演習書にはもってこいだなと思いました。特に解けなかった問題や多変量解析の問題はチェックをつけて復習し、あつまれ統計の森を見て理解を深めました。ワークブックの過学習になった方は一度過去問に触れるのもありかもしれません。ただし過去問も過学習はよくないと思いますのでほどほどに。
③ 多変量解析入門 線形から非線形へ
多変量解析から逃げないために買いました。難易度はワークブックと同程度くらいだと思います。ですが、ワークブックでは数ページでまとめられているところをしっかりと具体的な数式展開を用いて示してくれているのでワークブックよりかは遥かにわかりやすかったです。
よくワークブックの行間が空きすぎてわからないと言っている方がいますが、この本はその行間を埋めるという点では最適だと思います。
多変量解析のうちワークブックで言うところの25章と26章以外は記載されています。SVMをここまで詳しく書いているのはこの本だけだと思います。
読んだのは6章の判別分析、8章のサポートベクターマシーン、9章の主成分分析、10章のクラスター分析です。読み方としては例えば先に書いた多変量解析法入門の判別分析の章を読んで、次にこの本の判別分析の章を読んで、ワークブックを読む。同様にして主成分分析、クラスター分析も読みました。
この本の内容を完璧に理解することは出来ませんでしたが、各種分析法が結局何をしたいのかという「お気持ち」の部分を理解することが出来ました。
余談ですがこの本を読むとよくワークブックはこれほどの内容をこんな薄いページでまとめたな・・・と感心できます。
統計検定2級の復習
何でいまさら?と思う方もいるかもしれませんが、2級の過去問は非常によくできています。
例えばワークブックの12章にはポアソン分布の検定について触れられていて、真の値λが十分に大きければ正規分布で近似されると書かれています。文字で読めば「ふーん」で終わるのですが、出題される可能性があるとしたら問題として解きたくありませんか!?
なんと統計検定2級の2016年11月の問9にポアソン分布の正規近似に関する問題が出題されています。結構な良問です。
これはあくまで一例ですが、他にもこれは準1級に出題されてもおかしくないなと思うような問題が2級の過去問には結構あります。
2級の過去問は2011年~2021年の分まで全部持っていたので次の参考書と動画を使用して確率と統計的推測をみっちりとやり遂げました。
① 統計検定2級合格のツボ
これはマジでおすすめです。2級合格を目指していて2011年度から2021年度までの過去問持ってるよという方は購入をオススメします。
幅広い過去問から例えば推定の問題ならこの年度のこの問題を解けばいいよと言うのをまとめてくれていて、なおかつ解説付きです。過去問を分野別の問題集として利用することが出来ます。
② 独学者のための統計学基礎講座「仮説検定と区間推定」
https://www.udemy.com/course/yuyasn-15/learn/lecture/29527959?start=0#overview
はい、また川口先生です。信者です。私はこの講座のおかげで2級の時から推定と検定を得点源にすることが出来ました。2回目はたまたま難しかっただけだと思って改めて推定と検定を復習し2級の過去問を演習しました。
3回目の試験
結果
合格しました。
終わった瞬間小さくガッツポーズをしました。
努力が報われて嬉しかったです。
合格して思ったこと
まず、難易度にばらつきがあると感じました。合格した3回目は明らかに1回目や2回目よりも簡単でした。ちなみに2回目は激ムズでした。今やっても受からないと思います。いわゆる難易度ガチャはあると思います。だから一度落ちたからと言って諦めるのではなく継続して受け続けるのが大事なんだろうな思いました。
次に不合格したときは勉強法を見直すいい機会だと捉えることが重要だということです。これは別に試験に限った話ではありません。大事なのは失敗したときに何を学ぶか、次にどう繋げていくかを分析し、実践していくことが大事なのだと思います。多分2回目の続きでひたすらワークブックを続けていても多分3回目の合格はなかったと思います。なので、不合格になったときは一度立ち止まって勉強法を振り返るのがいいと思います。
最後に
長文になりましたが、もし最後まで読んでくださった方がいたら嬉しいです。
私の力だけでは絶対に合格できない試験でした。記載してきたコンテンツを提供してくださった皆様やXで励ましの声をくださったりアドバイスをくださった皆様のおかげだと思っております。感謝の言葉を結びに変えて締めくくろうと思います。本当にありがとうございました。
ちなみにXやっているのでよかったらフォローお願いします。
https://x.com/garigarimattyo