現役データサイエンティストが伝授!統計検定準1級取得への道
こんにちは。株式会社D4cプレミアムでデータサイエンティストをしている新卒2年目社員の三田村です。
私は「統計検定準1級」に挑戦し、1 度目はCBT(Computer Based Testing)試験で不合格となりましたが、再度1ヶ月学習して2022年3月に合格することができました。かなり苦労して学習に取り組みましたので、これから受験予定の方には私よりも効率的に合格していただきたいと思い、記事を執筆しております。
この記事のターゲット
執筆者について
バックグラウンド
某国立大学の材料系の研究室に所属していました。修士卒です。 学部生、院生の頃に教養で微分積分・線形代数・ベクトルなどを軽く学んでいました。
学生時代に統計の授業を受講してはなかったのですが、友人と1ヶ月くらいこちらの本(統計学演習)を輪読して いましたので、当時2級レベルはあったかもしれません。(今思うと2級から受験した方が良かったと思うため、皆様には2級から受験されることをお勧めします!)
学習開始時のレベル
学習開始時は研究や業務で一切統計検定をした経験はなく、平均の差の検定・カイ二乗検定・線形回帰の演習 問題をギリギリ解けるが、ほとんど理論を理解していないというレベルでした。
多変量解析・ベイズ統計学・実験計画法・時系列分析はほぼ初学者でしたが、一方で数値最適化やニューラル ネットワーク実装した論文を学生時代に執筆したため、データサイエンス初心者ではありませんでした。
受験のモチベーション
受験を決めた理由は以下です。
当時医療データの分析を行うプロジェクトにアサインされていたが、業務で使用できるほどの統計の知識が少なかったので、これを補うため。
理論レベルでしっかりデータサイエンスを理解できる人材であることの証明の1つにしたい。
統計、機械学習の知識を広く獲得するため。(統計検定とありますが、古典的な機械学習のほとんど範囲に入っています。)
会社での評価をあげるため(←コレも重要)
新米データサイエンティストが統計検定準1級を受験してみて
受験した感想として、挑戦して本当によかったと思っています。データサイエンティストとしてはまだまだ新米ですが、自分の統計や機械学習に関する発言に対して自信が付きました。
ちょうど業務で行っていた医療データの分析手法のキャッチアップも兼ねて、一石二鳥の学習となりました。具体的には、オッズ比・リスク比・ロジスティック回帰・クラメール連関係数・カイ二乗検定という準1級で初めて学習したものを、実際に案件でたくさん使用しました。試験対策をしていなかった場合は、これらの手法があるという発想には絶対にならなかったはずです。
準1級の試験範囲を確認された方は分かると思うのですが、範囲が膨大で内容もかなり難しいです。合格するためにはこれらの大部分を理解する必要があるので、計画力と実行力が非常に重要です。
将来的にどのような人材となりたいかによって変わると思うのですが、広くそれなりに深く統計・機械学習を学習しどんな案件でも通用する人材を目指すとしたら、とても良い試験になると思っています。
当時は、受験費用を節約するために2級をスキップしましたが、受験した方が良かったと思っています。電卓の使い方や本番のPCの操作にあまり慣れていなかったため、1回目の受験では全然時間が足りなくなりました。
2級と比較すると段違いで学習コストが大きくなるため、2級を受験してテスト慣れしていた方が、過度なプレッシャーを感じなかったかもしれません。(初めての受験時には、受験1週間前からドキドキしていました。)
合格のためのノウハウ
1、 回により難易度が異なるため、複数回受験して比較的簡単な回を狙う!
準1級のCBT資格を2回受験したのですが、1回目と2回目で体感的に全く難易度が異なりました。
過去問を見ていただくと分かる通り、2021年6月のPBT(Paper Based Testing)資格は鬼のように難しいですが、1回目に受けたCBT試験はこれと匹敵する難易度でした。しかし2回目に受けたCBT試験は、1回目と比較して難易度が下がっていました。そのため複数回受験して、少し簡単な回を狙うという手段もありますので、一度不合格となっても私のように再挑戦されることをおすすめします!
2、試験会場が非常に少ないため事前の確認が必要!
会場が少なく、試験会場を探すのに非常に苦労しました。私が知る範囲で、こちらの2つは試験会場となっています。
1、東京パソコンアカデミー
2、オデッセイ テスティング センター
3、電卓の効率的な使い方をマスターする。
皆様は電卓で分散やカイ二乗検定の計算をする際に、どのように計算されますでしょうか?このような面倒な計算を楽に行うことができるのが、メモリキーです。こちらを使うと使わないのとでは、全く解くスピードが変わるので必ずマスターしましょう!
私はCASIOのこちらの電卓(JF-120GT)を購入したので、まずはCASIOのYoutubeチャンネルの電卓の使用方法の動画を確認して、そのあとはこちらのYoutubeチャンネルにて使用方法を学びました。その後はひたすら過去問と演習を、電卓を用いて解きました。大体、慣れるのに1ヶ月くらいは掛かるかもしれません。
学習方法
1、学習期間・時間
途中で期間が空いてしまったため、合計約6か月かかりました(学習期間は2021年5月~6月と2021年12月~2022年3月)。250時間ほどで1度目の試験を受けて不合格となったのですが、そのあと重点的に50時間ほど学習し、晴れて合格となりました。そのため合計学習時間は約300時間でした。
2、環境作り
社会人の資格勉強は本当に大変だと思うのですが、中でも強い覚悟が必要なテストのため、環境作りがとにかく大事です!範囲が広すぎますし、学習をしていて全然分からない箇所もたくさん出てきて、すぐに挫折しそうになります。(私は1度挫折しました。) そこで私の実際に意識した環境作りをシェアしたいと思います。
社内勉強会
まず仲の良い会社の同僚4人組で、Slackのワークスペースを開設して、統計検定準1級学習チャンネルを作成しました。そのグループの方々と毎週1回統計実践ワークブックという公認の準1級の参考書を使用して学習しました。
全部で32章ととても多いため、「全員が学習したい1つの章について、1人が1週間でその1章を本気で読み込み、同時に他の3人は軽く読み込み、1週間後に本気で読み解いた1人が他の3人に教える」 という学習方法を取り入れていました。
統計実践ワークブックは、1章1章が非常に重たいです。それを全て1人で解読するよりも、4人で分担して解読し、各分野のエキスパートとなって教えあうと楽だよね!という発想からこの学習方法に至りました。
他人に教えられるレベルになることで、本当に自分の身になっている感覚がありましたので、この学習方法は準1級の学習で特におすすめです!
都立図書館
準1級を学習するにあたって、範囲が広いためどうしてもすぐに忘れる内容もあります。そこで忘却するスピードよりも吸収のスピードを高める必要があり、なるべく短期間で学習を終わらせるために、週末だけでなく平日も学習をしていました。
準1級の学習時間を多く確保するために試験直前では業務をできる限り集中して早く終わらせ、平日19~21時頃まで都立図書館にこもりました。
3、使用した教材とそれぞれの対策時間
※学習順
合計約300時間
最後に
今回は、私の経験を元に統計検定準1級の学習方法・勉強時間・会場・教材をまとめてみました。
私はこの学習経験からデータサイエンティストとして、大きく成長できたと感じておりますので、この領域に興味がある方にはとてもおすすめできる試験です!
この記事が1人でも多くの方の合格の手助けになりましたら幸いです。
(執筆:三田村)
少しでもお役に立てましたら♡を押していただけると励みになります!
▼コーポレートサイトはこちら
▼新卒採用はこちら
▼キャリア採用はこちら