
私文卒でもできる統計検定準1級の勉強法
序文
統計検定準1級を取得したため、勉強法を簡単に残しておきます。
私は私文卒(数学で大学受験をしていない)で、同様の方で統計学を志す方には参考になるかもしれません。
統計検定準1級とは
内容
統計検定2級までの知識を前提として、統計学の活用力を問う試験となっている。主成分分析などの機械学習の手法も出題される。大学の専門課程1、2年生程度とされているらしい。
難易度
私文卒からだと難易度は高いと思われる。もともと1級と2級の難易度差が異様に広かったため、間を埋める形で後から創設されたものだが、それでも2級と比較すると段違い。理由は必要な数学レベルが上昇していることによるもので、2級では積分計算を手続的に理解していれば十分だったのに対して、準1級では高校3年~大学教養レベルの微積分+線形代数までの知識が無いとテキストを理解することができない。
受験方法
年間を通じて受験することができるCBT方式のため、好きなテストセンターで日時を選んで受けることができる。落ちた場合は1週間以降に再度受験できるため、統計検定センターに金を貢ぎ続ければいつかきっと合格できる。
使用したテキストやサイト
以下より私が使用したテキストを紹介する。中には別のテキストの方が良かったと感じるものもあるため注意。
統計学実践ワークブック
統計検定公式テキストで、合格には必須と思われる。以下WBと略す。
先に言っておくと、WBは学習者の理解を促すものではなく、どちらかというと、その分野を理解しているかを確認するためのテキストである。
どういうことか簡単に説明すると、少し読めばわかるが、記載が簡潔すぎるため、初めて学ぶ分野についてWBから知識を得るのが難しい。
そこで、このテキストの用途としては以下のようにするのが相当と考えられる。
WBを読んで、その章の内容を理解できるか確認する。理解できるならそのまま学習を進め、例題や章末問題を解いて終わり。理解できないなら2に進む。
その章の内容を扱っている他の参考書等を読む。
再度WBに戻り、参考書等で得た知識をもとに内容が理解できるか確認する。理解できれば例題や章末問題を解いて終わり。理解できないなら別の参考書等を探して2に戻る。
ネット上ではWBは範囲表だとか言われている。
私はWBは尺度のようなものだと思う。自分が準1級レベルに到達しているかを測るための尺度だと思えば、存外悪くないテキストだと思う。
例題や章末問題の解説も本文同様非常に簡潔であるため、ネット上には解説している有志のサイトが複数ある。「統計学実践ワークブック 〇章 解説」などと検索すれば結構出てくる。
公式問題集
これも合格には必須である。最新のものは2015~2021までの過去問を掲載している。CBT以前の過去問のため、CBT化に伴い廃止された論述問題も掲載されているが、これはやらなくても良い。
他の資格試験同様、2,3周くらいすると良い。WB同様、解説が非常に簡潔であるが、こちらもWBの問題同様に有志がネット上で解説しているため、ちゃんとした解説を求めるならGoogleで調べよう。
なお、表紙に「CBT方式試験に対応!」と書いているが、これが何のことか私はわからなかった。PBT時代の過去問しか掲載していないのだが、何をもってこのように謳っているのかさっぱりわからない。
統計学入門(東京大学出版会)
2級でもお世話になったが、準1級でもお世話になった。WB序盤の確率や分布について学ぶ上で活用した。初学者向きではないという声も聞くが、2級を取得した方であれば恐らくは読み解けるのではないかと思う。
確率統計キャンパス・ゼミ(マセマ本)
みんな大好きマセマ本の確率統計。統計学を数学から逃げずに学習する上では非常に心強い一冊。微積分の理解を前提として進むため、本の中では「難しいようであれば同じマセマ本の微積分を読むと良い」と勧められている。ただ、マセマの微積分は三角関数が多用されるが、準1級では三角関数は全く出てこないため、他の微積分は他の参考書で学ぶことも視野に入れるべきだと思う。
この本で一番良かった点は付録としてマルコフ連鎖があること。
多変量解析がわかる(涌井良幸、涌井貞美)
エクセルを使用して、回帰分析や主成分分析などを易しく解説している。この本である程度知識を得てから他の参考書又はWBを読むと理解が促進される(この本単体としては本試験に向かない)。
多変量解析法入門(永田靖、棟近雅彦)
多変量解析がわかるを読んだ後にお勧め。実際に手を動かして計算しながら勉強できるため、エクセルやPythonなどで勉強するよりも、その分析手法で何をやっているのかが理解しやすいと思う。
ただ、計算の途中式が細かく書いてあるため、後で見返すのが大変。大事そうなところにはあらかじめ付箋とかつけておこう。
時系列解析(ブログ)
時系列解析はこのブログを参考にした。解説が丁寧であるため、WBを読む前に目を通しておくと理解しやすくなると思う。
統計学の時間
知識を確認する際に便利だった。解説も初学者向けに分かりやすく書かれているが、ある程度理解が進むと少しくどく感じてしまう(わがままですね)。
試験範囲で捨てた分野について
本試験は範囲が非常に広いため、理解に時間がかかる分野は捨てるのが望ましい。そもそも範囲内の事項を全て完璧にしようとするのは不可能だし、仮に各分野についてそれぞれ90%理解してから受けようとするといつまでたっても受験できないと思われる。
実際、先駆者様のブログを見るとかなり豪快に捨てている方もいたが、無事合格しているようだった。CBT方式なら1週間後に受験できるので、問題ガチャもできる。なので、早期合格する必要があるなら理解が十分でなくとも受験してしまって良いのではないだろうか。
私が捨てた分野(WBの章)は以下のとおり。
捨てた分野(WBの章)
第7章 極限定理、漸近理論
そもそもこの内容が直接問われることはないため、試験的に重要度は低い。よって捨てた。
だが統計学としてみると非常に重要な概念なのである程度は理解しておいた(2級でも簡単にやるし)。
第8章 統計的推定の基礎
基礎感が全くない章だったと記憶している。この章の内容がズバリ直接問われることはほとんどないし、例題も本番では出なさそうなので一読しただけだった(あまり理解していない)。
第15章 確率過程の基礎
初見ではWBの説明のみで理解することが非常に困難だった。確率過程だけを扱った本はいくつかあるが、本試験レベルまで扱っているものとなると結構本格的なものを読むべきだと感じた。
確率過程自体は非常に興味があるのでしっかり勉強したいが、時間がかかるため合格後に勉強しようと思い捨てた。ただし、確率過程の中でも14章のマルコフ連鎖は非常に簡単なのでそちらは出来るようにした。
第32章 シミュレーション
一番最初のモンテカルロ法は簡単だったのでやったが、他はWBの記載では難解だったのでやらなかった。
所感
本試験は2級までの範囲からさらに先に進んだ事項や機械学習分野についても扱っている。範囲だけでみると1級よりも広い。よって、統計学を幅広く学べるところに価値があると思う。
ただ、広すぎるあまり準備に時間がかかり、暇な大学生なら別だが、社会人が現実的なペースと期間で合格するならば一部の分野についてあえて手薄にする(要するにヤマをはる)ことも求められるように思われる。
また、統計学の醍醐味はやはり実データを分析するところにあるため、あまり統計検定の勉強ばかりしていると統計学の魅力が薄れていくように思える。
それと、実際の機械学習はRやPythonで実装するものなので、合格した後はそちらの勉強も必要だと思う。今から勉強するならやはりPythonの方が良いのだろうか。
自分用メモ
得られた知見
・統計学の分野が多岐に渡ること
・興味のある分野(確率過程、時系列)を見つけたこと
・統計学には数学が必須であること(再認識)
・プログラミングができれば結果を得ることはできるが、その過程をじっくり学ぶことが重要であること
・試験的には捨てる勇気も要ること
・統計検定の公式テキストは2級に引き続いて不親切設計であること
・統計検定界隈には解説者が意外といること
今後の予定
勉強中は統計検定は準1級まででいいやと思っていたが、いざ取得するとその上を目指したくなってしまうのが人間の欲深さだろうか。
というわけで、1級取得に向けた勉強をする(記事を書いている時点でもうスタートしている)。
しかし、本業の方の研修がバカみたいに大変で休日も勉強をさせられており、あまり統計学へ時間を割くことができていない。そのため、受験は来年(例年どおりなら11月?)にする。
などと言っておきながら、Pythonを使用した勉強も始めたいところ。年末などのまとまった時間で何か1冊やろうと思う。