統計検定準1級合格体験記(後編)

前編ではテキトーに勉強方法などについて喋ったので後編では各章について見ていきたい。

(前編は私のアイコンをタッチして探してみてください)

まずワークブックの特徴を言うと
とにかく差がデカい!!!
わかりやすいところ、わかりにくいところ
長いところ、短いところ
などなど。

この本は様々な先生が書かれている。
そしてそれゆえ上記のような差に繋がり、結果ワークブックいや!となってしまう気がする。

私は知っている先生が一部書いておられるのでそこまで別に嫌!とはならなかった。

各章について

第1章

2級レベル。
強いて言うなら条件付き独立が新しいくらい。

第2章

生存関数などは後でも出てくるから飛ばしても良いと思う。
でも言っていることはそこまで難しくないので別にここでやっても良いと思う。
同時密度関数も新しいことはそこまでないかな。
そもそも定義は覚えるしかないから覚えましょう。
母関数、モーメント関数は初見では??となると思うが確率論などでも出てくるし、落ち着いて考えればそこまで難しくないはず。
(generatingを母と訳した人は天才だと思う。)
generatingであることが素晴らしい!と言うことに気付けたらオッケーだと思う。

第3章

2級レベル。
注意すべきは条件付き期待値くらい?
あとは「繰り返し期待値の法則」は「なるほど〜」くらいで思っていた。
期待値と分散の和や積について「独立」が必要か?ということには注意。
これは証明は(とても)簡単なので証明しておくと良いと思う。

第4章

まあ挫折ポイント1つ目といったところ。
やってることは難しそうだけどただの合成関数の微分。
y=g(x)を考えて、特に全単射とする。
「全単射⇔逆写像が存在」を思い出してあげて
x=g^(-1)(y)とする。
そしてd/dx(f(x))を考えれば良い。
詳しくは調べてみると良いと思う。
ただ難しいのは初見だけ!ということは覚えておいてほしい。

第5章

そこまで行間も飛んでないので躓くことはそんなにないと思う。
多項分布くんは...
あとは期待値、分散、母関数、再生性を覚える。

再生性は母関数からも自然に分かるので無理に覚える必要はないかもしれないが、、

第6章

ここもやばそうなのは初見だけ。
とりあえず平均、分散、母関数、再生性。
ガンマ関数とベータ関数は後ほど出てくるので存在だけ覚えておくと良いと思う。
余裕があれば平均も。
P44の上2つの公式は初見だと??だけど落ち着いて考えればやっていることは自然。
少し書き方が悪いくらいかな。

χ二乗、t、F分布は今度まとめるので略

とりあえず定義と平均、分散、再生性。

第7章

例によって定義は覚えるだけ。

分布収束は神ということと、中心極限定理への感謝とデルタ法がポイント。
分布収束は直感的に当たり前で、中心極限定理は2級でも出てきたもの。

デルタ法はTaylorの定理を知らなくても微分の式と似てるな〜くらいで理解できると思う。

第8章

全然基礎でないことに注意しましょう。
ここは特に言うこともないかな。
最尤法を理解しときましょう。
あとは定義だから仕方ない、、

第9章〜第12章

ほとんど2級範囲だから言うこともそこまでない。
なにがどんな分布に従うの?
↑これがポイント

第13章

覚えましょう。
最後の104,105ページはテスト前日に詰め込みました()

すべてパラメトリックだったら良いのに...と思いつつ、最近の研究ではパラメトリックのものをノンパラで検定してもそこまで精度が落ちないことが分かっている(らしい)。
その意味では今後必要になってくるのかも、、?
数学的には難しくないはずなので落ち着いて覚える。

第14章

ここも初見は文字が多くて嫌になりそうだが実はとても簡単。
問14.3を解いてから本文を見ても良いかも。
是非得点源にしたいところ。

推移確率行列については
1行目を1の位置にいる。
2行目を2の位置にいる。
...と思って。
1列目は1の位置に移る。
2列目は2の位置に移る。
と...理解すれば良い。
そうすると行の和が1になることが簡単に理解できる。
ちなみに私はこれが分からなくてとても苦労した()

第15章

えーすみません。
ろくにやってないので書けません。
定義は覚えておきましょう...

第16章

行列で書かれているだけで最初は2級レベル。

正則化についてはどっちがスパース性あるの?
ということを押さえておけば問題は解ける。
得点源にしておきたい。

第17章

ここも特に言うことはないかな、、
なるほど〜と覚えておけばとりあえずは良いと思う。
Cookの距離ってなんか良いね〜くらいに思っていた()

第18章

ここはなかなか分かりやすいと思う。
ささっと読んで問題を解いてみると理解が深まると思う。
限界効果の部分は最初読んでなかったが問18.3で出てくるので読んでおきましょう、、、

あとはeとかlogが良く出てくるのでそれが計算出来る計算機も用意しておくと良いと思う。
(本番では使えないが...)

第19章

ここは2章くらいで出てきた生存関数が出てくる。
他の方の体験記では色々な本を参考にしていた!と書いてあることが多いが私は50%くらいの理解でいいや、と割り切ってこの本だけ。
とりあえずハザード関数の定義、比例ハザードモデルは覚えておく。

第20章

すべて大切。
直交表は初見では???となって挫折するポイントだと思う。
ネットなどで調べたらわかりやすいサイトが山ほど出てくるのでそちらを参考にするのが良いと思う。
この本だけで理解するのは難しかった。

直交表は簡単に言えば、実験回数を良い感じに減らしたい!
そのための便利な道具!
とりあえずはそんな解釈で良いと思う。

第21章

まあ2級レベル。
配分法のところだけ
「へーー」と思って読んでみる感じかな。

第22章

前編でおすすめしたYouTuberさんの動画を見れば理解できるはず、、
理論を完璧に理解するのは難しいが、とりあえずなにをしているのか?と簡単に理解しておけば良いと思う。

簡単に言えば次元圧縮をしている。

例えば共テ模試でIAとIIBCの2つを受けたことを考えよう。

そうすると言うまでもなくこのデータは二次元のベクトルとなる。

さて、ここで分析者は数学の能力(のようなもの)を知りたいとしよう。

それならば二つの点数の和を考えてもそこまで情報は落ちなくね?
そんなイメージ。
こうすると1次元となるから考えやすい。

この例では2から1だったのでそんなに恩恵は無かったが、実際はこんなに小さい次元ではないはず。

あとはなんでもかんでも圧縮すれば良いわけではない。
例えばIAの点数-IIBCの点数
なんてものを考えても1次元にはなる。
でもそれって意味あるの、、?
分析者が知りたい情報を最大限残して、圧縮する!これがポイントだと思う。

寄与率や負荷量は計算出来るようにしておいた。

第23章

やってることはそこまで難しくないはず、、
何かAという群とBという群があります。
さて、今考えているこのデータはAかBのどっちに属するの?
まあそんなイメージだと思う。

でも私的にこの章は最後までめっちゃわかりやすい!とはならなかった。すみません。

P210の言葉はPCRなどについてベイズの定理を考える時にも出てくることはあるからそこまで恐れることはない。

ROC曲線は分かりやすいと思う。
(問23.3???誰ですか...)

第24章

個人的には判別と逆のイメージ。
近いものは同じだよね〜としてクラスターを作っていく。
その中で色々な取り方があるからその紹介が書いてあるのと、非階層的手法としてK-meansが載っている。
こちらはデータサイエンスの基礎の教科書などでもよく載っているから見たことがある人も多いと思う。

問24.1の2は計算がめんどいくらい、、、

第25章

前編で紹介したYouTubeを...

簡単に言えば見えない因子を考えてる(?)という感じかなと思う。

問題もそこまで難しくないはず。

第26章

捨てても良いという記事を信じて捨てました。

満点狙いor90点以上の高得点狙いの人はやりましょう。
もしくは他が苦手で、、という人も。

まあでも余裕があったら読んでおいた方がいいと思います。

第27章

毎回出る!みたいなことが書いてありましたがどうなんでしょうか。
普通に面白い分野だと思ってるので出る出ない関係なくやっておくと良いと思う。

弱定常過程、自己回帰、移動平均、DW比あたりは押さえました。
またP248の表も押さえました。
この表は自分で自己相関係数を導けるなら覚える必要はないと思うが...
DW比が先生によって定義の仕方が違う気もするがそこはどうなのだろうか、、、?

第28章

前半は分かりやすいと思う。
後半になるにつれて?の数が増えていく...

とりあえず前半について解けることが大切だと思う。
あとオッズ比ってすごい便利だな〜となれば良いと思う。そしてその区間推定などもできれば!

第29章

数学的には難しくないはず。
落ち着いて考えれば言ってることは当たり前。
後半は...

第30章

うーん覚えるだけ...
AICとBICを覚えたくらい、、、

第31章

P301以降は「なんかそんなものもあるんだなーーー」くらいでした。
逆に言えばそれより前はしっかりと押さえましょう。
特に期待値とモードは朝起きた時に出てくるようにしておくと良いと思います。
あとは事後分布がどうなるのかも答えれると良いと思う。
こちらは一度導出して友達になれば大丈夫です。

第32章

うーん、例1だけ解けるようにしよう...
まあこんな感じだった。
もちろん全て読みはしたがまあ優先順位はそんなに高くないのかなとは思った。


まとめ(?)

まあまとめというか総括というか。

全部大事なのはいうまでもないが、あえて順位をつけるなら26と32は優先順位は低いと思う。
4は捨てる人も多いと思うがちょっと待ってほしい!
確かにヤコビアンなどは意味不明かもしれないが、よく考えるとそこまで難しいことはしてないはず。
あとは15も捨てる人が多いと思うがこれはそれでも良いと思う()
ただ何度も言うが上位合格狙いならしっかりとするべき。

逆にこれはやっておいた方がいい!というのは?となりそうだが、それは上のもの以外全て。

何度も繰り返すが難しいのは初見だけ。
取り組んでいくうちになるほど!となってくる。

だから逃げずに取り組むことが合格への唯一の道だと思う。

以外はあとがきなので本文はここまでです。
ここまで本当の本当にありがとうございました!
1mmでも役に立てば幸いです。

あとがき的な

久しぶりのこのコーナー
相変わらず本文もテキトーなこと、笑

当初の目標通り4月中に合格できて良かった。
次はTOEICを頑張ろう。

さて、準1級の勉強を通じて色々な発見があった。
特にベイズ面白い!ってなったし、主成分分析あたりもなるほど!となった。

これを機にもっと勉強したいと思ったので是非1級にもチャレンジしてみたい。

で、
統計についてもさまざまな優良な有料コンテンツがあると思う。
私も調べていくうちにそういうものをたくさん見つけた。
でも前半でも書いたように私は基本ワークブックしか使っていない。
だからそのような有料コンテンツは「必要条件ではない」とだけ加えておきたい。

もちろんそのようなものを活用して合格した人もたくさんいると思うし、ある方がいいに越したことはない。
でも学生などでそこまでお金に余裕がない人でも、しっかりと勉強したらワークブックで合格出来るよ!ということは知ってもらいたい。

まあとりあえず合格出来て良かった。

いいなと思ったら応援しよう!

この記事が参加している募集