統計検定1級「数理統計」 気づきメモ (2022~2019)
こんにちは.
統計検定1級に向けて数理統計の勉強をしています.
問題を解いていて重要だと思ったところを備忘録としてメモします.
問題を載せるのは著作権法違反となるため載せません.公式問題集をご購入ください.
適宜更新します.
2022年
問1
ベン図を書くべき問題.特に,
P(A∪B)=P(A)+P(B)-P(A∩B)
P(A∪B∪C)= P(A)+P(B)+P(C)-P(A∩B)-P(B∩C)-P(C∩A)+P(A∩B∩C)
に触れたことがあるかで明暗が分かれたと思う.それぞれの要素が何回足されたか,引かれたかを考える方法が好き.
こういう問題は沼る可能性があるので本番でも選びづらそう.
独立はP(A∩B)=P(A)×P(B) .「かつ」を掛け算していい.3個でも同じ
MaxとMinについてそれぞれ考える.
Minになるときは重なってる範囲が一番狭い,つまりベン図余事象の範囲が0になる,つまりP(A∪B)=1が暗に成り立つ.
与えられたフィールドを最大限活用してる状態(伝われ)
Maxになるときは重なってる範囲が一番広い.つまり完全に重なってる.3変数でも原理は2.と同じ.慌てずに解けばいける.P(A∩B∩C)をminにしたいときは
P(A∪B∪C)= P(A)+P(B)+P(C)-P(A∩B)-P(B∩C)-P(C∩A)+P(A∩B∩C)をもとに,これを移行した時のP(A∩B∩C)が最小であればいいので,P(A∩B)=P(B∩C)=P(C∩A)が最小になる.それは問2で出した.難しめ.問題集に書いてあるベン図みたいにそれぞれの要素を記入していくやり方がいいと思った.
問題文よりP(A∩B)=P(B∩C)=P(C∩A)=9/16となるので,それが成り立つようにP(A∩B∩C)=xとおいて方程式を立てて求めるやり方でやったら解けた.
問2
簡単な問題に見せかけて,私はなかなか苦手かも.後半は純粋な計算力勝負な気がして,あまり好きじゃない.
周辺累積分布関数なんて定義初めてみた.F(u,1)片側がもう全区間まで積分が終わってたらF-1(1)だからねみたいなノリでいる.初見はわからなかったので.全微分して確率密度関数求めて周辺確率密度求めて積分というごりプレイをした.
すでに確率密度関数を求めていたので余裕だった.問1でも出たけど,独立は「かつ」が掛け算.
こういうグラフィカルに解ける問題は好き.
こういうグラフィカルに解ける問題は好き.二乗の不等式は絶対値
こういうグラフィカルな問題好…とおもいきや,条件付きなので確率密度関数の値が変わっているのに気付かずに間違えた.面積が4から3になっているのでfが1/4だったのが1/3になるんよね.まぁ確率の和が1だから当然.後半は計算ごり問題なのであまり好かんが高校数学で500回やった積分で面積を求める問題的な感じだったので割と理解しやすかった.材料力学とかで断面二次モーメント求めた時もこんな感じだったかな.
問3
完答必須.馴染みやすい問題
久保川本とβが逆数の関係にあるのだけはやめてくれ.
瞬殺すべき.ポアソン分布は!が出るので階乗モーメント.
瞬殺すべき.xもしくはx^2をかけることで崩れたガンマ分布の形を補正してあげて,それが外に出ることで辻褄が合う.
計算の難度は高いが瞬殺すべき.負の二項分布になることだけはぼんやり暗記しておいて,そこに着地させていくくらいまで鍛錬できていると当日焦らないし間違いに気づきやすい.
X|λ~Po(λ) λ=Ga(α,β)から繰り返し期待値分散の公式で瞬殺.過分散の話は久保川青本P83が詳しい.
ただ過分散でモーメント法をやるだけ.瞬殺.ワークブック8章P61の問題が似てる.XとS^2でおいてαとβを求める.推定量が正となるための条件はおまけ問題.
問4
何気違和感のある計算ばかりさせてくるがまぁ易しい方の問題で完答を狙える.計算ミスをせずにできるかが鍵.
ただ微分して1を代入して描くだけ.大したことない.
けっこうきもい問題.
発散しないような定義が問題文で与えられてたりすることが多いが,これは自分でその条件を書かないといけない.まぁ問題文に「注意して」とまで書かれているので気づくだろう…セオリー通りに確率密度関数を掛け合わせて対数を取って微分して…ってかんじ.ほいほいほいっと解けるようにする.
変数変換は分布関数を書く.F(t)=P(T<t)から,T=1/γ logXを代入してXの不等式にして,見覚えのある形になったなってなる.
Σアレルギー持ちなので,書き下して考える.logX1+logX2‥と書くと,Tの形が出てきて,Tは指数分布,つまりはβがおなじのガンマ分布だから再生性が使えるねってなる.まぁiidの和だから普通に足しあげてもいいけど.再生性の方がエレガントで好き.
問5
めっちゃ苦手な問題.理解できたら書きます.
2021年
問1
簡単な問題だけど,意外と注意するべき点が多い.
瞬殺.指数分布の期待値は,ガンマ関数を使う方がエレガントで好き.
E[XY]=Cov(X,Y)+E[X]E[Y] 独立なのでCov(X,Y)=0 ただそれだけの話.
セオリー通り畳み込み.ただし.元の変数が区間を持っているので,畳み込む時に区間を気にして場合分けするのがとても厄介.積分される変数で数直線を書いて,積分区間を見るのがポイント.概形を書くために2回微分して上凸か下凸かを求めるのもちょっと厄介(センスがあればわかるだろうけど)
変数変換のセオリー,分布関数をおいてから,式変形ゴリゴリ.
逆関数が出てきてそれをゴリゴリしたらh(y)の式になって,あれ?って思ってxにした.期待値はY|X=h(X)なので, E[XY]=E[XE[Y|X]]とする(という理解で合ってるのかな?)
問2
めちゃくちゃ面白くて個人的に大好きな問題.ベイズ法の理解にめっちゃ役立つ.
超幾何分布.瞬殺.
あまり考えたことのない最尤推定の問題だったので面白かった.
x=4が決まっているまま,🫘Aの総数を変えてみるみたいな発想,誘導されていないと出てこへん.離散分布の最大値を求めさせる発想は久保川青本2章問1,2とすごく似ている.計算ゴリゴリと思いきや超幾何分布なので階乗がほとんど消えてくれるのも好き.なれていないからいつも!で書くので計算スペースが大量に必要.ひっかけ問題.初項と末項をちゃんと代入してみようとすれば101個あることに気づけるのだが,これでいいのか?と疑心暗鬼になりそう.
ベイズ法の事後分布が事前分布×尤度であることは知っていたが,こんな使い方あまりしなかったので新鮮だった.これをさらに2の式に代入するのだが.計算スペースがさらに必要
問3
あんまりよくわかっていない.
ただのPoのモーメント母関数なので瞬殺しよう.
瞬殺できる問題セット.再生性と,FN分解定理と,対数尤度の微分でおしまい.
以降あんまりよくわかっていない.解説見ればわかるけど,狐につままれた気分.
問4
難問かつ超良問.Σアレルギーなのでこういう問題はなかなか厳しいが本番で選ばざるを得なくなったら頑張って食らいついていきたい.
当たり前のように瞬殺.
解説にはうんやかんや書いてあるけど,ここでY=X-μを定義してしまってY1-Y2としておいてしまって,それぞれモーメント考える方が好きかも.
ちょっと悩むけどあんまり時間をかけるべきではない問題.答えが0,0と続くところに,本当にこれでいいのか不安になる.
すごい問題.
・最初Σで複雑なので1つのものについて考えてそれをn倍すること
・平均μを引いたYで考えること.
・Yの平均をΣを使って表して,ダブるものが現れたらその数だけ高次のものにすること(伝われ)
どれをとってもめっちゃ大事.普通に難しいので,優秀賞かどうかの境目問題かな?解説で左の方が3次のΣになってて,右の方がΣの2条になっている理由がわからないので誰か教えてください.
問5
解説見たらわかるけど…となる.どうしても線形代数が絡むところは手薄になりがちかつこの問題は簡単な問題だったので,めちゃくちゃここで差がつきそう.
V[y]=V[Lx]=E[Lx(Lx)t]=LE[xxt]Lt XはN(0,1)なのでE[xxt]は単位行列.
ただそれを知ってるかってだけの話.これも,分散の定義を知っていれば共分散の定義はなんとなく
E[Lx(Mx)t]かなっていうのが想像つくこれも行列の処理ができるかってだけ.
これも行列の処理ができて,スペクトル分解を知ってるかってだけ.私は勉強不足なのであまり知らずに,この問題で理解しました.
2019年
問1
誘導通り解いていけば困ることはないので完答できたい.
確率母関数の定義とその使い方を聞かれてるだけなので困ることはない.
階乗モーメントになることだけは忘れない.二項分布は二項定理からG(x)を出す.それぞれnp,np(1-p)になることは知っているので,そこに着地するように落ち着いて式変形するだけ.
ヒントがあるので易しくなっている.ヒントの通り書いてあげて,マルコフの定理チックな形で変数を変数の下限値で置き換えてあげるだけ.
これも誘導があるので簡単になっている.r=anを早いうちに代入しないと計算が泥沼になってしまう.(なってしまった.)
問2
なんかよくわからんけど誘導に乗っていくだけで解けた.なんだこれは.
期待値は足していい.っていうだけ.瞬殺.
解説みたいに畳み込んでもいいけどこんなん指数分布がガンマ分布であることを利用して再生性を使うことで瞬殺できる.
ガンマ分布の逆数?なんぞや?てなり面食らうかもしれないけど期待値を聞かれているだけなので1/uをかけたもので積分すればおk.楽勝.
??ってなりがちだけど,聞かれているのは与えられた式の期待値だけなので,率直に期待値を計算して(確率変数のところは今まで解いてきた問題の答えを使う)あげるだけでOK.θ=1/λを忘れず代入する.最後のαも微分するだけ.
問3
最後のあたりの滑らかな関数のところは難しいけど,それ以前はできたい.
一様分布の十分統計量は一癖あるやつ.セオリー通りやっちゃいけず,尤度関数に指示関数Iを使って全てのxがθ以下になるのは一番大きいxがθ以下になるのと同義だよねってだけの話.
順序統計量は久保川本の解説が神. X=xがf(x)で1個 X<x がF(x)でn-1個の二項分布の問題に帰着できる.ただそれだけ.
X1…Xnは順序ではないのでそこで間違えた.
Yの確率密度関数が示されているので期待値の定義に則って積分するだけ.Yをつかって不偏推定量にするのは久保川本で演習を積んでいれば余裕.E[Y]=Yとおいて,E[θ^]-θ=0となるようなθ^をYを使って表すお決まり.
まぁなんかようわからん
まぁなんかようわからん
問4
良問.ネイマンピアソンの補題や尤度比についてあんまりイメージ湧いてなかったけどこの問題で理解できた気になっている.コーシー分布は期待値がなかったりなど異端児みたいなイメージがあるけど,この問題で仲良くなれた気がする.
x=tanθとおくのは高校数学で50000000回やらされるお決まりのパターン.Tan-1 (1)は45度をとる時だから,π/4 これも忘れずに.
2と似ている.結局帰無仮説か対立仮説かが違うだけで,棄却域の中に入る割合を求めているだけ.解説は(x-1)でやっているが,図を書けば軸を取り直して0から2で積分した方がいいのは火を見るよりも明らか.
誘導通り尤度比をとって,増減表を書いて概形を書けばOK.
二次方程式の解の公式が出てくるけど高校の頃を思い出して落ち着いて解く.また,上極限下極限がいずれも1に収束しているがこれはどっちも同じコーシー分布で裾が長いところに収束しているから尤度比が1になるのね,と考えるとスッと腑に落ちた.ネイマンピアソンの補題ってつまりはこーいうことか〜ってなった.尤度比をy軸に垂直な線で切ってあげるイメージ.
問5
難しくて問1しかまだ解いてない.
以上!
この記事が気に入ったらサポートをしてみませんか?