水着の種類によって速度は変わるか? ~スチューデントのt検定以外の3種類のt検定を適用~
t検定には4種類(他の記事では3種類としていますが、左端の「1標本t検定」を除いて数えると3種類)あり、そのうち2種類には上記のごとく「○○専用」となっています。ステューデントのt検定は分散が等しい場合専用検定、対応のあるt検定はデータ数が同じ場合専用検定です。しかし、ステューデントのt検定は利便性が低いと思った英国人は、これを改良し、ウェルチのt検定と命名しました。
もちろん、ウェルチのt検定には上記のような「○○専用検定」は設定されていません。
今回の検定では、データ数が同じである2つのデータ(競泳水着、ジェンダーレス水着、による記録それぞれ30個ずつ)用意し、これを
・1標本t検定にそれぞれ(競泳水着、ジェンダーレス水着)あてはめて平均値(とその信頼区間)を求め、有意差の有無を検定
・対応のあるデータとみなし、対応のあるt検定にあてはめて有意差の有無を検定
・対応のないデータとみなし、ウェルチのt検定に当てはめて有意差の有無を検定
することとします。両データは分散が等しいかどうか不明であり、分散を等しくするために操作することもできないため、スチューデントのt検定は行いません。
上記では「30個ずつ」と書きましたが、これは、ウェルチのt検定といえども正規分布でなければならないところ、サンプルサイズが十分大きいときは正規分布でなくても良い(参考:https://istat.co.jp/sk_commentary/t-test/WelchsTest)ことによります。
t推定
t検定:お題「XXの平均はYYか?」→NO or NOとはいえない のいずれか
t推定:お題「XXの平均は何か?」→信頼区間はY1~Y2間
t検定とt推定は、このような違いがあります(上記は、お題が平均である場合)。
(参考:https://istat.co.jp/sk_commentary/estimation/EPmean、https://istat.co.jp/sk_commentary/statistical_test/test)
母平均の推定にはz推定もありますが、z推定は「母集団が正規分布である分布専用」or「母標準偏差がわかっているとき専用」であるため、ここではz推定を扱わず、t推定のみを扱います。なお、母集団が正規分布かどうか及び母標準偏差が不明であってもよいものの、標本数は30以上必要となります。
t推定では母集団の数(N)・サンプル数(n)・標本平均(μ)・標本標準偏差(σ)によって信頼区間が変わりますが、数値の増減によって、下記の通り変化します。
母集団の数:増えると、信頼区間は広くなる
サンプル数:増えると、信頼区間は狭くなる
標本平均:増減により、信頼区間は変化しない
標本標準偏差:増えると、信頼区間は広くなる
標本平均と標本標準偏差は操作しようがありませんが、サンプル数は操作しようがあり、信頼区間は狭い方が良いので、サンプル数を増やせば増やすこと、正確に近い結果が得られることになります。サンプル数が変わらない場合、母集団の数が少なければ少ないほど、信頼区間は狭くなります。つまり「母集団の数は不明だが2万以下」という状況で(母集団の数を2万とみなして)標本調査をしてから信頼区間の幅が50であると算定された場合、標本調査の過程で「実は母集団の数は8000である」ことが発覚すれば、実際には信頼区間が50より狭くなります。
競泳水着とジェンダーレス水着から複数個(データ数は異なる)のデータ(平均速度。単位はmm/s)が得られたため、そのうち30個ずつ無作為抽出し、その標本平均と標本標準偏差が得られた。
対応のあるt検定ができるか?
今回のデータはいずれ(競泳水着、ジェンダーレス水着)ともデータの数が30個以上で個数が異なるため、30個ずつ無作為抽出したものを組み合わせて対応のあるt検定ができるのではと思われますが、30個ずつ無作為抽出したものをどのように組み合わせるかによってデータが変動してしまいます。この組み合わせ方もランダムになっているため、30個ずつデータを組み合わせることができたとしても、対応のあるt検定とはいえません。
よって、このデータは対応のあるt検定を行わない(行えない)こととします。
1標本t検定
参考:https://istat.co.jp/sk_commentary/t-test/onet-tset
1標本t検定では、母平均が別途定めた数値と異なるかどうかを判定します。上記参考サイトの例では、28000と異なるor高いor低いかどうかを判定しています。これとは別に、この記事の作者は上記サイトの例について、異なるor高いor低いかどうかが切り替わる境目を計算し、下記の結果を得ました。
<左側検定>
母平均が○○より低いといえない→○○が36556以下の場合
母平均が○○より低い→○○が36557以上の場合
<両側検定>
母平均が○○と異なる→○○が28737以下の場合
母平均が○○と異なる→○○が28738以上33000以下の場合
計算不能(#NUM!)→○○が33001以上の場合
<右側検定>
母平均が○○より高い→○○が29443以下の場合
母平均が○○より高いといえない→○○が29444以上の場合
競泳水着とジェンダーレス水着について、標本平均、標本標準偏差などは下表のとおりです(標本平均、標本標準偏差ともに単位はmm/s)。
ここでは、比較値を600~900間の整数とし、それぞれの数と異なるor高いor低いかどうかを判定します。その結果は下記の通りです。
<競泳水着>
母平均が○○より低いといえない→○○が762以下の場合
母平均が○○より異なるといえない→○○が717以上741以下の場合
母平均が○○より高いといえない→○○が722以上の場合
<ジェンダーレス水着>
母平均が○○より低いといえない→○○が706以下の場合
母平均が○○より異なるといえない→○○が678以上693以下の場合
母平均が○○より高いといえない→○○が722以上の場合
ウェルチのt検定
now writing…