キャプチャ

[LibreOffice]ノンパラメトリック検定の多重比較

スティール・ドゥワス法

Tukey法はパラメトリック検定で一般的に用いられる多重比較の方法ですが、ノンパラメトリック検定において、これと同等の処理を行う方法が、スティール・ドゥワス(Steel-Dwass)法です。
比較する群を第i群と第j群(ただし、i<j)とした場合、手順は以下の通りになり、これをすべての組み合わせについて行います。

LibreOfficeで求める

それでは、LibreOfficeCalcを用いて、スティール・ドゥワス法の多重比較を行ってみたいと思います。
データは、永田均・吉田道弘(1997)『統計的多重比較法の基礎』(サイエンティスト社)の(例題5.3)を用います。

上のデータを、右のようにLibreOfficeCalcのシートに貼り付けます。

データを算出するための枠を、次ののように作成します。

これは、組み合わせ1つ分で、後でコピーして残りの分を作成します。

まず、グループ1とグループ2を比較するので、[F2]セルに「1」、[G2]セルに「2」と入力します。これは、先ほど貼り付けたデータの左側からの番号です。必ず左側の入力欄「group I」の方を小さい数字にしてください。
そして、 [F8]セル(F列の「score」の下)に、

=IF(INDEX($A$2:$D$12,E8,F$2)="","",INDEX($A$2:$D$12,E8,F$2))

[G8]セル(G列の「score」の下)に、

=IF(INDEX($A$2:$D$12,E8,G$2)="","",INDEX($A$2:$D$12,E8,G$2))

と入力します。
これを、18行目(E列に「11」が入っている行)までコピーします。

これによって、[F2][G2]に入力したグループの値を引っ張ってきます。そして、この値を用いて、必要な値を算出していきます。
では、順位を求めます。
[H8]セルに、

=IF(F8="","",RANK.AVG(F8,F$8:G$18,1))

[I8]セルに、

=IF(G8="","",RANK.AVG(G8,F$8:G$18,1)) 

と入力し、18行目(E列に「11」が入っている行)までコピーします。

「RANK.AVG」は平均順位を算出する関数で、引数の最後の「1」は昇順の指定です。
ついで、サンプルサイズを計算します。この程度だと数えても大丈夫ですが、後の作業を自動化するために、関数で求めます。
[F4]セルに、

=COUNT(F8:F18)

と入力して、[G4]セルにはそれをコピーします。
次に順位和を求めます。
[H2]セルに、

=SUM(H8:H18)

と入力して、[I2]セルにはそれをコピーします。


また、順位の2乗和も必要です。J列とK列を使って、順位の2乗の値を計算しておき、それを使って計算します。
[J8]セルに、

=IF(H8="","",H8^2)

と入力し、[K18]セルまでそれをコピーします。
そして、[H4]セルに、

=SUM(J8:J18)

と入力し、それを[K2]セルにコピーします。


では、いよいよ統計量を求めるための本格的な計算に入っていきます。
期待値Eを求めるために、[F6]セルに、

=(F4*(F4+G4)+1))/2

と入力します。「F4+G4」は総サンプルサイズを計算しているので、「sum」関数を用いてもかまいませんが、長くなるので、この方がよいでしょう。また、どこかのセルに計算しておくのも1つの手です。
分散Vを求めるために、[G6]セルに、

=((F4*G4)/((F4+G4)*((F4+G4)-1)))*((H4+I4)-(((F4+G4)*((F4+G4)+1)^2)/4))

と入力します。
検定量tは、検定の際に絶対値を用いるので、この段階で絶対値にして計算しておきます。
[H6]セルに、

=ABS((H2-F6)/SQRT(G6))


この段階で、データを使って計算できる値はすべて求め終わりました。
最後は、群数から自由度∞の時のスチューデント化された範囲の値qを先ほどの表から求めます。もう一度、確認しておきましょう。

ただ、比べるのは√2で割った値なので、[I6]セルには割った値を入力することにします。値は4群で5%水準の場合、「3.63」なので、
[I6]セルに、

=3.63/SQRT(2)

と入力します。

この場合は、2.57となります。
tの絶対値が2.57より大きい場合、差があるという判断になります。ここでは、2.68>2.57ですから、グループ1とグループ2の間には差があると言えます。
このあと、E列からK列までをコピーして、L列からに貼り付け、[N2]セルを「3」に変えれば、グループ1とグループ3の比較を行うことができます。


以下、コピーとグループの変更を行うことで、すべての比較を行うことができます。
そのようにして、検定量tの絶対値を求めると、
  グループ1-グループ3:2.54
  グループ1-グループ4:1.28
  グループ2-グループ3:3.75
  グループ2-グループ4:2.05
  グループ3-グループ4:3.38
となります。

よって、差があるのは、グループ1とグループ2、グループ2-グループ3、グループ3-グループ4の3つの組み合わせと判断できます。

念のため、永田均・吉田道弘(1997)『統計的多重比較法の基礎』(サイエンティスト社)の値と比較しておきます。

ほぼ一致しています。

いいなと思ったら応援しよう!