(10):要するに参加者は何人か。それが「行数」だ。

HADを使いましょう

「心理学統計法」の試験問題で、ある意味で、もっともこの科目らしい問題です。分散分析のF値(近似値)を、選択肢から選ぶ問題なのですが、数値を電卓で計算してそこにたどり着くのはけっこう大変です。できないわけではありません。電卓でもやろうと思えばできるんです。ただ、それなりに面倒だからやりたくないだけです。

だったらExcelでもいいんでしょ? という感じもしますが、だめです。いえ、「対応のない」場合はできるんですが、「対応のある」場合ができないんです。だからといって、「対応ありの問題出さないで~」とか言えないでしょ。だから、おとなしくHADを使いましょう。あ、RでもOKですよ。

データを入れましょう

では、HADを開いて、〔データ〕シートにデータを入れましょう。特に間違えやすいポイントが2つありますね。教科書を学習しながらHADを使ってきた方にはおなじみのポイントですね。

B列にIDが必要ですよ?

これはHADの仕様ですね。とりあえず1から始まる連番(1,2,3,…)を入力しておけば何の問題もないです。この連番は分析の対象になりません。が、B列に「分析したい」データを入れてしまうと、うまくいきませんね。使い始めの頃、何度か失敗した方もおられるでしょう。

参加人数とIDが一致してますか?

ここで参加人数とは、分散分析のデータをとったときの実験に参加した人数のことです。12人が参加したなら、12人分のデータがあるので、IDは12まであるはずです。わかりますよね?

ピンとこない人のために

(数字はきわめて適当なので、1ミリも気にしてはいけません!)

3種類のつゆの味の好みを評価してもらいました。これ、何人分のデータでしょう。

  • 12人分のデータ、と考えられます。たとえば、黄色いセルに入っている「2」は、ある一人の参加者が、たまたま「つゆA」を味見する調査に参加して、味の好みは「2」と評価したのです。

  • 4人分のデータ、と考えられます。たとえば、緑色のセルに入っている「4,6,8」というデータは、一人の参加者が、「つゆA、B、C」の3種類をそれぞれ味見する調査に参加して、それぞれ味の好みを「4,6,8」と評価したのです。

「間」か「内」か

どっちやねん! と怒ってはいけません。このデータだけでは、はっきり区別できません。はっきり区別させるために、たとえば次のような説明が、問題に付け加えられると想定されます。

  • 「参加者計画」:これだと、12人のデータだという意味になります。「つゆA」と「つゆB」と「つゆC」は、参加者の「間」で異なっている、すなわち、別々の参加者が別々のつゆを評価しているということです。

  • 「参加者計画」:これだと、4人分のデータだという意味になります。「つゆA」と「つゆB」と「つゆC」は、参加者の「内」で異なっているのであって、同じ人が3種類の味を比べているということです。

実際には、どちらも明記されていない問題もあり、それはおそらく「参加者間計画」として出題されたのだろうと推測します。また、「つゆA」のさらに左側に、参加者番号が「1~4」まで示されていて、参加者が4人である、つまり「参加者間計画」ことが示されていたものもありました。

データ入力はこうする

では、実際のデータ入力はどうするかというと、こうします。参加者内計画(参加者4人)は簡単です。示された表の形式そのまま入力すればOK。

参加者計画のときのデータ入力

参加者間計画(参加者12人)は次のようにします。これで、12人になりました。

参加者計画のときのデータ入力

こうやってデータを入力して比べてみると、実験のしかたが明らかに異なることがよく見えてきますね。例示したような「味の評価」の場合、3つのつゆの味が混ざってしまわないように(前に試食したものに引きずられないように)留意しながら、味見の順番をランダムにして、しかも、味見しているのがAなのかBなのかCなのかも見せないようにして実施することが多いかもしれません。こうすると、「味の好み」という無限に存在するかもしれない個人差を、かなりの程度、分析から除外することができるからです。結果として、つゆの味の差だけが、評価値の差として抽出されることになります。ま、そう簡単にはいかないことも多いんでしょうけど。

今回はかなりまともに、HADの使い方まで書いてしまいました。ほとんど解答を示しているようにも思いますが、大丈夫かな。