【連載】アンケート調査の基礎(第9回)量的なデータ分析:比較する
金曜日は「オトナの研究」のサブテーマとして「アンケート調査の基礎」の連載をしています。定期購読者が増えるたびに、感謝を込めてその日の記事を全文公開にしています。
量的なデータ分析の第一歩として、ヒストグラムを描いて分布を確認します。そしてそれを端的に表す数値として平均(=average)と標準偏差(=stdevp)を表計算の関数で計算します。それが終わったらより詳しい分析に進みます。分析の方向には大きく分けて2つあります。それは「比較する」ことと「関係を見る」ことです。今回は比較することについて説明します。
データ分析の第一歩は分布の形を見ることと平均・標準偏差を計算することでした。しかし、平均そのものには意味がありません。ただその事実を表すだけです。たとえば、学生生活満足度の調査を実施した結果、学生の満足度は5段階評定で平均3.8だったとしましょう。これは「4=やや満足」と「3=どちらともいえない」の中間で、「やや満足」に近いところであるという事実を表しています。しかし、それ以上の解釈はできません。学生満足度を上げるためのヒントもこの数字自体からは得ることができません。
ここで満足度のデータを男性と女性という属性で分類して、それぞれの平均を出してみましょう。男性の平均が3.6、女性の平均が4.0だったとします。比較すると男性の方が満足度が低いということがわかります。この比較から、なぜ男性の満足度が低いのか、逆に女性の満足度が高いのかという原因について考察することができます。
また、性別ではなく、学生がサークルに入っているかどうかによって分類して平均値を求めることもできます。もしサークルに入っている学生の満足度の平均が、入っていない学生よりも高かったとしたら、それは「サークルに入ることの満足度への効果」として考察することができます。
このように「比較する」ということで、さまざまな推理や考察をすることができ、そこからヒントを見いだすことができます。
平均を比較するときに気をつけることがあります。それは、平均が異なっているとして、その違いは属性の違いによるものなのか、それとも誤差なのかということを判定しなければならないということです。たとえば、男性の満足度の平均が3.6、女性の平均が4.0だったときに、その違いは性別によるものなのか、それとも誤差なのかということを判定する必要があります。なぜなら、そもそもその違いが誤差であれば、性別による違いとは言えなくなってしまい、その先の議論(なぜ性別による違いが生じたのか)ができなくなってしまうからです。
このように違いが属性によるものなのか、それとも誤差なのかを判定することを「検定」と呼びます。
検定にはそのデータによっていくつかの種類があります。上に示すように、度数データについては、直接確率検定とχ2乗(カイニジョウ)検定、平均データについてはt検定(ティーケンテイ)と分散分析の4種類をマスターしておけば十分でしょう。
Excelでデータをいじりながらこれらの検定をを学ぶには次の本がお勧めです。ぜひやってみてください。
向後千春・冨永敦子『統計学がわかる』(技術評論社, 2007)
マガジン「ちはるのファーストコンタクト」をお読みいただきありがとうございます。このマガジンは毎日更新(出張時除く)の月額課金(500円)マガジンです。テーマは曜日により、(月)アドラー心理学(火)教えること(水)フリーテーマ(木)お勧めの本(金)連載記事(土)注目の記事(日)お題拝借 で書いています。ご購読いただければ嬉しいです。
ここから先は
ご愛読ありがとうございます。もしお気に召しましたらマガジン「ちはるのファーストコンタクト」をご購読ください(月500円)。また、メンバーシップではマガジン購読に加え、掲示板に短い記事を投稿していますのでお得です(月300円)。記事は一週間は全文無料公開しています。