手始めに,ダメな例を出しましょう
Cover Photo by Trym Nilsen on Unsplash
Notion サイトでも公開しています。「みんながHADを使えますように!」以下からご覧ください。いや,むしろこっちのほうが読みやすいだろうと思います。
前回の最後に,僭越ながら宿題を呈示いたしました。紙ベースでアンケートをしたとき,集まった回答をどのように Excel に入力しますか? という問題でした。
今回は,手始めに「ダメな例」を出してみましょう。
データを入力するときに,基本的には,どんな入力をしようと自由なのです。ここで言っている「ダメな例」は,あくまでも統計ソフトに入力したときに,これでは使いにくいよね,という意味で,「ダメ」だと言っているだけです。念のため付け加えると,これは個人的な考えであって,異なる考えもあるかもしれません。
入力データ再掲
どんなデータを入力しようとしているのか,2人分だけを再掲しておきます。ご自分の入力されたデータと見比べながらお読みいただくと幸いです。
1.とことんダメな例
一つ目の例は,ダメなポイントが詰め込まれた例です。**「このようにして10人分入力すると考えたとき,どこがダメか」**という視点で,ダメなポイントを見つけてください。
質問文や選択肢は一字一句正確に入力すべきか
最初に,質問文や選択肢の文字列を,一字一句正確に入力する必要があるか,について考えます。これには,2つの考え方があるように思います。
質問文や選択肢は,一字一句正確に報告するのが当然。統計ソフトでも同様だ。
統計ソフトは論文ではないので,意味が通じる範囲で省略しても良い。
1のようにする利点は,統計ソフトでグラフを作成したときに,質問文や選択肢が正しく表示されるので,あとから図表を修正する必要がないことです。2のようにする利点は,入力の手間が軽減されることです。この記事では,2の立場をとります。
また,HADでは,統計用データは極力省略して入力し,結果の図表だけは省略なしの文字列に置き換えて表示するという機能があるので,これを利用します。
ということで,なんとなく修正してみたのが次の例です。
2.やっぱりダメな例
さっきより文字量が減りましたから,入力しやすくなった気が・・・しますか?
「大阪」とか「ブラジル」とかは,これ以上省略できそうにないので,ひとまずこれで良しとしましょう。(後からダメにしますけど)
数字で尋ねているものを言葉にするのか
「お酒」に関する質問は,「大嫌い」が1,「大好き」が5で,もともと数字を選択する質問です。ですから,ここはそのまま数字を入力するのが普通ですね。
心理学で行う質問紙調査でも,ポジティブな選択肢(そう思う,あてはまる等)に5や7などの大きい数字を,ネガティブな選択肢(そう思わない,あてはまらない)に0や1などの小さい数字を割り当てるのが普通です。その方が,直観的に理解しやすいと思います。
このように,数の大きさが,何かの程度の強さを表すとき,「順序尺度である」という言い方をします。「お酒は好きですか」という設問に対する回答は,「お酒が好きな程度」を1~5の数の大きさで表していますから,これは順序尺度であると言えます。
ほかに,わかりやすい順序尺度として,成績評価(A~Eなど),スポーツなどの順位(金銀銅),劇場などの席の種類(S席,A席,…)などがあります。ほかにも探してみてください。
順序尺度と理解したほうが解釈しやすい場合がある
「シュークリーム」の設問も,同じように考えられないでしょうか。
この質問は,「大嫌い」から「大好き」のように,わかりやすい順序尺度ではありません。シュークリームを食べる頻度を順序尺度で表すなら,「よく食べる」~「全く食べない」を5~1に割り当てるのが普通でしょう。しかし,「シュークリームを知らない」と「食べない」を比べると,「食べない」人は少なくともシュークリームを知っていると考えられますから,「シュークリームを知らない」人よりも,今後シュークリームを食べる可能性が少しだけ高そうです。
このように考えて,この設問も順序尺度と解釈してみましょう。すなわち,よく食べる=5,時々食べる=4,食べるときもある=3,食べない=2,シュークリームを知らない=1,というように数値に置き換えることにします。
このような解釈は無理があるという意見もあり得ます。そもそも選択肢の置き方がよくない,という意見もあるでしょう。どのような選択肢がよいかは,質問紙を作成するうえで最後まで悩むところです。みなさんの質問紙作成の(良くない例として)参考にしてください。
3.まだまだダメな例
ここまでの修正の結果,次のようになりました。(「1人目,2人目」も,勝手に「1,2」に変えてしまいました。)これでOK,という考え方もあるでしょうが,HADを使うことを前提とするなら,まだまだ改善の余地があります。
ついさっき,「大阪」とか「ブラジル」とかは,これ以上省略できそうにないので,ひとまずこれで良しとしましょう,と書きましたが,やはり入力が面倒なことに変わりはありません。そしてさらに,覚えておいていただきたいことがあります。
HADでは,入力できるデータは,基本的に数値のみです。
いや,実際のところ,文字列も入力できるのですよ。できるのですが,数値に置き換えておいた方が,明らかに扱いやすい。これは事実です。
数を単なる記号として使う
しかし,大阪府や千葉県を数値に置き換える,といっても,どう置き換えていいのかわかりませんよね。結論からいうと,大阪府と千葉県を区別できさえすれば,どう置き換えたってかまいません。ふつうは,0と1とか,1と2とか,できるだけ簡単な数字を使います。
このように,**ある回答と別の回答が数字や記号で明確に区別できるとき,「名義尺度である」**という言い方をします。順序尺度との大きな違いは,たとえ数字で表されていても,そこで大きさの順序がないということです。「千葉県」や「大阪府」は,「都道府県」を表す名義尺度です。
たとえば,クイズ番組とかで優勝して,「3つの箱から1つだけ選んでください,中に入っているのが賞品です」みたいな場面を思い浮かべてください。3つの箱に,1・2・3という番号が付いていたとしても,1の箱がいちばんいいものが入っているなんて,誰も思いませんよね。3の箱には賞品が3つ入っているとも思いませんよね。このとき,箱についている数は,順序を表しているのでもなく,数量を表しているわけでもありません。単なる記号です。A・B・Cでも,い・ろ・はでも,何だっていいのです。たまたま数字を使っただけ。これが,「記号して数字を使う」という例です。箱につけられた数字は,箱同士を区別するための者であり,名義尺度であるといえます。
ここでは,1と2を使うことにしましょう。アンケート用紙に表示されていた順に,
「休日」設問では,千葉県=1,大阪府=2
「退職後」設問では,エジプト=1,ブラジル=2
というように置き換えることにしましょう。
4.最後にやっぱりダメなところは
ここまでで,入力するデータは次のようになりました。ずいぶんすっきりしましたね。
対応関係をまとめよう
ついでに,ここまでで行った,選択肢と数値との対応関係をまとめておきましょう。
このような対応表を作っておくことは,とても大事なことです。
余り用紙を活用して誤りを減らそう
自分が決めたことでも,日がたつと忘れてしまいます。次のように,アンケートに使った用紙の残りを利用して,「変換表」を作成しておくのも効果的です。
そして,これを見ながら,回収したアンケート用紙に,赤鉛筆などで対応する数値を書き込んでおきます。こうすれば,あとは数字を見ながら Excel に入力するだけになります。
これが賢い作業方法
まとめます。
選択肢を数値に変換するルールを考えて,この選択肢はどの数値に置き換えればいいのか考えながら,Excelに入力し,表を完成させていく。
というような複数の作業を頭のなかで完結させることは,間違いのもとです。やめましょう。
1. 選択肢から数値への変換ルールを決めて変換表をつくる
2. アンケート用紙に,変換後の数値を書き込む
3. 書き込まれた数値をみながらExcelに入力する 4. 入力されたデータを,他の人に点検してもらう
という方法が,紙ベースのアンケート回答をデータに変換するときの一般的な方法です。
ところで,どこが相変わらずダメなのか
最後に残ったダメなところ,それは,これです。
縦と横が反対です。
はあ? 何のこと?
それは次回。