「男女の身長差」をみてみる
いまどき、「男女」という性別で何かを語るのは好ましくない。そのことを十分に承知したうえで、ただ単に「話が単純化しやすい」という理由で、これを取り上げる。男女の身長差である。
学校保健調査
文部科学省は、「学校における幼児、児童及び生徒の発育及び健康の状態を明らかにすることを目的」に、学校保健調査をしている。学校に通っていた頃、毎年4月になると、身長、体重、視力などの測定があったことを覚えておられる方も多いだろう。こうした調査の是非や必要性について、ここでは語らない。あくまで、調査された内容を使って、統計とは何かについて、ちょっとだけ話してみたい。データを見てみたいなら下記のサイトへ。
高校3年生の身長データ(架空データ)
上記サイトで公開されているのは、学年別の平均値と標準偏差である。これをもとにして、架空の「彼ら」のデータを作ってみた。
これを、高校3年生男女それぞれ25名から提供された、身長データであると考えて、「男女の身長差」という、「セカイの分断線」を見てみよう。
✔どうやってそんな架空のデータを手に入れたんだ、という疑問があるかもしれないが、それについては、我が家のExcelが私の指示に従って作成してくれた、とだけ書いておこう。
男子高校生25名とみなすデータセットは、平均値168.5、標準偏差7.6である。「彼ら」の視点だけを用いて見れば、この25人の平均身長は168.5㎝で、標準偏差は7.6㎝だ。それだけの話だ。25人の中で一番背の低い人や一番背の高い人が何㎝なのかはわかるが、それも、それだけの話だ。つまり、それらは、この25人のことだけについて言っているのであって、決してそれ以上ではない。女子高校生の方も同じだ。何㎝から何㎝の間に何人いました、一番多いのは何㎝から何㎝の間の人でした。そういうこともわかる。これもまた、この25人のことだけについて言えることだ。
では、これを使って「セカイの分断線」を見るにはどうするのか。
t検定する
架空の「彼ら」のデータを用いて、t検定という分析をする。これはExcelの「データ分析」でできるので、それを使ってみよう。結果はこうだ。
第1行目から説明しようと思うと長くなるので、一番下から2行目だけを見てみよう。「P(T<=t)両側 1.53E-05」と書いてある。で、「1.53E-05」は、「0.0000153」という小数を意味している。じゃあこの「0.0000153」は何かというと、男子高校生(上の表では変数1と書いてある)の平均身長と、女子高校生(同じく変数2)の平均身長を比べると(そして、データをくれた人数とか標準偏差とかも総合して考えると)、
「これ、たまたま差があるだけじゃん!この25人だけじゃない、日本中の高校生がいる「セカイ」では、男子も女子も、身長変わらないはず!」とか考えられる確率は、0.0000153しかないんだからね!
というような意味なのです。(noteさん、お願いだから段落の背景に色をつけさせてください。)これはつまり、日本中の高校生がいる「セカイ」にも、平均身長で比べると、男子の方が女子よりも高い、という「分断線」が、たしかにあるようだ、と分析者は考える。
ばかばかしい。
ばかばかしい。その1。
うちの親戚の高校生の子だけど、女の子の方が男の子より身長高いぞ。あんたの分析なんかでたらめだ。どうしてくれるん?
別にどうもしません。分析者が主張するのは「平均身長」の差であって、具体的な「あなた」と、別の「あなた」の身長差ではありません。分析に使ったデータには、153㎝の男子と169㎝の女子が含まれています。それでも、「平均身長」(+標準偏差)で比べると、「セカイの分断線」が見えるのです。
ばかばかしい。その2。
たった25人ずつで何がわかるん? 日本には何百万人(?知らんけど。)も高校生がいるのに、たった25人? 笑っちゃうね。
笑うのはご自由です。たった25人でかならず分断線が見えると主張しているのではありません。たった25人であっても見えてしまうほど、男女の身長差は大きいので、たまたまよく見えただけの話です。
ばかばかしい。その3。
そもそもPとかtとかどういう意味? 意味わかんない記号ならべてなんやら主張されても、それこそ意味不明なんですけどーw
そうですよねーw。
だからこれを書いているんで、続きも読んでください。Pだのtだの、意味を説明しだすと、それこそ本1冊くらい必要なので。