見える世界と見えない世界
10年以上野球をやっていた身からすると、プロスポーツ選手って本当にすごいなあと思う今日この頃です。
DeNAの笠井選手とかすごいですよね、去年ドラフトで育成1位になってから、秋の2軍選抜チームでリリーフとして活躍し、最近では育成から2軍に上がりました。
こんな風に大活躍した笠井選手ですが、早稲田大学にいた頃は、野球部ではやっていけないと感じ、なんと2日で辞めています。その後3年生になってから独立リーグの信濃グランセローズに入団し、プロ入りを果たしたわけです。
早稲田大学野球部をやめてから信濃グランセローズに入団するまでの間の2年間に何があったのだろうと思いを馳せるわけですが、世の中見える世界と見えない世界があると思うと、統計の「構成概念」の話を思い出します(変人ですね)。
完全なデータが取れない世界でどうやってデータを補うか【欠測値の取り扱い】という記事でも触れましたが、理想的なデータを得ることは理論の上ではできても、実際にはほぼ不可能です。
笠井選手の話だと、早稲田大学の野球部を2日で辞めたとか、信濃グランセローズで1年間活躍していたというようなことは、データとして得ることができますが、間の1年のデータを得ることは普通はできませんよね。(ごく近しい人ならわかるかもしれませんが)
「構成概念」というのは、そういった得られるデータも得られないデータも全部含めたもののことです。
構成概念があることで、どんなうれしいことがあるのでしょうか。。
僕が思うには、存在しないデータが存在すると仮定することで、単純すぎて、ありえない結果を説明することができると考えられます。
例えば、笠井選手は「早稲田大学の野球部を辞めた」から、「DeNAに入団できた」という風にいう人も居るかもしれません。現に、早稲田大学の野球部で活躍していたのに、2日で辞めてしまった選手がプロ野球選手になっているのですから。
しかし、これはこの2つの関係の間には、笠井選手がめちゃめちゃ練習したことや信濃グランセローズで大活躍したことなどの情報が全く入っていません。
これがもし構成概念を考えなかったら単純な例の結果が正しいと考えてしまう場合もあるかもしれませんが(ぶっちゃけこの例だとみんなおかしいとおもうよね(笑))、構成概念を考えることで、これはおかしい!背後に何か要因があるはずだ!と判断できるんだと思います。
データ分析をして何かの結果が得られたら、背後に影響を与える要因がないか考えてみると良いかもしれません。
noteに書く内容は、事前にツイートしようと思っているので、Twitterもチェックしてね~
ではまた次回!