社会科学系の分析と結果の寄与度
社会科学系の分析って難しそう。
要因が100とかあって、どの要因が結果に及ぼしているかを見抜かなければならない。
同じデータを見ても、様々な意見が出てくるため、結局どれが正解かわからない。それはそれでエンタメとしては面白いのだが。
多くの可能性があるがゆえに、的外れな解答や憶測も入ってきてしまう。「それってあなたの感想ですよね?」という理由も少なくない。
自然科学はここの分析の正確さで発展してきたともいえる。
データ分析、モデル化によって考えられる要因を絞ることが必要。また、出てきた結果から構造を探るアプローチとは逆に、構造を分析してそこから起こりうる結果を予想することで説明が正確になるかもしれない。シミュレーションの手法も確立する必要がある。
そして要因特定を困難にするのが、それぞれの要因の、結果に対する寄与度である。
例えば、ある現象が起きた要因としてA~Dが考えられるとする。この時点で可能性としてはA~DであってFやKではないと決められなければならない。ここで要因を絞ることができるが、「原因はAである」「Cが原因で間違いない」と言い合うと議論が進まない。たぶんみんな合っている。ただし、それぞれの寄与度が違うことを留意しなければならない。Aは50%でBは5%のように。
経済成長率の要因とその寄与度のようなデータがあるが、あれを他のところでも応用できないだろうか。
この寄与度を見つけることは非常に難しいと思う。一つの指標でも多くの数値データを必要とする。数値化できないものはさらに困難だ。
とはいえ、寄与度が特定できれば対策もしやすい。政策の費用対効果なども算出しやすくなるだろう。良いことは多いはずだ。
以上がデータサイエンスを知らない一般人の戯言である。