工学部の教育で叩き込まれたこと:誤差、理論と結果
工学部の教育で叩き込まれたことが2つある。
第一は、誤差と言う概念だ。
計算尺で計算していれば、桁を揃えなければならないことは、自然に覚える。計算尺では3桁程度しか扱えないので、5桁も6桁もあるデータがあっても意味がない。
大蔵省に入った時、法学部出身の人たちがこの概念をもっていないことに驚いた。法律では、現実には起こりえないことであっても(つまり確率が非常に低いことでも)、多大の関心をもって議論する. それもやむを得ない。
予算書がどこか1つの数字が間違っていれば国会は通らないのだから。
「正確に間違えるよりはおよそ正しいほうがいい」
これは、ケインズの言葉。ケインズは、もともとは経済学者ではなく統計学者だったので誤差の概念を認識していたようだ。
誤差の考え方は、情報がデジタル化することによって弱まってきたように思う。コンピュータでは、何桁のデータであっても同じように扱えるからだ。
モデルより結果が重要
工学部では理論より結果が重要だ。
理論がいくら美しくても、飛ばない飛行機では意味がない。
これは明らかだが、飛行機がなぜ飛ぶかわからなくてもいいのだろうか?これは難しい問題だ。
大学を卒業してから経済学を学んだのだが、経済学では、モデルや理論の方が実際よりも重要だと考えている場合がある。
「経済学ではこうだ」と言う人がいる。こういうことを言う人は、実際のデータより理論の方が重要だと考えている。
経済学の教育でたたき込まれたことは、「理論のないデータは屑」「モデルなしにいくら回帰分析を行なっても無意味」ということだ。
データサイエンスでは?
ビッグデータが用いられるようになって、モデルよりデータが重要になってきている。
データを説明できない理論は無意味。それに対して、モデルがはっきりしなくとも、結果を説明できればよい。
ディープラーニングを用いるニューラルネットワークでは、この傾向がとに顕著だ。
では、理論は死んだのか?
そうも言えない。機械学習では過学習の問題がある。これを避けるには、対象についてのモデルを持っていることが重要だ。
モデル(理論)が重要なのか、データ(結果)が重要なのか?この問題はまだ決着がついていないと思う。