手段の目的化と過学習

2023年1月3日 16:57

面白い記事を見つけました。

統計やデータサイエンスの分野では有名な過学習(overfitting)が、社会全体で起きているという主張について書かれた記事です。
私はデータサイエンスや統計の専門家ではありませんが、私なりに理解した形でまとめてみます。

【過学習とは】

ある予測モデルを作成する際に起きる問題で、学習データ内で起きていることをよく再現できることに特化しすぎて、学習データの範囲外で起きていることへの予測性能が落ちることです。
例えば、生年月日と身長の関係をモデル化するとします。これは、生年月日を入力すると身長が予測値として出てくるモデルです。

ある小学校の児童の生年月日と身長のデータを使って、この小学校の生徒の身長を1mmの誤差もなく予測する高精度なモデルができました。しかし、このモデルを使っても他の小学校の生徒の身長をうまく予測できませんでした。また隣の中学校の生徒の身長を予測しようと思っても予測できませんでした。

それは、学習データである小学校のみで適用可能な高精度モデルを作ることに専念してしまったために、それ以外のデータに適用した時に予測できなくなってしまったのです。これが過学習の例です。

【プロキシとは】

プロキシとは元々は“代理”という意味ですが、ここではモデル化する時に本来の目標の代わりに設定する「代理目標」となります。

つまり上記の場合は以下のようになります。

目標: 生年月日から身長を予測するモデル
プロキシ: ある小学校で生年月日から身長を予測するモデル

【過学習で起きたこと】

本来の目的のために、プロキシを設定しモデルを作っていたにも関わらず、プロキシに最適化されたモデルができてしまったため、本来の目的にはそぐわなくなってしまった。
そういう解釈ができると思います。

実際に以下のような事例が記事の中で紹介されています。

ゴール：子どもたちをよりよく教育する
プロキシ：標準化されたテストによる成績測定
結果：学校はテストで測りたい基礎的な学問スキルの教育を犠牲にして、「テストに正しく答えるスキル」の教育を進める

ゴール：科学の進歩
プロキシ：科学論文の出版に対してボーナスを支払う
結果：不正確または微妙な成果の公開、査読者と著者の共謀が広まる

ゴール：よい生活
プロキシ：脳内の報酬経路の最大化
結果：薬物やギャンブル中毒になったり、Twitterに時間を費やしたりする

ゴール：国民の利益のために行動するリーダーの選出
プロキシ：投票で最も支持されるリーダーの選出
結果：世論操作のうまいリーダーの選出

ゴール：社会のニーズに基づく労働力と資源の分配
プロキシ：資本主義
結果：貧富の格差の増大

GIGAZINE記事より出展

【グッドハートの法則】

上記は色々な組織や社会の中で起きていることに似ていますね。「手段が目的化する」ということです。このことについて、記事内ではこのように書かれています。

“Sohl-Dickstein氏は機械学習における過学習について、グッドハートの法則との類似性を指摘します。グッドハートの法則とは「成果を測るための尺度が目標になってしまうと、成果測定自体が役に立たなくなる」という現象のことであり、提唱したイギリスの経済学者チャールズ・グッドハート氏にちなんで名付けられました。グッドハートの法則は金融政策の文脈で提案されたものですが、Sohl-Dickstein氏はこれが過学習にも当てはまると考えています。”