統計のマジック:数字は中立か?
フィナンシャル・タイムズ(FT)紙のアフリカ編集長・デイヴィッド・ピリングさんによる『幻想の経済成長』に関するインタビュー記事を読みました。ピリング氏は、著書の中で「各国で取材した豊富な事例をもとに「成長至上主義」の限界を明らかにし、脱却するための道筋を示した」そうです。
日頃の報道や一般の日本人の言動から、いつも不満に思っていたことを丁寧に説明してくれている良書だと思いました。とりわけ、統計に関する以下の指摘は重要です。
統計に限らず、経済学でもその数字はどんな変数(要素)を使うか、どのように仮説を立てるかで結果が全く変わってしまう事と同じです。日本人でこれを理解できない人がかなり多いのに驚かされます。時々「僕は論文の文章なんか読まない、数字しか見ないから」という趣旨の発言をする日本人に遭遇します。
この発言をしたひとりは、シリコンバレーのIT企業に長年勤めて米国で永住権を持っている日本人男性でした。IT、シリコンバレー、英語が話せる、米国永住権と聞くと「凄い頭脳の持ち主」と思ってしまう日本人は多いと思いますが、あゆるる科学に対する敬意がないと、本当の知性は身に着きません。
これは現在利用が進んでいるAIの分野も同じです。どんな種類のデータが集められたのか、どう基準が設定されたのか、が重要なのです。例えば、日本でもAIによる採用や選考が取り入れられ始めたことが話題になっていますが、昨年AmazonはAIによる採用を取りやめています。
大きな理由の一つはAIが過去のデータに基づいて採用を行った結果、以下のように女性差別が強化されてしまったのです。
過去の採用実績が著しく差別的だったので、そのデータを使うことに弊害があったのです。「AI(データ)は中立」という一般人の思い込みが間違いであることをこの事例は思い起こさせてくれます。