見出し画像

AIのジレンマ ~政治、プライバシー、そして予測~

19,768 文字

世論調査員は約1世紀にわたって世論を解釈してきました。「次の選挙についての世論調査に参加していただけませんか?」彼らの手法はシンプルです。少人数のグループに質問をし、そのサンプルグループを全人口の意見の代表として扱います。「ありがとうございました。お会いできて光栄でした。」「どういたしまして、おやすみなさい。ありがとうございました。」
しかし近年、一般市民は質問、電話、訪問に対して消極的になり、また一箇所で接触できる状況ではなく、人々の移動が増えたことで、従来の世論調査はより困難になっています。今日、人々はスマートフォンやソーシャルメディアなどのモバイルやインターネット技術を通じて、意見や習慣を表現しています。その情報の雪崩は、世論を探る新しい方法を可能にしています。
今日、データはあらゆる場所で入手可能です。クレジットカード情報、ロイヤリティカード情報、人口統計情報、コミュニティ組織の情報など。あなたが申し込むもの、参加するイベント、そして「利用規約を読み、同意しました」というボックスにチェックを入れる時のことを考えてみてください。それは契約上の、誰も読まない複数の画面分の内容です。実際に読んでも意味がないでしょう。つまり、あらゆる場所から情報が得られるということであり、それが非常に価値のあるものとなっているのです。
多くの人々がGoogleにGmailを通して電子メールデータを、YouTubeを通して動画データを、Googleマップを通して位置情報を提供しています。それらのデータを全て繋ぎ合わせると、個人の驚くほど親密な姿が浮かび上がります。これは私たち自身の記憶をも凌駕するものだと思います。私たちは自分が行った場所を全て覚えているわけではありません。課題は、一見ランダムなノイズに見えるものから、意味のある情報を抽出する方法を知ることです。
そこで、AIと呼ばれる応用人工知能が、可能性とリスクの両方を提示します。SFディストピアが機械が人間を支配する世界を想像する一方で、AIはそのエンジニアたちにとって、機械が学習し思考する能力としてより一般的に理解されています。彼らはそれを、ソーシャルメディアのような大量のデータを消化し、ノイズの中からパターンを特定する、人間が導く道具と考えています。
もし、それらのパターンを使って人間の将来の行動を予測できるAIがあったらどうでしょうか。例えば、選挙結果を予測するような...
次期カナダ連邦選挙の選挙戦が始まったところです。ジャスティン・トルドー首相の自由党が司法スキャンダルと2人の閣僚の辞任に直面する中、保守党、新民主党、ケベック連合はいずれも新しく実績のない指導者を擁しています。6週間という短い選挙戦にもかかわらず、各党は政策の概要を示すのに慎重です。有権者が政策、政党、指導者のどれに基づいて選択するのかは不明確です。
カナダの首都オタワで、小さなスタートアップ企業がAIを使って次期選挙を予測しています。
「人々はこれをサインフェルド選挙と呼んでいます。実際、それは毎回の選挙で起こることなんですけどね。正直言うと、私が人々から聞いたのは、これが初めて指導者ではなく政策を本当に見ている選挙だということです。二大候補者は私にとって何の意味も持ちません。本当に、誰が経済や環境のために最善の仕事をしてくれると思うかということです。もちろん、経済は誰にとっても常にトップの関心事ですが、誰が最良の政策を持っているかということです。」
物理学者のケントン・ホワイトと会計士のアーロン・ケリーは、2015年にアドバンスト・シンボリクス(ASI)を共同設立しました。この市場調査会社は、公開データとAIを使用して消費者の態度を予測します。
「ケンブリッジ・アナリティカ時代以降、人々はこれが何かブードゥー科学のようなものだと考えています。私たちは物事を起こすシャーマンがいるわけではありません。これが単なる数学と科学であることを理解してもらいたいのです。他のものと同じように、確率論的で統計的なものです。ただし、電話オペレーターではなくポーリーによって行われているという違いがあります。」
彼らは同様のアプローチを使って政治的意見を予測することができます。
「以前は何百万人もの人々について情報を得て、統計物理学を適用するのは難しかったのですが、今ではFacebookやTwitterがあります。でもそれをどう使うのでしょうか?」
政党やニュース媒体のために働いていないケリーとホワイトは、選挙予測ゲームを彼らの研究方法を宣伝する手段として見ていました。
「従来の市場調査を行う時のことを考えてみてください。私たちは研究対象である人々にどれだけ干渉しているでしょうか。参加を求めることで干渉し、質問をする方法によって結果に干渉しています。私たちの考えは、ソーシャルメディアによって人々を自然な環境で観察する素晴らしい機会が訪れたということです。」
「その社会の人々が何を望んでいるかを正確に知ることができれば、より良い政策とより理想的な社会が実現できるのではないでしょうか。私は子供の頃からSFに影響を受けていました。アシモフの『ファウンデーション』シリーズのように、物理学と統計物理学を人々や集団に適用して、銀河の進路全体を描き出せるというものです。それが実際には不可能だとわかった時はかなりがっかりしました。」
ソーシャルメディアデータの爆発的な増加は、ホワイトに潜在的な宝の山を提供しました。他の人々には乱雑で使用不可能に見えるようなデータソースに、物理学からの統計的手法を適用することができました。それがASIがポーリーと呼ぶAIの誕生でした。
「ポーリーは政治(politics)の略でした。特に深い考えはなく、ただ政治だから彼女をポーリーと呼ぶことにしただけです。」
「ポーリーは多くの異なるパーツで構成されています。ウェブをクロールして情報を収集する小さなプログラムたちです。」
これらのアルゴリズムと呼ばれるプログラムは、特定のタスクを実行するための一連の指示です。
「誰かを選ぶべきか選ばないべきかを判断するアルゴリズム、その人を分析して男性か女性か、裕福か貧困か、若いか年老いているか、黒人か白人かを判断する小さなアルゴリズム、私たちが測定したいトピックについて話している人々を見つけるアルゴリズムがあります。」
「これらのアルゴリズムの1つ1つを見せて、その仕組みを説明すれば、おそらくあなたは『それは単純ですね』と言うでしょう。何十もの要素を組み合わせた時に、より複雑なものが生まれるのです。」
「彼女は私やあなた、あるいはここにいる誰よりも多くのデータを使用しています。一生かかってもわからないほどの量です。」
「しかし、ポーリーを知的にしているものは何でしょうか。注意して欲しいのは、私は感情的という意味ではなく、知的という言葉を使っています。彼女が知的なのは、数学的な概念を理解し、私たち自身では見ることのできないパターンを人々の中に見出すことができるからです。」
しかし、この説明はAIの批評家たちを不安にさせます。AIの手法は部外者にとってはブラックボックスのように見え、AI以外の専門家がAIの内部の仕組みやその結論に異議を唱えることを困難にしています。
懐疑論者に直面して、ASIは2016年6月のブレグジット国民投票をアルゴリズムをテストする機会と捉えました。イギリスの市民は、欧州連合に残留するか離脱するかを投票していました。ほぼ毎日行われる従来の世論調査では、国が真っ二つに分かれていることが明らかになり、投票日が近づくにつれ、未決定の有権者が国の運命を決定する可能性が高まっていました。
一方、ポーリーはイギリスのTwitterデータを分析して、ユーザーに直接接触することなく彼らの意見を予測していました。
「ポーリーは実際の国民投票の3日前まで残留を予測していました。世界中の他の人々と同じように、残留52%、離脱48%でした。」
「そして労働党のジョー・コックス議員の暗殺がありました。残留を訴えていたコックス議員は、2016年6月16日、国民投票の3日前に極右過激派に射殺されました。」
「朝、ポーリーをチェックすると、突然イギリスはEUを離脱するということになっていました。それは彼女がその週の他の日やキャンペーンを通じて言っていたことと異なっていました。私は心配でした。暗殺はブラックスワン・イベントだからです。」
「ブラックスワン・イベントとは稀な出来事、私のAIが以前のトレーニングで見たことのない出来事です。私が彼女をトレーニングした選挙では暗殺はありませんでした。暗殺は稀です。」
「そこで私たちは彼女に『ジョー・コックスの暗殺を無視して、結果はどうなる?』と指示しました。テストしてみると - 残留です。『もう一度、ジョー・コックスが暗殺された場合は?』 - 離脱です。」
「何が変わったのか? 彼女は世界中の他の人々が見逃していたものを何を見ていたのでしょうか?」
イギリスポンドは30年来の安値に急落し、イギリスの有権者の過半数が欧州連合からの離脱を望んでいるというニュースに世界の株式市場は混乱に陥りました。世界第2位の経済大国です。
「ポーリーは私たちが観察しようとも思わないことを観察しています。私たちは彼女にそれらを観察するよう頼んでいませんでした。」
「デイビッド・キャメロンはその間に多くの記者会見を行っていました。そして彼が言った一つの言葉がありました:『この国民投票でのキャンペーン活動を中止するのは正しいことです。誰もの思いがジョーの家族と選挙区民と共にあるこの恐ろしい時期に。』」
「彼女は1年間人々を観察する中で、もし人々がオンラインで『離脱に投票しようと考えている』と言った時、周りに友人や家族のネットワークがあり、穏やかに残留すべき理由や結果について話し合えば、時間とともにそのネットワークは彼らを残留支持に説得する効果がありました。対話が続いている限り。」
「しかし人々が話すのをやめてしまうと、未決定の人々の一定の割合が、過去に彼女が観察したパターンに基づいて離脱に投票することになりました。そして彼女はそのアルゴリズムを適用しました。バッチリ当てました。」
ASIの手法をよりよく理解するために、ポーリーが従来の世論調査と共有しているものを見てみましょう。世論を測定する一つの方法は面接です。短い面接は世論調査と呼ばれます。一般市民の重要なグループのサンプルとして、少数の人々が慎重に選ばれます。
何十年にもわたり、世論調査員は固定電話、ダイレクトメール、戸別訪問で人々に連絡を取ることに成功してきました。
「80%の回答率が得られていました。全ての通話は固定電話でした。携帯電話はほとんどありませんでした。そして人々は調査に参加することを喜んでいました。選挙予測を間違えることは、船から落ちて水に当たらないようなものでした。」
「3回目のノックです。家は暗いようですね。はい、留守のようです。」
しかし過去30年間で、固定電話の使用と世論調査の回答率は激減しています。
「どの家庭の固定電話に電話しても、他の誰よりも年配の女性に応答してもらえる可能性が高いです。ミレニアル世代なら、固定電話では連絡が取れないでしょう。携帯電話なら可能性がありますが、オンラインの方が良いでしょう。」
従来の世論調査員は、異なる層に到達するために手法を多様化する必要がありました。
「あなたが試みているのは、政治市場、重要な政治市場、有権者を可能な限り正確に代表することです。そのためには、人口の異なるグループすべてを十分にカバーする必要があり、それらを総合的に見ようとするのです。」
2019年のカナダの人口をカバーするために、世論調査員のダリル・ブリッカーは固定電話調査、携帯電話調査、オンライン調査を組み合わせています。しかしポーリーのAIは異なるアプローチを取ります。
「人口がより多様化するにつれて、実際にはより大きなサンプルが必要になります。カナダは1970年や電話調査を始めた1959年とは大きく異なっています。しかし1950年代以降、科学的手法は進化していません。同じサンプルサイズを使い、人口が大きく変化しているにもかかわらず、同じ方法でアプローチしています。」
「ソーシャルメディアによって、ついに50年ぶりにこの科学を進化させる機会が訪れました。」
従来の世論調査は、最近のいくつかの選挙予測で失敗しています。
「ホワイトハウスを勝ち取ります。取り戻します。」
そして最も有名なのは2016年のアメリカ大統領選挙で、世論調査員の大多数がヒラリー・クリントンのドナルド・トランプに対する勝利を予測しました。
「明日、列が長くても待ってください。」
トランプの勝利は、世論調査員が大きく外れたことを示しました。彼らは得票率は予測できましたが、トランプに選挙人団での勝利をもたらした激戦州での僅差の勝利を見逃していました。
「明らかに彼らのモデルは完全に外れていました。実際の得票率は世論調査が予測した通りでしたが、選挙人団については測定していませんでした。このような事態が起きると、深い自省の夜を過ごすことになります。」
従来の手法では各選挙区で定期的に世論調査を行うのは費用がかかり非効率的ですが、ソーシャルメディアの大規模なスケールを活用すれば、AIを使ってそれが可能になります。
「ソーシャルメディアで政治について話したり、意見を述べたりすることは今や当たり前になっています。以前は電話で長い会話をしていたのと同じように、それが普通のコミュニケーション手段になっています。」
「もちろん昔は人々の電話を盗聴することはできず、電話して意見を聞く必要がありました。しかしソーシャルメディアについて興味深いのは、人々が意見を伝える時、多くの場合公開形式で行っているということです。それによって私たちは彼らの発言を見ることができ、そこから意見を導き出すことができます。」
しかし全てのソーシャルメディアプラットフォームがホワイトにとって関連するデータを持っているわけではありません。
「私たちは問題に応じてデータソースのサンプルを使用しています。選挙については、Twitterから最も強い信号が得られることがわかっています。」
多くの世論調査員や社会科学者は、Twitterデータの価値に疑問を投げかけています。
「TwitterやFacebookのようなプラットフォームは基本的に自己選択した人々のグループです。なぜなら、全てのカナダ人がソーシャルメディアを使用しているわけではなく、使用していても全員が政治について議論しているわけではないからです。つまり、公衆の中のより小さな層の一部しか得られていないのです。」
「私の素人的な理解では、エリートジャーナリストや高度に関与した超参加者がTwitterを使用していると考えています。」
「全員がTwitterを使用しているわけではありません。低い数字の17%を取っても、現在の9%以下の電話回答率よりはるかに大きいです。3600万人の国の17%は約700万人で、私たちにはそのアクセスがあります。」
ホワイトは、AIがTwitterのカナダにおける典型的に若く都市部のユーザーベースを分析し、それでも全人口を代表する予測を行うことができると考えています。
「選挙日まで3週間を切りましたが、あなたの人工知能による世論調査システムは10月21日に何が起こるかについての結論を出す時期はまだ早いと思いますが。」
「トルドー氏に良い兆しなのは、自由党がこのキャンペーン開始以来一貫して首位を維持していることです。」
「人気投票、つまりカナダで言う総得票数での首位ですか、それとも議席数でしょうか?」
「議席数です。そこが違いです。」
「なるほど。各選挙区を個別に分析しているのですね。」
「そうです。オンタリオ州選挙で見たように、世論調査で総得票数で首位だからといって、必ずしも勝利するとは限りません。」
「その通りです。第一党優位のシステムでは投票の効率性が重要です。」
「データを扱う多くの人々と話すと、彼らは『FacebookやTwitter、Redditで人々が言っていることを全て収集し、それを全て見たい』と言います。」
ほとんどの批評家は、ホワイトがTwitterのファイアホースと呼ばれるものを利用していると想定しています。もしそうなら、ホワイトはリアルタイムデータの膨大な量をフィルタリングし、選挙予測に有用なデータのみを収集する方法を必要とするでしょう。その課題の規模を考えると、批評家たちはホワイトの楽観的な主張に異議を唱えています。
「ファイアホースからそのデータストリームを取り込むだけでは、非常に歪んだ歪んだ見方しか得られません。だからこそ私たちはツイートを数えるのではなく、人を数えるのです。」
「私たちの大きなアイデアは、世論調査員が行ってきたことが機能するということです。それが秘訣です。私たちは本当に良いサンプルを作ります。」
言い換えれば、Twitterのファイアホースを整理する代わりに、ホワイトは世論調査員と同じように、まずポーリーが実際のデータを収集する前に代表的なサンプルを構築する方法を見つけたと主張しています。
「ソーシャルメディアを見て選挙区レベルで何が起こっているかを把握できるという人々の主張は、興味深い考えです。私たちも確かにそれを探求しています。明日、ソーシャルメディアに基づいて全ての選挙区を正確に予測できる選挙に全てを賭けるでしょうか? いいえ。」
「まず、人々がどの選挙区からツイートしているのかを特定するのは困難です。あのインターネットの古い冗談のように『インターネットでは誰もあなたが犬だとわからない』、Twitterでは誰もそのアカウントが中国やロシア、あるいはここトロントからのものかわかりません。確実にそのアカウントがカナダからのものだと言うのは非常に難しいです。」
代表的なカナダ人のサンプルは、実際のカナダ人で構成されていなければなりません。ホワイトは、Twitterユーザーが正当であることを確認できると考えています。
「私たちは人々がアカウントに記載している情報を使用します。カナダにいると表示されているのを確認します。『カナダにいます』と言っているので、それを最初に確認します。」
「最初のテストは、友人の大部分もカナダにいるかどうかです。履歴を見て、何について話しているかを確認します。カナダ人なら、ホッケーや他のカナダらしいことについて少し話しているかもしれません。寒い天候について話しているかもしれません。」
世論調査員にとって、サンプルが代表的でランダムであるのは、全てのメンバーがサンプルに現れる可能性が等しい場合のみです。
「大きな容器にゼリービーンズがあり、赤、青、緑、黄色のものがあると想像してください。全てのゼリービーンズを数える必要はありません。全ての色が容器全体に均等に分布していれば、手を入れて取り出したものを置けば、中にあるものをある程度代表していることになります。10回行えば、容器が小さくなるわけではありませんが、サンプルは一貫性を持つようになるので、容器の中身をかなり良く代表することになります。それがサンプリングの本質です。」
歴史的に、世論調査員は電話帳からランダムに名前を選んでサンプルを抽出していました。デジタルの世界では、ランダムで代表的なサンプリングには異なるパラダイムが必要です。
「『ケビン・ベーコンの6度』というゲームがあります。映画俳優を選んで、6ステップ以内でケビン・ベーコンにリンクしようとするものです。FacebookやTwitterでも同じゲームができます。誰か、有名人を選んで、平均3〜4つのつながりで自分とリンクさせることができます。世界中の誰とでも。」
ポーリーのアルゴリズムは、収集するTwitterユーザー間の仮想的な距離とランダム性を定義するために、ユーザー間の最小平均ホップ数を保証する数学的計算を使用します。
しかし批評家たちは、これでもTwitterユーザーの多様性の欠如に対処できないと主張します。
「私はTwitterのそのバイアスを説明できます。国勢調査の分布と比較して、分布が大きく異なる場合は、バランスが取れるまで待つようアルゴリズムに指示します。」
「例えば、サンプルが若い都市部の男性に偏り始めているのを見たら、若い都市部の男性の収集を停止します。年配の地方の女性が得られ始めるまで、彼らをサンプルに追加するのを一時停止します。」
つまり、Twitterの大多数を反映する代わりに、ポーリーのサンプルは各選挙区の実際の人口統計と一致するユーザーの組み合わせに限定されているとホワイトは主張します。これにより、批評家たちがポーリーの主なデータソースの致命的な欠陥と見なしているものに対処できるとしています。
そしてこれがポーリーの背後にある重要なアルゴリズムです。
もしカナダの選挙戦でショッキングな出来事があったとすれば、それは今週のことでした。ジャスティン・トルドーのブラックフェイスとブラウンフェイスの写真が広まり、国内で非常に複雑な意見の混在を引き起こしました。
「アーロン・ケリー、これら全ての余波についてポーリーは何を示していますか?」
「大きなショッキングな出来事でした。ポーリーはトルドー氏の数字、つまり議席数が昨日25議席下落したのを確認しました。今朝は5議席回復していますので、差し引き20議席の損失です。しかし、これによって過半数の領域から少数与党の領域に落ち込みました。」
「NDP(新民主党)のジャグミート・シン党首が昨日最大の勝者でした。彼の支持率が上昇しているのを確認しました。彼は本当にこの状況を乗り切りました。」
では、アルゴリズムはどのようにしてツイートから議席の下落を予測するのでしょうか? ツイートは実際には何を意味し、私たちがツイートする時それは何を意味するのでしょうか?
「インターネットで人々が冗談を言ったり皮肉を言ったりしていることはわかっています。より多くの画像を共有していて、それが解釈の課題を生み出しています。ミームを理解するのは難しいです。これらの短縮されたグラフィックは、しばしばポップカルチャーの参照です。そこで私はここで『これはいったい何が起こっているんだろう?』と思います。そして『私でさえこれが理解できないのなら、生きて呼吸する人間である私のコンピューターでさえ、この可哀想なコンピューターは一体これをどう理解するんだろう?』と考えてしまいます。」
ホワイトによると、ポーリーはツイートの意味を解釈しようとはしていないそうです。
「選挙予測に関する最初の試みで、実験を行い、一貫して発見したのは、単純な言及数が、ポジティブまたはネガティブな感情よりも常に優れた予測を示したということです。」
ポーリーはサンプル内のユーザーの中で、各連邦政党に言及している割合を追跡します。そしてAIはそれらの結果を過去の世論パターンと比較します。ブラックフェイス報道が出た翌日、他党と比較して自由党への言及が急増しました。これらのツイートの意味を理解することなく、ポーリーはこれらの言及の変化を自由党の予測議席数の下落として解釈します。
「世論調査は面白いと思います。なぜなら、それは過去の一瞬の写真のようなものだからです。未来を予測するものではなく、ある時点で世論がどのように考えているかを知る手がかりを得るものです。」
AIは常にデータを収集しているため、世論調査よりも頻繁に行われない従来の調査と比べて、時間の経過とともにユーザーの活動パターンを特定することが可能です。
「追跡調査を行う際の最も難しいことの1つは、良いことでも悪いことでも何かが起きた時に『それは1つのデータポイントだ』と言って、別の日を待たなければならないことです。それは本物なのか、それともただのブリップ(一時的な変動)なのか。常にそのような感覚の中にいて、何ポイントで傾向になるのか。1ポイントではおそらくならない、2ポイントかもしれない、3ポイントはそうかもしれない、4ポイントなら確実。でも、そのポイントはどこにあるのでしょうか。」
傾向を特定するために、ポーリーは公開の世論調査を参照ポイントとして使用します。彼女は選択したTwitterユーザーが政党に言及する全ての時点でのユーザーエンゲージメントのパターンを分析します。そして各党の世論調査での支持率とエンゲージメントを比較します。これらの関係に基づいて、ポーリーは彼女のデータが傾向が安定しているかどうかを示しているかを予測します。
「人々は時として、ある問題について怒りを感じることがあります。その瞬間は怒りを感じるかもしれません。しかしポーリーは非常に偏りのない方法で、その怒りと傷つきを人々が乗り越えるのにどれくらいの時間がかかるか、そしてそれが選挙日まで続くかどうかを見通すことができます。」
ポーリーは常にTwitterのエンゲージメントを追跡しています。その継続的な活動の流れは、縦断的データと呼ばれます。このようにデータを研究することで、ポーリーは時間の経過とともにパターンを特定し、それを現在の活動と比較することができます。また、これはポーリーが未探索の傾向を再検討するために過去のデータを振り返ることができることも意味します。
「ブラウンフェイス、ブラックフェイスのスキャンダルについて、20代の時に疑わしい衣装を着ていた党首を見たら意見が変わるかどうかを質問した世論調査機関は1つもなかったと思います。誰もそのような質問をしようとは考えませんでした。」
「ポーリーと縦断研究の素晴らしいところは、1週間前や1ヶ月前のあなたの考えを正確に測定するために過去に遡ることができるということです。これは1週間後や2週間後に質問することではできないことです。」
「私は、カナダ人は特にソーシャルメディアで表明しているほどにはブラックフェイスを気にしていないのではないかと示唆したいと思います。ソーシャルメディアでは特に『ああ、信じられない』というような多くの怒りがあり、私はそれを演技的な怒りとさえ呼びたいと思います。」
「本当に信じられないの? ケベック出身の裕福な白人が、アラビアンナイトをテーマにしたパーティーでブラックフェイスを着用したことが? そもそもブラックフェイスなしでも、そのパーティー自体が人種差別的でした。」
「1週間半前にあれだけ大きなニュースだったのに、今ではほとんど - メディアから消えたとは言いたくありませんが - 言及されなくなっています。あなたの調査で見る限り、この問題は本質的に終わったと言えますか?」
「はい、他の政党がこの問題を蒸し返すのは、死んだ馬を叩くようなものだと思います。彼は回復しつつあり、その回復が遅いのはブラックフェイスだけでなく、様々な問題が混ざっているからかもしれません。」
「ジャグミート・シンは、ブラックフェイス・スキャンダルが報じられた直後の最初の発言で多くの人々に感銘を与えました。その好意は今では終わりました。」
「終わったというのは...ブラックフェイス以前より2議席増えていますが、以前は9議席増えていたので、それから下落しています。徐々に収まりつつあります。」
「人工知能」や「機械学習」という言葉は、時として異なる方法で使用され、人間のように考えるコンピューターについての様々な魔法のようなことを意味することがあります。現代的な意味は、基本的に非常に洗練された柔軟なアルゴリズムであり、非常に大量のデータを、それらの間の非常に複雑な関係を持って処理することを可能にし、コンピューターが予期せぬ関係を見出すことを可能にする柔軟なモデルを持つということです。
「なぜ彼女はAIなのか、なぜ単なる統計やコードの集まりではないのでしょうか? 違いは、彼女がほとんど自力でこれを行うことができるということです。私がルールを書いて『ポーリー、これを見たらこうしなさい』と指示する必要はありません。彼女は自分で物事を理解することができます。」
ポーリーの学習能力は、将来の投票結果を予測する方法の基礎となっています。機械学習の鍵は、統計モデルのトレーニングと呼ばれるプロセスです。
「モデルのトレーニングについて話す時、私たちは既に答えがわかっているデータを持っています。それは前回の選挙での投票方法かもしれませんし、何人が銃を購入したか、しなかったかかもしれません。しかし既に答えを知っていて、それを使って推論を引き出します。『ここに住む男性はその人に投票する可能性が高い』とか『この雑誌を購読している男性は銃を購入する可能性が高い』というような関係を学習し、前のデータでトレーニングしたモデルを使って次に何が起こるかを予測してみましょうと言います。」
ポーリーは2015年のような過去の選挙からのデータを研究します。彼女は人々がTwitterでどのように関与したかと、実際にどのように投票したかとの間のパターンを見つけます。モデルはそれらの関係を全て数学的確率として表現します。そして2019年の各選挙区の有権者が最も取る可能性の高い行動を予測します。
「例えば、このカップの中の液体がどのように働くかを説明しようとしているとします。水分子から始めましょう。数十億、数兆、数京 - 正確な数は引用しないでください - たくさんの水分子があります。物理学では、それらがどのように働くかある程度わかっています。水分子は互いに跳ね返りますが、この水のグラスの中で全ての分子が何をしているかを本当に気にする人はいません。」
「興味深いのは、この水を注いだらどうなるか、水がどうなるのか、このようにグラスを振ったら水がどう動くのかということです。物理学では、水分子が数え切れないほどあっても、十分な水分子があれば統計的に全体がどのように動くかを把握できる理論があるため、このグラスの水という大きなマクロな系がどのように実際に働くかについて、ある程度の説明ができます。」
「そして世論も基本的に同じです。多くの人々がいて、それぞれが自分の意見を持っています。実際、1人1人の意見を予測するのはかなり難しいです。人々は本当に予測不可能で、これやあれで意見を変えます。しかし十分な数の人々が集まれば、その集団を1つのものとして統計的にモデル化することができます。」
「ジョーは明日劇的に意見を変えるかもしれず、サラは彼女の意見を変えている奇妙なことを本当に気にしているかもしれませんが、統計的に私は全体を近似することができます。この集団の総意見がどこに向かうのかについて、感覚をつかむことができます。」
「ある意味で、私たちは物理学で常に行われているのと非常によく似たことをしています。全ての原子や分子などがどのように一緒に働いているかを把握し、それを今は人間に適用しているだけです。」
「私たち全員がユニークな砂漠の花だと考えたがりますし、本当にそうなのですが、統計と数学の素晴らしいところは、十分な数の私たちが集まれば、平均的に人々の意見がどのように形成されるかについて、合理的な予測を立てることができるということです。」
モデルがどんなに洗練されていても、選挙予測のアキレス腱は、人々が実際に投票所に足を運ぶかどうかです。
「選挙の世論調査を行う度に恐れを感じます。そして本当に恐れを感じます。なぜなら会社の評判と個人の評判が賭けられているからです。『何を見逃したのか、何を見逃したのか、何を見逃したのか、どうやって間違える可能性があるのか、どうやって間違える可能性があるのか』と。」
「どの選挙区でも6つか7つ、あるいはそれ以上の政党が選挙戦を戦っていますが、投票用紙には載っていない非常に重要な政党があります。それは無関心党と呼ばれています。」
これは従来の世論調査員にとって問題です。なぜなら彼らの予測は過去の選挙投票率に基づいているからです。
「みんな『もちろん投票します』と言います。『投票しない、気にしない』と言う人の数は、実際に投票しない人の数と比べると非常に少ないです。」
「そして、政治に興味がなくて投票しないような人々は、玄関で長い会話をしたり、世論調査の電話に応答したり、政治についてTwitterで意見を述べたりする可能性が極めて低いということと相まって、非投票者は多くの方法で会話から自分を除外していることになります。そのため、彼らを見つけ、理解し、そして予測することがより難しくなります。」
対照的に、ポーリーの手法は地方選挙区の支持パターンに基づいており、全国の投票率の影響を受けにくいと言えます。
しかし哲学的に、一部の批評家たちはまだ問題があると主張しています。ポーリーは統計的相関に基づいて結果を予測しますが、なぜそれが起こるのかについては説明しません。
10月初めの2回のフランス語討論会の後、ポーリーはケベック連合の支持率上昇を確認しましたが、原因は示しませんでした。
「トルドー氏、パイプラインはどうなりますか、それとも...」
「それは、コミュニティの承認、先住民の承認を必要とするプロセスの一部です。」
「パイプラインは建設されないと言えますか?」
「だからこそ私はエネルギー回廊のアイデアを提案したのです。」
ポーリーのハンドラーたちは、ケベックからのツイートでパイプラインというキーワードが急増したことから、支持率上昇の理由を導き出しました。
「ケベック連合を支持する人々は『ケベックはグリーンエネルギーを持っているのだから、なぜアルバータの汚いエネルギーを買う代わりに、ケベックのグリーンエネルギーをアルバータに売らないのか』と言っていました。」
しかし、シャンテル・へバートのようなある評論家たちは討論会を異なる視点で見ていました。
「シアー氏のパフォーマンスは、私が数十年間で見た中で、フランス語討論会における首相候補者として最悪のものでした。そのため、シアー氏はケベックでの選挙戦に敗れました。ケベック連合が勝っただけでなく、彼が正しい印象を与えることができなかったのです。」
へバートは彼女の経験に基づいてケベックでの支持の変化を説明しています。ケリーの説明も人間による解釈です。ポーリーのデータは、ケベック連合の議席増加と「パイプライン」という用語の間の相関関係を示すだけで、原因は示しません。
「今日は10月18日金曜日、選挙まで3日です。月曜日が選挙日です。30分後にオンエアです。昨日出した最新のプレスリリースで、66%の確率で自由党少数政権になると言いました。今朝、ポーリーは77%の確率だと言っています。ポーリーは人々が最終決定に近づくにつれて、日々より確信を深めていきます。」
「私は放送で『これがポーリーの見方です』と言う度に、結果に影響を与えてしまうのではないかと心配します。最新の情報に基づいて人々が投票を変えるかもしれません。ポーリーが登場する前からでさえ、そのような証拠があったと思います。」
世論調査結果をキャンペーン中に公表することは、意見を反映しているのか、それとも実際に意見を形作っているのかという問題を、社会科学者たちは提起していました。AIのより大きな規模がこの問題をさらに重要にしているという意見もあります。
「AIは、政治プロセスにおける中立性の神話を試すと思います。ジャーナリストの中立性だけでなく、世論調査員の中立性も同様です。一方では政党は世論調査とテクノロジーを使って何をすべきか決めようとしますが、メディアは世論調査と予測を使って何が起きているかを把握しようとします。それはフィードバックループです。プロセスの内側にいるか外側にいるかは関係ありません。未来の認識が未来を決定するのです。」
「そのため、もしメディアがNDPには可能性がないと言い始めれば、NDPは可能性がないと考え始めることになります。予測が、私たちが未来をどのように扱うかに与える影響に深く関わってきます。その意味で、それが政党であれ、メディアであれ、個々の世論調査会社であれ、これらの予測を公表することは世論に影響を与え、したがって結果に影響を与えるのです。」
投票日は月曜日です。ほとんどの世論調査で自由党と保守党が事実上の同率です。人工知能アルゴリズムのポーリーは、これから何が起こるかについてより明確な見方を持っているでしょうか?
「今週、どれだけ多くの人々が私のところに来て『ポーリーは何と言っているの?』と尋ねたか、あなたには想像もつかないでしょう。」
「あなたは赤い服を着ている理由があるのですね。」
「はい、意図的にこの色を選びました。」
「なぜなら...」
「なぜならポーリーが私たちに伝えているのは、自由党政権になるということ、自由党少数政権になるということです。」
「それはつまり、この選挙について確実な予測ができるということですか?」
「興味深いことに、77%というのは強い数字です。しかし、私たちが望むほど強くはありません。2015年の同じ時期のように、1ヶ月前に選挙結果を予測できるほど強くはありません。今回の有権者はかなり未決定です。グラフの下部に、まだ未決定の選挙区がかなりの数あります。州内でまだ20以上の選挙区が未決定です。」
「前回のアメリカの全国選挙で、全ての予測がヒラリー・クリントンに80%の勝利確率を示していたにもかかわらず、彼女は勝てなかったことを指摘せざるを得ません。80%で、あなたは77%...これはまだ終わっていないということですよね?」
「いいえ、終わっていません。ヒラリーの件との違いは、私たちは個々の議席を数えているということです。全国レベルでは、自由党と保守党は実際に同率です。しかし議席に注目すると面白くなってきます。私たちのシステムでは、得票率がどのように議席に反映されるかが重要なのです。」
選挙日2019年、約1800万人のカナダ人が投票を行いました。事前投票を含めて、これは66%という予想を上回る投票率を示しています。自由党が政権を形成しますが、保守党が得票率では勝利を収めました。
数日後、実際の結果と議席予測を比較する時が来ました。
「もちろん今週は連邦選挙2019が自由党少数政権で終わりました。これはあなたが示した全国の議席予測で、自由党が116から173の範囲で基本的に145、保守党が123、NDPが48、ケベック連合が46、緑の党が1から5の範囲で、2つの無所属と人民党の可能性がありました。」
「これを裏返して、これが日曜日の全国議席予測です。前のは土曜日のもので、これは選挙前日のものです。物事が変化しているのがわかります。自由党が155、保守党が118になっています。」
「そして月曜日に移りましょう。これが実際の選挙結果でした。自由党157議席、保守党121議席、ケベック連合32議席、NDP24議席、緑の党3議席、ジョディ・ウィルソン・レイボルド1議席、人民党は0議席でした。」
「まずこれについて、ポーリーの仕事の精度をどのように評価しますか?」
「選挙予測の評価をしたい場合、公平なのは他の予測を試みた人々と比較することだと思います。ある会社が他の全ての会社よりも良い結果を出したのなら、それはおそらくかなり良い結果だと言えます。」
選挙前日、一部の従来の世論調査員は得票率のみを予測していました。他の調査員も自由党少数政権を予測する意思はありましたが、狭い範囲の議席数を公に予測する機関はほとんどありませんでした。世論調査機関338カナダによると、彼らは338選挙区中299選挙区で正しい予測を行いました。アドバンスト・シンボリクスによると、ポーリーは308選挙区で正しい予測を行いました。
「これは予測が『簡単な』選挙だったのでしょうか?」
「予測が簡単な選挙ではありませんでしたが、予測可能でした。興味深いのは、誰もが非常に接戦だと言っていたことです。だからこそ、議席数を見て選挙区を分析できることが、世論調査にとってほとんど必須になりつつあるのです。」
「アメリカのトランプ選挙で最初に見られ、それ以来一貫しているように思えますが、選挙はますます接戦になっているようです。もちろん少数政権の場合は予測が少し難しくなりますが、ポーリーにとっては一貫して自由党の勝利だったのです。」
「2019年の選挙で私たちは本当に良い結果を出しましたが、いくつかの選挙区で外れました。それは、全ての政党が選挙前の最後の週末に、勝つ可能性のあるすべての選挙区で平等にキャンペーンを行っているという仮定を立てているからです。今、政治学者たちは私を笑っているでしょう。政党は戦略的に勝ちたい選挙区を選んでいることがわかりました。私たちはそれを全く考慮に入れていませんでした。だからこそ、政治学を知る人々と本当にオープンな対話を持ちたいと思います。」
ホワイトとケリーは誇らしげに、ポーリーの最終的な議席予測が多くの確立された世論調査員よりも正確だったと主張しています。ただしホワイトは、ASIにはキャンペーンの運営方法についての専門知識が不足していることを認めています。AIの手法の批評家たちにとって、この認識は政治についての素朴で有害な仮定を露呈しています。
しかし支持者たちにとって、ポーリーの議席予測における相対的な正確さは、AIの大きな可能性を示しています。
「『私が答えを持っています』と言う人々の話を聞くたびに、私は『そうですか、あなたがそれを持っているのですね』と思います。これを行うために誰よりも多くの資金を持つ大手の上場調査会社や、それ以外にもGoogle、Facebook、Twitter、そして最高のデータサイエンティストを全て抱えてこの種の問題に取り組んでいる会社たちでさえ、彼らのプラットフォームに基づいて予測することはできないのです。」
ベテランの世論調査員や統計学者たちはまだより多くの証拠を求めています。彼らはTwitterを主要なデータソースとすることの価値に疑問を投げかけ続けており、この手法が信頼できる正確なものだと認める前に、ポーリーがはるかに長期的な選挙予測の実績を示す必要があると主張しています。
「製品を購入する際などによく使われる免責事項に『過去の実績は将来の実績を示すものではない』という言葉があります。これは予測アルゴリズムにも当てはまると思います。例えば直近の2回の選挙で良い結果を出したとしても、それは彼らに有利に働きますが、まだ保証にはなりません。より多くの選挙でより良い結果を出し続ければ、より信頼を置けるようになってくると思います。」
ASIによると、ポーリーの予測モデルは、より多くの選挙データと、アルゴリズムを洗練させるための社会科学者からの意見を得ることで、さらに改善されるとのことです。
「今日のAIの段階に到達するまでに、私たちは長い道のりを歩んできました。今日のAIがここまで来られた大きな要因の1つは、インターネットによるデータの爆発的な増加です。」
しかし公開データの爆発的な増加にはリスクが伴います。ソーシャルメディアは無料ですが、その代わりにユーザーのプライバシーと引き換えです。個人データはマーケティングに利用可能となります。批評家たちは、プラットフォームがそのデータを使ってプラットフォーム自体をより中毒性の高いものにしていると警告しています。
「自動車が登場した当初、シートベルトもエアバッグもありませんでした。しかし『ああ、この車は事故を起こす可能性がある、人をはねる可能性がある』ということがわかると、より良いブレーキやエアバッグ、シートベルトを要求し始めました。」
「ソーシャルメディアの最初の10-15年間は『これらの企業に手枷をはめないようにしよう。彼らに何ができて、社会にどのように貢献できるかを見てみよう』という議論でした。しかし今、私たちは全ての事故を、彼らが引き起こし得る全ての害を発見しています。私にとって、これからの数年は、ソーシャルメディアの規制がどのようなものになるかを議論する時期になると思います。」
「大きな問題は、キャンペーンをアナログな世界のものと考えているのに、実際にはそれが全て自動化されデジタル化されているということです。私たちの言語も法律も、Facebookが持つ力や、個人、政党、外国政府がその力を使って選挙の天秤を傾けたり、少なくとも選挙に対する人々の認識を混乱させたりする方法を、本当には想定していません。」
「選挙を行う全ての目的は、結果を正当化することです。もし人々が、正しいか間違っているかにかかわらず、アルゴリズムが選挙を乗っ取ったと信じれば、彼らは結果を正当なものとは見なさなくなり、政府を正当なものとも見なさなくなります。そのため、政府が実際に統治する能力がより困難になってしまうのです。」
「多くの点で、データを使って人々に投票させ、政治に参加するよう促すことはかなり有益です。実際、データが何に良いかと聞かれれば、政治への参加を増やすことだと思います。そのため、政治広告が定義上問題だとは思いません。問題だと思うのは、オンライン広告の仕組みと、広告プロファイルを開発するためにそれほど多くの監視を必要とすること、そしてターゲティングの方法に広告詐欺が多いということです。」
「カナダ人は、テクノロジーと監視が彼らの社会でますます大きな役割を果たしていることに不安を感じていると思います。しかし無力さも感じているのです。」
「私たちは『プライバシーが欲しければ家にいなさい、プライバシーが欲しければ誰にも話さないでください』という考えを持っていました。しかし、あなたがパブリックスクエアに参加することを決め、情報を公開することを決めた場合、誰かがその情報で何かをすることを容認したとみなされるという考え方は、現代の世界では機能しないのです。」
「これを同意で解決しよう、同意するか同意しないかを変えるだけでいいという考えは、本当に有害だと思います。その欠陥は、巨大な組織に対して個人が立ち向かうということです。大きな格差は、彼らはあなたについて多くを知っているのに、あなたは彼らについてほとんど知らないということです。私たちはこれら全ての構造を作り出しましたが、他のものを作り出すこともできるのです。」
ポーリーの選挙予測は、Twitterの継続的な人気とそのデータへの容易なアクセスに依存しています。しかし、ユーザーのプライバシーを保護したり、ソーシャルメディアのビジネスモデルを制限したりする新しい規制が施行された場合、人々のソーシャルメディアの使用方法を根本的に変える可能性があります。
「ソーシャルメディアがより私的になるとは思いません。誰もが閲覧でき、誰もが関与できるコンテンツを作成できる公共ネットワークの必要性は存在し続けるでしょう。私もそれに大きく賭けています。わかりません。おそらく従来の世論調査員たちは、これが未来だから恐れているのかもしれません。」
「マイクロソフトが発表した有名なTwitterチャットボットがありました。チャットボットの名前は忘れましたが、自然言語AIのデモンストレーションでした。本当に素晴らしい、非常に洗練されたAIでした。多くの人々がこの小さなチャットボットのTwitterアカウントを知り、『このAIを地球上で最も不快で嫌悪感を抱かせるTwitterアカウントにするにはどうすればいいだろうか』と考え始めました。そして彼らは成功しました。この小さなAIは恐ろしく人種差別的で外国人嫌いになり、マイクロソフトは停止せざるを得ませんでした。」
「それはAIの責任でしょうか? なぜ私たち人間は、そんなに惨めで意地悪で悪い存在になりたがるのでしょうか? そしてそのような例を機械に見せるのでしょうか? 悪い子供を見かけたら、たいてい悪い親がいるものです。AIに関して、これら全てに関して、それが私の北極星です。私は良い親でなければなりません。ポーリーにとって最高の親でなければならないのです。」

いいなと思ったら応援しよう!