AIによって流暢な外国語を話す有名人ーー「AIと音」の社会問題を考える

2023.11/10 TBSラジオ『荻上チキ・Session』OA

Screenless Media Lab.は、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は、AIを利用した音声利用に関する問題について、最新の問題をお伝えします。

◾AIを利用した政治家のフェイク動画・フェイク音声

何度かお伝えしているように、合成音声や合成音声による翻訳技術の高まりによって、様々な領域で音にまつわる問題が発声しています。

まず、日本でも2023年11月、生成AIによって作成された岸田総理のフェイク動画が、SNSで拡散されました。動画では、日本テレビのロゴや番組に似たテロップ等が利用されるとともに、岸田総理に似た声で卑猥な発言をさせています。

動画は今年の夏に「ニコニコ動画」に投稿された3分43秒のもので、今月に入って動画から30秒抜粋したショート動画がXに投稿され、またたく間に200万回以上再生されました。

作成したのは25歳の男性で、AIに岸田総理の動画や音声を学習させることで、一時間ほどで動画を作成したと述べています。総理の声に酷似した合成音声とともに、口元も加工して総理が実際に話しているような動画になっています。

男性は投稿理由を「注目されたかった」としており、謝罪を述べていますが、日本テレビが法的処置を実施する可能性もあります。また、政府もこうしたフェイク動画の拡散を控えるよう呼びかけています。

SNSでの誹謗中傷が訴えられるという認識は普及していますが、フェイク動画でも同様の事態が生じることを、私たちは忘れてはなりません。また、SNSでの誹謗中傷投稿は、それをリポスト(拡散)することでも罪に問われる可能性があります。これは動画でも同じことです。本件が注目される以前からフェイク動画は多く存在しており、そのような動画をショート動画等で目にしたことがある人もいることでしょう。動画の中にはエンタメ要素の強いものもありますが、SNSでの投稿や拡散には、十分注意する必要があるでしょう。

◾ニューヨーク市長、AIを利用して市民に多言語で話しかける

フェイク動画と同時に、音声に関しても、合成音声が物議を醸しています。

2023年10月、米ニューヨーク市のエリック・アダムス市長が、スペイン語や中国語といった複数の言語で有権者に、ロボコールと呼ばれる、自動音声による電話をかけていることがわかりました(400万件のロボコールのうち、スペイン語は数千件、その他の言語も数十から数百件かけられています)。

アダムス市長はブルックリン生まれのアフリカ系アメリカ人であり、報道によれば英語以外の言語を話すことはなく、ロボコールの声は、AIによって市長の言葉が外国語に翻訳されていることがわかっています。

ちなみに、ロボコールはマーケティングや選挙活動などで使われるもので、今回は市長として市民に対し、イベントへの参加等を呼びかけるものでした。ロボコールには批判もありますが、今回はロボコールを使用したこと自体が問題とされたわけではありません。問題は、特段の断りもないまま、市長がAIを利用し、中国語やスペイン語で語りかけたことにあります。

実際、市長は街で市民に「あなたが北京語を話すとは知らなかった」と呼びかけられたといいます。どのような技術が利用されたかは不明ですが、翻訳された声は、市長の声(英語)の特徴を保持したまま、別の言語に翻訳されているため、まるで市長が多言語を話すことができるように感じるのです。

これに対し、NPO団体である「監視技術監督プロジェクト(The Surveillance Technology Oversight Project:S.T.O.P.)」は、こうしたAIの使用を「極めて無責任」と批判しています。

同団体は、多言語でアナウンスを行うことは必要だが、それを伝える人間の側をAIで生成する必要はないと訴えています。もちろん、政治家によるこうしたAI利用は、選挙で有利に働く可能性があります。さらに、テクノロジーの利用を明示しないままのAI利用は、人々に混乱を与える可能性があります。

政治家のAI利用は海外でも生じており、特に当ラボが何度も紹介しているように、音声翻訳は便利である一方、多くの混乱を与えかねません。今後は日本でも音声翻訳された動画が、特に明示のないまま拡散されることが予測されます。すでに水面下で議論はありますが、適切な運用ルールの設定が求められる分野でしょう。


この記事が気に入ったらサポートをしてみませんか?