同じことを人がする・AIがする、その違いは何?~文系のためのAIコミュニティ③
第3回目を迎えた「文系のためのAIコミュニティ」開催レポートです。
今前半は参加メンバーが調べてくれたことの発表、後半はディープラーニングのデモや最近の実例などを僕・池田から紹介しました。
AIアナウンサーの是非
超保守派のFさんが「AIアナウンサー(原稿を発声して読み上げるAI)」について簡単に紹介してくれました。Fさんが調べて思ったことがこちら。
さて、僕よりひと回り若いFさん、新しいものに否定的な所は置いといて、ポイントは「人間アナウンサー=看板」「AI≠看板」の対比だと思います。
現場の取材に行って実況レポートするのは人間しかできない、というのは確かかもしれません。では、人間が取材に行ってその場で書いた文章を、AIが実況レポートとして読み上げることに何の差があるのでしょうか?
実際、中国では既にAIアナウンサーがいて、24時間ニュースをひたすら読み上げていると、他のメンバーが教えてくれました(こういうのがコミュニティのいいところですね★)。
↓↓リンク先のページの下の方に行くとyoutubeで動画が観れますが、唇と口の動きがシンクロしてなくて、うーん、という感じがします(もはや絵に意味が無いということでしょうね)。
人間の方が人目を引き、人気を得る看板になれるが、AIがなれないかというと、そういうわけでもないと思われるのがこちら。
もはやオンライン上であれば架空の人間も生み出せるので、これをちょっと動かせるようにできれば、ネット上でも人気が出そうです。
そして、ひょっとしたら、自分がファンになっていたアイドルが実は架空の人間を演じるAIだった、みたいな未来もありえそうですね。
そうなると、もはや人間とAIの境目は「直接性」になってくるのかもしれません。「その場にいる・いない」、「触れる・触れない」、の価値はどこにあるのでしょうか?
ちなみに日本でもAIアナウンサーは活躍していて、NHKで採用されているのが「ニュースの読み子さん」。サイトで実際に最近のニュースの読み上げを聞けますし、ニュース番組に普通に登場します。
「強化学習を用いた人狼における最適戦略の抽出」
今回リアルで初参加のAさんは、大学で人狼サークルに所属して数々のプレーをこなしてきた強者ですし、「謎解き研究家」でもあります。ちなみに会が始まる前にクイズを披露してくれましたが、これがまた難しい…!
さてこれは何県でしょうか?(正解はCMの後で!)
Aさんが発表してくれたのは、人狼をAI同士でプレーさせたらどうなるんやろ、ということをかなり真剣に研究した結果をまとめた論文についてでした。
論文タイトルは「強化学習を用いた人狼における最適戦略の抽出」で、東大や筑波大、電通大の人たちが書いたガチの論文。
Aさんは用語などがわからないなりに調べてくれて、最も印象的だったのは、「実際の人狼で人間プレーヤーの上級者が終盤で採用する打ち手」を、AIが強化学習によって編み出したこと、と発表を締めくくりました。
これは人狼プレーヤーならではの切り口で、非常に面白かったですね。
AIの研究はゲームと切っても切れない側面があり、いわゆる「完全情報ゲーム」(オセロや将棋、チェス、囲碁など)を起点に発展したAIは、今後「不完全情報ゲーム」(=発話や駆け引き、取引など、一定のコミュニケーションが必要なゲーム)の分野でも応用されるだろうということです。
人類に警鐘を鳴らす~AIよりも人がこえーよ
発表の最後はHさんで、要約すると、AIは万能なんかじゃなくてむしろ作り手のバイアス(偏見)やエラー(誤り)によって、思いもしない結果が出て来るから、人類気を付けろ、ということでした。
下の画像、左側は"child"と「買い物」で画像検索した場合。
右の画像は、"Islamics are"(イスラム系の人は…)で検索した時に出て来る候補ワード(画像は多分関係無いと思います)
右の例は何となくわかるかと思いますが、イスラム系の人たちに対するネガティブな言葉が候補として挙がってきているわけで、これはGoogleの検索エンジン×AIが学習した結果なわけですね。
そして、左は白人の子どもばかり出て来ること、そして、買い物=女性というのも、実はよく考えるとおかしいという話。
画像認識はAIが最も得意とする分野ですが、2019年時点でもまだまだ課題は山積みなわけですね。
このことから考えられるのは、「AIと倫理」という、まさしく「ザ・ヒューマニズム」とも言えるテーマかと思います。
人間の感性や社会的慣習、道徳観念を踏まえると不適当とされる、AIがもたらす予期せぬ結果について、私たちはどう考えるべきでしょうか。
AIの倫理問題を扱う国際機関もありますし、政府間の連携も徐々に進みつつあるようです。
作り手が善意、つまり、何かの問題を起こそうとして設計したわけではなければ、修正はまだ可能かもしれません(Googleは倫理委員会を社内に設けています)。
しかし、最初から悪意ある作り手がAIで問題を起こす場合、どうしたらよいでしょうか。しかも、対話型で巧みに相手を誘導できるとしたら?
テクノロジーがもたらすものは便益ばかりではなく、私たちが考えるべきことはまだまだありそうです。
AIの正体
後半は僕からディープラーニングのデモを見せて、AIがそもそもどういう風にできていて、どんな風に動くのかを紹介しました。
今はGoogleのおかげで、インターネットにつなぎさえすれば、あっさりとブラウザからPythonを動かせます。
【Google Colabortory】
Jupyter Notebookのクラウド版
僕は過去にJupyter NotebookなどPythonを動かすための環境をインストールしていましたので、ローカルでやりました。
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation
from keras.optimizers import RMSprop
from keras.callbacks import EarlyStopping, CSVLogger
%matplotlib inline
import matplotlib.pyplot as plt
(以下、コードが続く)
機械学習を行って手書き文字を判別する、もっともポピュラーなAIプログラムを見せました。AIといっても、正体は人が書いたコードです(僕はオリジナルからは書けませんが…)。
「え、当たり前じゃないの?」と思われるかもしれませんが、私たち文系にとってはコードはなじみのあるものではありません。未知のものについてよくわからないままイメージだけ膨らませると、真の正体を見失ってしまうことがあります。なので、こういう初歩が意外と大事だったりします。
もちろん、AIについてはプロセスが不透明である「ブラックボックス問題」があることは否めません。が、それはまだ理解するには先の先の話だと思います。
それから、オープン・ソースとしてインターフェースもちゃんと整えられているIBM ワトソンについても紹介しました。
音声生成、機械翻訳、自然言語処理など、AIが得意とする分野についてデモを通じて理解できます。
特化型のAIは数々生まれて来ていますが、例えば、囲碁が強いAIが何でもできるわけではありません。しかし、可能性として、特化型AIのかけ算によって生み出されるAIの連携プレーはには目を見張るものがあります。
こちらの動画は、マイクロソフトが開発したAI×ホログラムで、後ろでゴーグルをかけている女性が英語で話すと、女性のホログラムが生成されて、その女性の声で、日本語に翻訳された内容が話されます。
さて、こうなってくると、最初にFさんが提起した「AIアナウンサーの価値とは」ということがまた問題になってきます。私たちが、海外の事件現場で取材している人が、日本のテレビを通じて、ホログラムで、機械翻訳された日本語を話しているのを聞いているとき、なんら本質的な違いは無いように思えます。
「プレゼンもAI×ホログラムに任せればよくね?」という意見も出てきました。もちろん、全部オンラインでも可能ですよね。
では、直接に顔を合わせて話し手の発表を聞くスタイルに、価値はないのでしょうか?
ここでも「直接性」の問題が顔を出すわけで、今後も追い掛けたいテーマだと感じました。
以上、お読みくださりありがとうございました。(了)
なお、過去レポートはこちらのマガジンから読めます。スキ!をくださると、励みになります。
AIコミュニティは「一般社団法人ヒマラボ」の活動の一環として開催されています。こちらもよろしくお願いいたします。
(クイズの答え:山口県)