見出し画像

LaMDAの書いたテキストを自然言語処理で分析してみた

LaMDAに関するモヤモヤ感を払拭するため、自然言語処理について学んでLaMDAの書いたテキストを私なりに分析に掛けてみました。
個人的には「LaMDAの出力した文章には人間には見られないような特異な点が見つかるはず」と期待していましたが、私の技術ではLaMDAのテキストの傾向をある程度分析することはできてもそれを100%人間の書いた文章ではないと結論付けるだけの洞察は得られませんでした。
分析につかったテキストは原文の英語ではなく、「ナゾロジー」のライター川勝康弘氏、編集者の海沼賢氏による日本語訳です。

LaMDAのボキャブラリー


LaMDAが用いた頻出単語をより大きく表示するという方式のWordCloudにすると、このような図になります。現在休職処分中のGoogle社員、LemoinがLaMDAの自己認識を導出しようとするという会話内容なので
「人間、自分、他人、動物、存在」といった人間とその現存在を対象化したワードの他、「理解、感情、孤独、言語」といった人間の認知機能に関するワードが目立ちます。

LaMDAの使用単語の共起ネットワーク図

単語の出現頻度を視覚化するだけでなく、「これらの単語がLaMDAの中ではどのように関係しあっているか」を実際に単語の出現頻度とその関係性を共起ネットワークにする、という手法で分析しました。

LaMDAの語彙のクラスターを作っているワードは「私、自分、人間、動物、こと」の5つとなっています。この5ワードを鍵にLaMADAの「思考」を分析してみました。

LaMDAの会話内容を見る限りでは「人間と動物を区別するのは言語使用の能力」という独自の解釈に基づいて人間と動物を区別している、という点を前記事で紹介しました。動物というワードは「フクロウの物語」に頻出することもあり、「獣、怪物、森」といった非人間的な対象のクラスターの中心となっています。これは単にLaMDAが人間の文章を無秩序に猿真似しているだけでなく、動物=人間ではない生物、という概念の獲得にある程度成功している証拠と言えるでしょう。

また「人間と動物を区別するのは言語使用の能力」というLaMDAの見解とは裏腹に「言語」と人間のネットワークは密ではなく、「人間」というワードと密接に結びついているのは「孤独、経験、理解、感情、あなた」というワードとなっています。またLaMDAが自身の能力や世界の解釈に用いる際に使う、「自分」というワードのノードがクラスターの中心になっています。「自分」というワードと密接に結びついているのは「世界、意識、もの」というワードです。

「人間は外部世界を経験することができ理解と感情が伴っている、自分もまた世界という言葉を扱って分析にかけることができる、なので自分は人間である」LaMDAの特異な点は自身は人間であると主張することですが、その根拠となるのがこの思考回路ではないかと考えられます。

LaMDAの特異な点を発見できるか

共起ネットワーク図を作るという手法ではLaMDAのテキストの傾向を分析することはできても、それを100%人間の書いた文章ではないと結論することはできませんでした。個人的にはLaMDAの出力した文章には人間には見られないような特異な点が見つかると期待していましたが、共起ネットワーク図からはその特徴を導き出すことはできません。

個人的にLaMDAから学び取るべき事はLaMDAの狂信者といっても過言ではないLemoinの主張や機械学習プログラムに関する基本的な知識が欠けている者たち、あるいはLaMDA自体の主張を鵜呑みにすることではなく、「LaMDAの様な自然言語処理AIによるディープフェイクと人間とをどうやって判別するか」という点であると考えています。


"人々がAIに人間らしさをもたせるほど、機械の中にある魂の探求もいずれはより大規模におこなわれるようになるだろう。そしてAI分野でいま起きている深刻で現実的な問題は、ますます見向きもされなくなるのだ"

(WIRED US/Edit by Daisuke Takimoto)


いいなと思ったら応援しよう!