見出し画像

AIの言葉、私の言葉––いま、生成する前に立ち止まる


はじめに

こんにちは。メディア研究開発センターの浦川です。

この記事は、私にとって2024年最後の投稿記事になるでしょう。そこで、まずはこの一年を個人的に振り返るところから始めたいと思います。

今年は『AIは短歌をどう詠むか』の執筆に始まり、テキスト平易化データセット「SJNC」の研究発表および公開、短歌の生成および鑑賞に関する研究発表、『どう詠むか』刊行に伴う関連イベント登壇やメディア出演、水戸芸術館における作品展示への技術協力、さらにはSIGGRAPH ASIA TOKYO 2024での新たなシステムの発表など、例年以上に多いアウトプットに恵まれた1年でした。これらの仕事を通じて、たくさんの方々の協力に支えられたことを改めて感じています。みなさまに、心より感謝いたします。

羽根田賢和, 浦川通, 田口雄哉, 田森秀明, 坂口慶祐. RLHF を用いた「面白い」短歌の自動生成の試み. 言語処理学会第30回年次大会 (NLP2024), P11-26, pp. 3315-3320, March 2024.

加藤真大, 持橋大地, 浦川通, 新妻 巧朗 田口 雄哉, 田森 秀明. 文埋め込みに基づく朝日歌壇短歌の分析. 第135回 人文科学とコンピュータ研究発表会, May 2024.

より大きな問いに直面して

私は、2019年の夏に自然言語処理の研究を始めました。ちょうど大規模言語モデル(LLM)登場前夜、といえるでしょうか。

それから五年が経ち、特にこの一年で感じたのは「言語モデルの発展とともに、私たちが向き合う問いの形も大きく変化している」ということです。

『 AIは短歌をどう詠むか』は、そのタイトルの通り、言語モデルがどのように短歌を生成するか、について主に書いた本です。これを起点として、最近の鼎談では「LLMが日常生活にあるいま、短歌の創作におけるAI応用の是非を超えて、どんな向き合い方があるか」「なぜAIと人は短歌を詠むのか」という一歩進んだ議論を展開しています(その模様は、12月20日(土)発売の『短歌研究』2025年1月・2月合併号に掲載されています)。

水戸芸術館の展示では、LLMが抱える問題であるハルシネーションを人間の創造性との関連で捉え直し、これをテーマにした物語の生成を試みました。

先日開催のSIGGRAPH ASIA TOKYO 2024では、LLMを用いてラップバトルの形で議論を生成するシステムを発表しています。単にエンターテインメントとしての面白さを提供するだけでなく、SNSなどでの意見の分断が叫ばれて久しい現在の社会で、「あらゆる世代の人が、自分の意見を持つキッカケとなることを目指し」制作したものです。

LLM登場以前のこれまでであれば、「どう短歌をつくるか」「どう物語を生成するか」「どうラップさせるか」の「どう」に取り組むモデルや手法を考えることが、こういった研究開発の大部分を占めていたように思います。

しかし、いまや「〈短歌を/物語を/ラップを〉生成して」とLLMにお願いさえすれば、ひとまずはなんとなく(あるいはとても高い精度で)所望のものが得られる、そんな世の中になりました。

こうした背景から、そもそも「生成すること」にどんな意味や意義があるか、それが実社会でどんな発見や利点を生むか、その限界や倫理的課題をどう扱うべきかといった視点が、これまで以上に重要で切実なものになってきていると感じています。

言葉そのものの精度だけでなく、なぜ言葉を生成するのか、それが生活、社会、文化とどう関わるのか――そうしたより大きな問いに直面しているといってもよいでしょう。

言葉と生きること

そんな一年を過ごすなかで、つい先日、哲学者・倫理学者の古田徹也さんと対談する機会がありました。この対談の詳細については省略しますが、私はここで「言葉を発することへの勇気」と「しっくりくる言葉を探すことは、生きることそのものに近いのでは」という話をしました。

自分だけが持っている、あたらしい言葉を発すること。これは、みんなが言っていることとは形の異なる、一般的な枠組みや慣習から外れた言葉を放つ行為と言えます。古田さんの著書では、言葉を習得することは、その「伝統へと入っていく」ことでもある、と説いています。

伝統には、他者と通じ合うために必要な共通の感覚や価値観もあれば、歴史の中で形づくられてきた差別・偏見や固定観念も含まれています。これはLLMの持つ偏見といった話とも、そのまま通じます。

社会の一般的な分布から外れた言葉を発するには「勇気」がいる。しかしそれでも、と放たれた言葉が、その人自身を形づくり、その人を含む社会の未来をつくる。これはすなわち「どう生きるか」という問いそのものではないでしょうかそうやって「言葉を発すること=生きること」と捉えたとき、AIの生成する言葉もまた、私たちの生に関与し、影響を与えるものであるということが見えてきます。それは単なる技術的な出力ではなく、私たちの過去を抱え、未来に対する問いや可能性を宿す〈生きた存在〉といえるでしょう。

ちょうど、そんなことを考えていたとき。NeurIPS2024における招待講演にて、特定の国籍を持つ人々に対して「有害なステレオタイプを助長する("perpetuated harmful stereotypes")」とされる発表が行われる、という事態が発生しました。

世界中の研究者が集うAI研究のトップ会議において起きた事案であることを考えると、この問題の根深さを無視することはできません。強い非難とともに、「なぜ起きてしまったのか」「防ぐことができなかったのか」という問いが投げかけられています。

そしてこの出来事は、私たちにとっても決して他人事ではありません。日常生活の中で、人種・性・地域・国籍・伝統的な社会構造やその背景にある固定観念・差別・偏見を再生産してしまうことや、そうした場面に遭遇することがあります。その度に、自身が過去の価値観を引き継ぎながら、その構造を維持・強化する可能性を持った社会の一員そのものであること、そして自身の発する言葉の責任の重さを思い知らされます。

と、表面的かつ一般的なことを述べてみても、この程度の内容であればLLMでも簡単に生成できます。上記は個人の責任を果たしているとは言えないテキストであり、いまや瞬時に得られるものの一つでしかありません。「AIだって言えるよ」というやりとりは、すでに一般的なものになりつつあるのではないでしょうか。

このように、私たち自身の生にも他者の生にも深く関わる〈言葉〉。これを巧みに扱うLLMの利用およびその研究は、単なる技術の探求にとどまらず、「よく生きること」そのものとも深くつながっているのではないか。そういった思いを強くし、私自身、改めて自分の言葉を、そしてAIの生成する言葉の利用を省みる必要を感じます。

一度立ち止まって

この一年、「なぜ自然言語処理の研究を始めたのですか」と、その原点を尋ねられる機会が多くありました。私はその都度、自分のこれまでの時間を振り返って、万葉集に収められた「春すぎて夏来るらし白妙の衣干したり天香具山」という和歌との出会いを話します。

この歌を文字にしてしまえば、ただ素直に「春が過ぎて、夏が来たのだな。香具山に白い布が干してある」と述べているだけのように見えます。しかしこの言葉の連なりが、かつて季節の移ろいを肌で感じた私自身の体験と重なりあって〈生きたもの〉として感じられました。「かつて誰かが、確かにその時間を生きていた」。その事実に共鳴する、つまるところ〈この世界で生きることの喜び〉に胸がくすぐられる、そんな経験です。それがいま、私が言葉を仕事にしている大きなきっかけの一つとなっています。

AIの言葉は、過去につくられた大量のデータを学習することで得られます。これを利用することは、「私以外の誰かが生きていた時間」を一時的に借りて、そこに込められた知識や感性を取り入れる行為といえるかもしれません。

そのなかには、私にはなかった新しい発想との出会いもあれば、過去から続く価値観をそのままなぞる可能性までもが含まれます。そんなAIの言葉を、どこまで「いま私たちが確かに生きている時間」と溶け合うものにできるか。過去を超えて〈生きることの喜び〉が感じられる未来につながるものにできるか。それは、私たち自身の想像力、創造性、そして倫理を問うものではないでしょうか。

AIが、私が新たな言葉を生成する前に、ここで一度立ち止まって、考えたい問題です。

おわりに

この記事を書く前には、いま進めている別の研究について紹介するつもりでいました。しかし、この一年を振り返ってみると、今日書いたようなことを書かなくては、と感じずにはいられなくなってしまいました。

LLMの生成を待つ前に、いま自分たちが使う言葉とどのように向き合うべきかについて、改めて考えたい。言葉は私たちの過去を映すものであると同時に、未来をつくる力を持つ。LLMがその力を増す一方で、私たちの責任もまた広がり続けていくことでしょう。

AIが生み出す言葉が、この世界に生きる生身の私の言葉とつながりはじめている。その力強さと脆さのどちらをも見つめながら、安易な希望を抱かずに、あっさりと絶望することもなく、考え続ける。そんなことを思いながら、新しい年を迎えます。

(メディア研究開発センター・浦川通)

カバー画像
Hermes and Athena (?)
Anonymous, German, 19th century German
1750–1850
https://www.metmuseum.org/art/collection/search/387893