見出し画像

大規模言語モデルは人間レベルの物語を生成できるのか?

近年、人工知能(AI)の進化に伴い、大規模言語モデル(LLM)がさまざまな分野で活用されています。特に、自然言語処理の分野では、GPT-4やClaudeなどのLLMが人間のような文章を生成する能力を持つとされてきました。しかし、これらのモデルが本当に人間レベルの物語を生成できるのかについては、まだ議論の余地があります。今回は、その能力を検証するための研究を紹介します。

【論文】
Are Large Language Models Capable of Generating Human-Level Narratives? (大規模言語モデルは人間レベルの物語を生成できるのか?)



1. 研究の目的と背景

物語の生成は、単なる言葉の組み合わせではなく、物語の構造、感情の流れ、そして読者に伝えるメッセージが重要です。人間は、物語を通じて感情を伝え、複雑なメッセージを共有することができます。これに対して、LLMはどの程度まで人間の物語生成能力に近づいているのでしょうか。この研究では、LLMが物語を生成する際にどのような問題があるのか、またどのように改善できるのかを探ることを目的としています。


2. 研究方法と分析フレームワーク

研究では、新しい計算フレームワークを用いて、物語を以下の三つのレベルで分析しました。

  1. ストーリーアーク(Story Arcs): 物語の主人公が辿る一連の変化や進展を描く。物語の始まりから終わりまでの流れを示し、典型的なアークには「灰かぶり姫(Rags to Riches)」や「イカロス(Icarus)」などが含まれる。

  2. 転換点(Turning Points): 物語の中で重要な変化が起こるポイント。例えば、「計画の変更」や「重大な挫折」など、プロットにおいて重要な役割を果たす。

  3. 感情的次元(Affective Dimensions): 物語の中で表現される感情の強度やポジティブ・ネガティブの度合い。これにより、物語が読者に与える感情的な影響を評価します。


3. LLMと人間の物語生成の比較

この研究では、LLM(特にGPT-4)と人間が書いた物語の比較が行われました。主な発見として、以下の点が挙げられます。

  1. 物語の進行とテンポの違い: LLMが生成した物語は、重要な転換点(例えば、クライマックスや大きな挫折)が通常より早い段階で出現する傾向があり、これが物語全体のテンポを乱す原因となっています。この結果、物語が平坦で緊張感に欠けるものになりがちです。

  2. 感情的な深みの欠如: 人間の書く物語に比べて、LLMの生成する物語は感情的な強度が低く、特に後半になるとその差が顕著になります。人間の物語は、感情の起伏を持ち、読者を引き込む力が強いのに対し、LLMの物語は一貫してポジティブで、感情的な多様性が欠如しています。

  3. 物語構造のバリエーションの不足: 人間の物語には様々な結末やプロットの進行パターンがありますが、LLMは主にポジティブな結末を選びがちです。例えば、「灰かぶり姫」のような逆境から成功への物語が多く生成される一方で、「イカロス」や「オイディプス」のようなネガティブな結末を含む物語はほとんど見られません。


4. 改善のためのアプローチ

この研究では、LLMの物語生成能力を向上させるために、いくつかのアプローチが試みられました。

  1. 談話要素の統合: 物語の生成において、ストーリーアークや転換点などの談話要素を明示的に取り入れることで、物語の多様性やサスペンス性が向上することが確認されました。具体的には、プロットの構造や感情的な要素を含むプロンプトを与えることで、LLMの生成する物語がより人間らしいものになることが示されました。

  2. テンポと感情のバランス: 特にクライマックスや挫折の部分において、感情的な強度を持たせることで、物語全体のテンポと感情のバランスが改善されました。


5. 結論と今後の展望

今回の研究では、LLMが人間レベルの物語を生成するにはまだ課題が多いことが明らかになりました。しかし、談話要素を統合することで、これらのモデルが生成する物語の質を向上させる可能性が示されました。今後の研究では、さらに多様な言語や文化的背景を考慮に入れたモデルの開発が期待されます。また、人間とAIの協働による創造的な物語生成の可能性も探求されるべきです。これにより、AIがどのように人間の創造性を補完し、新しい形の物語を生み出すことができるかが明らかになるでしょう。

以上のように、大規模言語モデルはまだ発展途上にあるものの、その可能性は非常に高く、今後の研究と技術の進化が楽しみです。


今回、LLMを使用して小説を書く際に役立つと思われる論文を発見したので、自作GPTsの「記事・論文解説」を使用して、論文の内容を基にしたブログ記事を作成してもらいました。

この論文で指摘されているLLMの生成する物語の欠点は、筆者がLLMで小説を書く際に日頃から感じている以下のような課題とかなり一致していました。

  1. ストーリーの進行を急ぎすぎてあらすじのような深みのない物語になってしまう。

  2. 登場人物の感情の動きが少なく、ポジティブすぎて、悩みが少ないか、すぐに悩みが解決してしまい、カタルシスが得られない。

  3. ポジティブで優等生的なワンパターンの結末になることが多く、物語の面白みに欠ける。

なお、LLMの作り出すキャラクターがポジティブすぎたり、物語の結末がポジティブで平和的になり過ぎるのは、LLM固有の問題というより、アライメントによる強制(矯正)の結果だと思っています。

また、論文の示す改善のためのアプローチも、筆者が今まで採用してきた手法と近い部分がありました。

  1. ストーリーをゆっくり進行するようにプロンプトで指示する。

  2. 登場人物の感情の動きを詳しく描写するようにプロンプトで指示する。

  3. 最初にプロット(アウトライン)の作成を指示し、そのプロットを基にして本文を作成させる。また、プロット作成の際に、三幕構成や「SAVE THE CATの法則」などの有名なシナリオ作成術を踏まえて作成するように指示する。

一方で、ポジティブすぎるワンパターンの結末になりがちという点については、まだ上手い解決法が見つかっていません。

この記事が気に入ったらサポートをしてみませんか?