11月のChatGPTが驚くべく進化！だが…

2024年11月25日 15:19

AIの検証に夢中になりすぎて、最近は休日も新しいモデルのテストばかりしているKey君です。正直、Claudeからは「また？」と呆れられる日々です（笑）。
皆さん、最近のAIの進化に追いつくのが大変じゃないですか？特に創作分野では、新しいモデルが出るたびに「これは使えるかも！」と期待したり、「やっぱりまだまだかな...」と落胆したり。この感覚、私だけでしょうか？
実は先日、OpenAIが新しいモデル「gpt-4o-2024-11-20」をリリースしたんです。クリエイティブライティングの能力が向上したらしいという噂を聞いて、またしても検証魔が目覚めてしまいました（笑）。

アップデートの概要

まず、基本的な情報を整理しておきましょう：

11月20日：新モデル「gpt-4o-2024-11-20」がAPI限定でリリース
11月23日：ChatGPTのWeb版（有料ユーザー限定）にも実装
特徴：創作能力の大幅な向上（特に小説や記事執筆など）

余談ですが、ChatGPTのWeb版では具体的にどの4oモデルが使われているのか明示されていないんです。私も「ブラインドテスト」に結構な時間を費やしてしまいました。でも、そのおかげで面白い発見があったんです。
AIの進化は日進月歩。でも、その進化が本当に私たち創作者にとって「役立つ」ものなのか、それとも単なる「数値上の向上」なのか。これを見極めるには、実際に使ってみて、細かく検証するしかありません。
それでは、具体的な検証結果を見ていきましょう...

創作能力の検証結果

まずは本題の創作能力について。私の「小説特化型ベンチマーク」で検証してみました（この基準については、以前の記事でも詳しく書いています）。

アイデア出し

まずはいつもの三題噺法。

最初に驚いたのが、出力される文章量の多さ。でも、量より質の変化の方が興味深かったんです。
特に印象的だったのが「テーマの活かし方」。例えば、与えられたキーワードを単なる設定としてではなく、メタファーとして解釈してくれるんですね。これって、私が三題噺を書くときにいつもやっているプロセスなんです。AIが何の指示もなくこれをやってくれたのには、正直感心してしまいました。
具体的な出力例を見てみましょう：

「ある日、国王が『雨を降らせた者に莫大な褒美を与える』」という寓話的な展開
「未来の砂漠化した地球」というSF的な世界
「砂を使った独自の楽器を作り上げる方法」という意外性のある設定

バリエーションは確かに豊かになったものの、物語としての完成度は正直まだClaudeの方が上かなという印象。まあ、ライバルの良いところは素直に認めましょう（笑）。

次は私の好きなジャンルで試してみました。

ここでの発見は、「物語の解像度が格段に上がった」ということ。例えば：

「心臓をスチームエンジンで置き換えられた元貴族の探偵」
「消えた空中都市」の謎
「蒸気仕掛けの死刑台」という小道具

「鍵仕掛けの記憶装置」を使って「まだ起こっていない未来の殺人を止める」というプロット、なんだかハリウッド映画っぽくて気に入る。
以前のGPTは単なる設定の羅列に終わることが多かったんですが、今回は全体的なコンセプトまで見えてくるものが増えました。

キャラクター構築力

ここでは適当に「シュールなニュースを追うジャーナリスト」という設定で試してみました。

面白かったのは、日本のアニメによくあるステレオタイプをしっかり理解していること。助手たちとのシュールなやり取りまで想像できるような、生き生きとした設定になっているではないでしょうか。
創作するプロセスと出力のフォーマットが最新のClaude 3.5 Sonnetに近づいているような...？これは要注目のポイントかもしれません。

本文執筆テスト

別の記事でも書きましたが、私は基本的にAIに本文を書かせることはおすすめしません。

とはいえ、モデルの性能テストとしては欠かせない項目。

そして...驚き。
「えっ、これ本当にGPTが書いたの？」
日本語の自然さが格段に向上しているんです。以前のGPTによく見られた堅苦しい表現や不自然な言い回しが減って、まるで普通の小説を読んでいるような感覚。特に：

語尾のバリエーションが豊か
読みやすい文章のリズム
映像的な描写力の向上

正直、ちょっと怖くなるレベルの進化です（笑）。

シナリオ談義

これは最近私が新しく追加したベンチマーク項目です。なぜかというと、AIの「創作理論への理解度」を測るのに最適だからです。特定の作品に依存せず、物語創作の本質について語れるか。AIの抽象化能力がわかりますね。
質問は以下です：「ラブコメにおいて、主人公二人が惹かれあう理由の説明を省くことで想像を引き出すことについて、もう少し解説して」

説明を省くことで想像を引き出す、というのは、**読者や観客に「自分だけの物語」を作る余地を与える**ということです。これにはいくつかの理由と効果があります。それを深掘りして解説します。

---

### **1. 読者や観客が「心の中で補完する」力を信じる**
- 人間は物語を読むときに、常に「自分なりの解釈」をしながら進めています。明確に語られていない部分にこそ、感情移入や想像の余地が生まれます。
- 例えば、「この二人はなぜこんなに気になるのだろう？」という問いを意識させることで、観客は心の中で自分なりの答えを探し始めます。その結果、物語が「自分だけのもの」になり、強い没入感を得られるのです。

---

### **2. 恋愛は「言葉にできない感覚」を共有するもの**
- 恋愛には、言葉や理論では説明しきれない「感覚的な部分」があります。理屈を排して感覚を描くことで、恋愛特有の曖昧さや不確かさがリアルに伝わります。
- 例えば、ラブコメにおいて二人が言葉を交わさずとも、「目が合うだけで気まずい」というシーンを見たとき、観客はその空気感から「この二人には特別な何かがある」と感じ取ります。この瞬間に**余白を埋める想像力**が働くのです。

---

### **3. 説明が少ないことで「普遍性」が生まれる**
- 登場人物の恋愛の理由を細かく説明してしまうと、その理由が「個別的」になりがちです。  
  例：  
  - 「彼女の優しさに惹かれた」→読者の中で「でも優しい人は他にもいるよね」と比較が生まれる。
  - 「彼の家族を支える姿を見て好きになった」→具体的すぎて、読者が感情移入しにくい場合もある。

- しかし、「なんとなく好き」「気づいたら惹かれていた」と描写することで、観客はそれを自分の経験や理想と結びつけて補完します。この曖昧さが普遍性を持たせ、「これ、わかる！」と強い共感を生むのです。

---

### **4.「余白」はキャラクターの奥行きを深める**
- 登場人物同士の関係性や感情を細かく言語化しないことで、キャラクターに「隠された部分」が感じられます。この隠された部分が、読者や観客にとってキャラクターを「もっと知りたい」という興味を引き出します。
- 特に恋愛では、「何を考えているかわからない」けれど「目が離せない」という緊張感が、恋のもどかしさや切なさを盛り上げます。

---

### **5. 観客が感情的に参加する余地を作る**
- 説明を省くことで、観客が物語の「一部」になる感覚を持ちやすくなります。言い換えると、観客が「恋の行方を応援したくなる」状態を作るのです。
- 例えば、二人の間に「何も言わなくても伝わる瞬間」があったとして、それを説明せずに空気感だけで描くと、観客は「この二人って本当に運命なのかも」と心の中で物語に加担します。ここで観客の感情が動くのです。

---

### **具体例で考える**
#### 説明を省いた描写：
> 二人は黙ったまま、どちらともなく同じタイミングでスプーンを手に取る。  
> カップに映る自分の顔を見て、どちらも小さく笑った。それ以上、何も言わなかった。

- ここでは、「なぜ笑ったのか」を説明していません。しかし、読者は**この二人が微妙にシンクロしている心地よさ**を想像し、「言葉にしなくても分かり合える関係性」に引き込まれます。

#### 説明しすぎた場合：
> 「あなたとこうして同じタイミングで行動していると、気が合うように感じますね」と知樹が言う。「本当に、変な偶然だよね」としずくが答える。

- この場合、情報は伝わりますが、読者に「感じる余地」を与えないため、シーンの空気が薄まります。

---

### **結論：余白が作る「魅力的な恋愛の物語」**
説明を省くことで、「空白部分」に読者の想像や感情を入り込ませる余地を与えられます。その結果、物語が個人的で、より共感しやすいものになります。
恋愛は「なぜ？」ではなく、「あの瞬間何かが起きた」という直感的な体験が核心です。この感覚を共有できる物語が、強く観客の心に残ります。

目から鱗の秀逸な答えでしたね。
以下の洞察は人間でもなかなか思いつかないです：

「自分だけの物語」を読者に作らせることの重要性
「説明の省略」が生む普遍性について
物語における「余白」の役割

これはもう、チャットボットの返答というレベルを超えています。ベテラン編集者や脚本家との対話のよう。
面白いことに、最近のClaudeは簡潔な箇条書きでの回答が多いのですが、このケースではむしろChatGPTの方が深い考察を展開してくれました。ある意味、この使い方だとChatGPTのほうが適しているかもしれません。

創造性と正確性のトレードオフ

実は、今回のアップデートで見つけた最も興味深い点は、別のところにありました。

なんと、創造性が劇的に向上した一方で、一般的なベンチマークでの評価が前回のバージョンより下がっているんです。SNSでの議論を見ていると、どうやらOpenAIが意図的に「創造性」のために「正確性」を犠牲にしているようなんです。
なぜならベンチマークには「正解」があるが、でも、創作には「正解」がない。むしろ、「正解」という概念自体が創造性を邪魔することも
つまり、「正解のある問題（推論）」と「正解のない問題（創造）」では、AIに求められる能力が根本的に異なるということ。
「正解のある問題（推論）」はo1、「正解のない問題（創造）」はGPT。
そのような役割分担になっていくかもしれません。
私は推論をあまりしないのでどんどん創造力を上げてほしい（笑）。

終わりに

今回のアップデートでGPT4.5やGPT5への期待は高まりました。
また、創造性と正確性はAIにとってトレードオフというのが面白い発見でした。
人間もそう言えるかもしれない。ひたすら正解を求めると、つまらなくなる。
たまには「不正解」を抱くのがどうでしょうか？

#ChatGPT
#AIライティング
 #GPT4o
#AI創作
 #プロンプト
 #プロンプトエンジニア