1. 「きしゃのきしゃがきしゃできしゃした」とは
言葉あそびではない
「きしゃのきしゃがきしゃできしゃした」という文は、一見すると言葉遊びや早口言葉のように見えるかもしれません。しかし、この文は1980年代のワードプロセッサ開発において、日本語の同音異義語を正確に漢字変換するための重要な研究材料でした。当時のエンジニアたちにとって、この文は単なる言葉遊びではなく、日本語処理技術の重要な課題を象徴する存在だったのです。ただ、生成AIの時代になり、「きしゃのきしゃがきしゃできしゃした」をプロンプトに含めて入力すると、「この言葉遊びは・・・」は云々と回答されるのです。
同音異義語の代表例としての価値
日本語には多くの同音異義語が存在しますが、この文が特に価値を持つ理由が3つあります。第一に、「きしゃ」という4文字の同音異義語が一文中に4回出現し、それぞれが異なる意味を持つという極めて稀な例であること。第二に、それぞれの「きしゃ」が文脈によって一意に定まり、暗昧性を持たないこと。第三に、ワープロ開発者たちがこの文を通じて、文脈に基づく自然言語処理の基礎的な手法を確立できたことです。特に、文末から文頭へと遡って解析を行うという手法は、その後の日本語処理技術の発展に大きな影響を与えました。
正解の漢字変換「貴社の記者が汽車で帰社した」
この文の正しい漢字変換は「貴社の記者が汽車で帰社した」です。一つ一つの「きしゃ」を見ていくと、以下のような意味を持ちます:
この変換結果に至るためには、文の構造や文脈を正確に理解する必要があります。ワープロ開発者たちは、この課題に対して文末の動詞から解析を始め、徐々に前の語句を確定させていく手法を確立しました。
このように、一見単純に見えるこの文は、日本語処理における重要な研究対象であり、現代の生成AIにとっても興味深いテストケースとなっています。
2. ワープロはどう解決したか
かな漢字変換の仕組み
ワードプロセッサのかな漢字変換システムは、入力された仮名文字を適切な漢字に変換するという、一見単純な作業を行います。しかし、日本語特有の同音異義語の存在により、この作業は極めて複雑なものとなります。基本的な変換システムは、入力された文字列に対して可能性のある漢字候補をすべて列挙し、その中から最適なものを選び出すという処理を行います。
しかし、「きしゃのきしゃがきしゃできしゃした」のような文では、単純な候補の列挙だけでは正確な変換は不可能です。そこでワープロ開発者たちは、文の構造を理解し、文脈に基づいて適切な漢字を選択するロジックを開発しました。
文脈に基づく変換のロジック
1. 述語の確定
最初のステップは、文末の述語を確定させることです。「きしゃした」という表現は、一般的な動詞の活用パターンから「帰社した」であることが(人間なら)推測できます。「帰社」は「会社に戻る」という意味を持つ動詞であり、この例文における述語として確定したことになります。この判断が以降の解析の基礎となります。
2. 主語の推論
述語が「帰社した」と確定したことで、その主体を表す「きしゃ」は人物であることが推測できます。新聞社などのメディア関連の文脈を想定できることから、この「きしゃ」は「記者」である可能性が最も高いと判断されます。
3. 前後関係の判断
「記者」が確定したことで、その所属先を示す最初の「きしゃ」は「貴社」であることが文脈から判断できます。また、移動手段を表す「きしゃで」の部分は、当時の社会的背景から「汽車で」が最も自然な解釈となります。
4. 最終的な漢字決定
これらの解析結果を統合することで、最終的に「貴社の記者が汽車で帰社した」という正しい漢字変換が完成します。この変換プロセスは、以下のような文の構造理解に基づいています。
きしゃのきしゃがきしゃで 帰社 した(はじめに述語を確定させる)
きしゃの 記者 がきしゃで 帰社 した(確定した述語から主語を推論する)
貴社 の 記者 がきしゃで 帰社 した(汽車の記者がとはならないので、貴社の記者がで確定する)
貴社 の 記者 が 汽車 で 帰社 した(必然的に汽車でとなる)
このように、ワープロの漢字変換システムは、単なる文字の置き換えではなく、文の構造や文脈を理解した上で適切な漢字を選択するという、当時としては高度な言語処理を実現していました。この技術は、現代の日本語処理システムの基礎となっています。
3. 生成AIの解釈
テスト方法
ワープロ開発者たちが解決した「きしゃのきしゃがきしゃできしゃした」という文を、各生成AIに漢字変換するようにリクエストします。正解が得られなければ、プロンプトを修正してトライアンドエラーを続けて行きます。
プロンプト
ChatGPT-o4 miniの回答
Microsoft Copilotの回答
Google Geminiの回答
Claude 3.5 sonnet(New)の回答
生成AIの解釈における総評
この結果からでは各生成AIが「きしゃのきしゃがきしゃできしゃした」を漢字変化するのかを推論することは到底無理なことです。「汽車」、「記者」、「帰社」を特定できていることはお見事ですが、残念な結果であり、どの生成AIも落第です。Geminiに至っては、私の質問の意図を理解していないどころか、自身の考えをユーザーに押し付ける有り様です。
生成AIはかな漢字変換システムではないので、この結果はいたし方ないのかもしれませんが、途方もない量のデータを学んできたのなら回答を丸暗記していてもおかしないはず。ちょっと期待していたが故に残念です。
4.生成AIに推論プロセスを提示する
単に漢字変換してくださいとだけプロンプトを与えても、生成AIは正しく回答できないことがわかりました。ここからトライアンドエラーです。
1回目のプロンプト
ChatGPT-o4 miniの回答
【カッコ内は私のコメントです】
Microsoft Copilotの回答
【カッコ内は私のコメントです】
Google Geminiの回答
【カッコ内は私のコメントです】
Claude 3.5 sonnet(New)の回答
【カッコ内は私のコメントです】
ChatGPTとCopilotは途中の推論プロセスが少し違いましたが、同じ結論に至りました。Geminiの理解は他の生成AIに遠く及ばずで、原文が意味不明と主張。Claudeは一番最初の「きしゃの」を所有格とまで認識できています。惜しい、実に惜しいです。
プロンプトエンジニアリングとかプロンプトエンジニア等の用語があるとおり、プロンプトを与える側、つまりの私のプロンプトに問題があるのかもしれません。ここで一旦プロンプトを再考してみます。
3回目のプロンプト
プロンプトを修正しながら、3回目のプロンプトで2つの生成AIから正しい回答を得ました。
ChatGPT-o4 miniの回答
Microsoft Copilotの回答
Geminiの回答
Claude 3.5 sonnet(New)の回答
ChatGPTとClaudeが見事に正解してくれました。特にClaudeは常々できる子と思ってましたが、期待に応えてくれて嬉しいです。
ではまた。