ChatGPT（生成AI）の仕組み【超簡単に解説】

服部貞昭

2024年4月24日 12:15

ChatGPT（生成AI）が大人気で盛り上がっていますね。

ピザの作り方を答えてくれたり、ビジネスの企画書を作ってくれたりと、たいていの文章は何でも作ってくれます。
子供も宿題をするときChatGPTを使うみたいですね（良いか悪いかは別として）。

ChatGPTも、最初は変な文章が多かったですが、GPT-4がリリースされてから、文章や回答の質が格段によくなりました。
文章を書くのが苦手な人間よりは、よほど上手い文章を書いてきますね。

ChatGPT（生成AI）が、すらすら文章を書くのを見ると、まるで人間のように考えて書いているように感じるかもしれません。

でも、実は、ChatGPTは考えてなんかいません、ただ次に続く文章を予測して生成しているだけなのです。だから「生成AI」と呼ばれています。

生成AIが文章を回答する仕組み

簡単な文章を基に、ごく簡単に生成AIの仕組みを説明します
（厳密には異なる部分があることはご了承ください）。

ここで、「生成AI」の定義について確認しておきます。
人によって「AI」「生成AI」という言葉が指している意味が異なったりしますが、
ここでは、従来の統計的な機械学習だけによるものを「従来のAI」、近年のディープラーニング（深層学習）も取り入れたものを「生成AI」と呼ぶことにします。

厳密な説明をすると長くなりますので、「従来のAI」は今まであったAI
、「生成AI」はChatGPTのように最近出てきたAIだと思ってください。

まずは、従来のAIが文章を生成する仕組みについて解説します。

従来のAIの文章生成の仕組み

たとえば、次のような文章があるとします。

今日はよく晴れていますので、子供が外で、〇〇〇。

AIは、上の文章の「〇〇〇」の部分を予測します。
ただし、人間と違って、AIは、晴れていることや、子どもたちが外で何かをしている状況を思い浮かべながら予測するわけではありません。

「今日はよく晴れていますので、子供が外で、」という文章に続く、もっともらしい単語（文章）を、今まで学習したあらゆる単語の中から確率的に求めています。
たとえば、こんな感じです。

遊んでいます　（確率95%）
楽しんでいます　（確率30%）
水遊びをしています　（確率20%）
走っています　（確率15%）
寝ています　（確率2%）
悲しんでいます　（確率1%）

「晴れて」「子供が」「外で」という単語群ともっとも相関性が高いのは、おそらく「遊ぶ」になるでしょう。
「子供が外で遊ぶ」という表現は、書籍やネットなど多くの文章に登場するからです。

（厳密には、単語との相関性だけでなく、単語の順番や、「遊んでいます」の次に続く文章との関連性なども考慮して予測しています。）

「子供が外で楽しむ」も間違いではありませんが、「子供が外で遊ぶ」よりは登場する数が少ないため、第1候補にはなりませんでした。
もし、「遊んでいます」ではない別の表現をしてくださいと依頼すれば、生成AIは、こんどは第2候補である「楽しんでいます」と回答するかもしれません。

ここで、さきほどの文章に、場所の情報を加えてみましょう。

ここは海辺です。今日はよく晴れていますので、子供が外で、〇〇〇。

そうすると「海辺で」という情報が加わり、「海辺で」「晴れて」「子供が」「外で」ともっとも相関性が高い単語を予測すると、「海水浴をしています」になるでしょう。

このように、AIは、与えられた文章に含まれる単語（情報）を基に、今まで学習したあらゆる単語の中から、その文章に続くもっとも相関性の高い単語を予測して回答しているのです。

なので、できるだけ具体的な情報を与えてあげたほうが、ユーザーが期待する回答に、より近づきます。

生成AIの文章生成の仕組み

ここからは、ChatGPTのような最近出てきた「生成AI」が文章を生成する仕組みについてです。

基本的には、従来のAIと仕組みは変わりません。

違うのは、今までに学習していない表現も作り出せるということです。
たとえば、こんな文章です。

今日はよく晴れていますので、子供が外で、サバイバルゲームをして遊んでいます。

「子供が外で、サバイバルゲームをして遊んでいます」という表現は、書籍やネットを見てもおそらくほとんど登場しないでしょう。

ただ、「遊ぶ」という単語に注目するなら「サバイバルゲーム」が登場してもおかしくはありません。実際、日本でサバイバルゲームをプレーする人は、過去10年くらいで比較すると増加しているようです。

「子供が外で遊ぶ」という当たり前の表現に慣れきってしまった人には思いつかないような、斬新な組み合わせの文章を、生成AIは考えてくれます。

子供の新たな遊びを探している人にとっては、良いアイデア出しの機会となるでしょう。

一方で学校の先生のように、子供たちに危険そうな遊びはしてほしくないと思っている人にとっては、ちょっと行き過ぎた表現に感じるかもしれません。

そこで、ChatGPT（生成AI）には、想像豊かな表現にするか、安定した表現にするかを選べるようなパラメータがあり、ユーザーがそれを調整することが可能です。
（通常のChatGPTのWEBインタフェースではできませんが、Playgroundでできます。）

実際のところ、ChatGPTのように大勢の人に利用される生成AIは、人を傷つけたり、倫理・道徳的な問題が発生しないように、最初から無難な表現になるようにチューニングされていますので、奇想天外な表現はあまりしないと思います。人によっては、ちょっと物足りないと感じるかもしれません。

近い将来、小説に特化した生成AIのように、各分野の生成AIが登場すれば、もっといろいろな表現をできるようになるでしょう。

まとめ

ChatGPT（生成AI）の仕組みについて、ごく簡単に解説しました。

生成AIは人間のように考えて回答しているわけではなく、今まで学習した情報を基に、ある文章に続くもっともらしい単語（文章）を予測して、生成しています。

この仕組みを知っていると、ChatGPTに対してより良い形で質問ができるようになり、期待した回答を得やすくなります。

質問文の書き方については、また別に書いてみたいと思います。