ChatGPT: その内部動作となぜそれがうまくいくのか
カドカワの川上会長が注目した「What Is ChatGPT Doing … and Why Does It Work?」というエッセーをノンプログラマにもわかりやすいようにGPT-4に解説してもらいました。
GPTの仕組み:一語ずつ追加
ChatGPTは、人間が書いたテキストを模倣する能力により、自動的に文章を生成することができます。しかし、その仕組みはどのようなものでしょうか?基本的に、ChatGPTはあるテキストに対して「理にかなった続き」を生成しようとするものです。それは「何億ものウェブページなどで人々が書いていることを見た後に、誰かが書きそうなもの」という意味で「理にかなった」ものです。
チャットGPTの基本的な動作
GPTの最初の特性は、ある文脈に対して「妥当な続き」を生成しようとすることです。これは、人々が何十億ものウェブページで書いてきたものを基に、「次に何を書くだろう」と予想するという意味です。具体的には、GPTはテキストの「意味」をマッチさせ、次に続く可能性のある単語を確率付きでリストアップします。
ニューラルネットワーク:言葉の選択
ChatGPTが次に追加する単語を選ぶためには、ニューラルネットワークというものを利用します。このニューラルネットワークは言葉の「意味」を理解するためのモデルで、ある単語の次にどの単語が来る可能性があるかを予測します。
ランダム性と「温度」の役割
しかし、GPTが単語を選択する際には、ある種のランダム性が作用します。常に確率が最も高い単語を選ぶと、出力は平坦で創造性に欠け、時には同じ単語を繰り返します。そのため、ランダムにランクが低い単語を選ぶことで、「もっと興味深い」テキストを生成します。このランダム性は「温度」というパラメータで制御され、エッセイの生成には「温度」0.8が最適とされています。
異なるテキストの生成
ランダムに「非トップ」の単語を選択することで、GPTはさまざまなテキストを生成できます。同じプロンプトでも、選択される単語がランダムに変わるため、出力されるテキストも毎回異なります。
ユーザーの理解度と関心を導く:ChatGPTの対話戦略
これは、「What Is ChatGPT Doing … and Why Does It Work?」に記載されていたものでは無いのですが、GPT-4が補足として説明してくれたものなのでここに追加で掲載しておきます。
なお、小学生にもわかるようにChatGPTの仕組みを教えてくれた文章をまとめたものもありますのでこちらも併せてご覧ください↓
この記事が気に入ったらサポートをしてみませんか?