ChatGPTの衝撃と注意点
トクイテンの森です。トラブル含めて充実の日々を過ごしておりますが、今日はこの一週間、AI界隈ではこの話題で持ちきりと言って良い流行を追いかけたいと思います。
ChatGPT
OpenAI社が公開した対話AIであるChatGPTは、伝統的なElizaの流れを組むチャットボットで、なにか言いたいこと、聞きたいことを入力すると、返事を返してくれるシステムです。このシステムが一線を隠すのはその返事のリアリティです。込み入った相談事などを入れても、かなりそれらしい返答を返してくれたりして、twitterではChatGPT大喜利といった様相で、様々なことが試されています。
画像生成AIもかなりの衝撃でしたが、これは更に高い汎用性で衝撃を与えてくれました。
ChatGPTの内側
ChatGPTのWebページで説明している手法の特徴としては、GPT3.5と呼ばれる大規模な言語モデル(とにかく、文章を与えると続きを予測するように学習した基盤的なモデル)に基づいた、Reinforcement learning from human feedback (RLHF)つまり、「人間のフィードバックからの強化学習」であるとのことで、以下のような手順で学習を行います。
事前に学習させた基盤モデルGPT3.5を利用したモデルを作った上で、人間同士の対話データを使って教師あり学習により、回答の生成をする対話モデルを学習する
報酬と罰を元に行動を最適化する「強化学習」により学習するため「報酬モデル」を作成する。モデルが返してきた複数の回答(モデル内部に確率的な振る舞いを仕込んでいるので、複数の異なる回答ができる)を人間の評価者が回答のランキングを行い、そのランキングを「報酬」とするため、その報酬を予測するようなモデルを作る。ここでは、回答の「良し悪し」は分かるがどのような回答をすべきかの「方策」は分からない状態。
様々な入力から、上記モデルにより生成された回答から人間が感じるであろう回答の良さを予測して(報酬予測)、その良さが向上するように、対話モデルを「調教」する。
以上により、人間のフィードバックがあることで継続的な改善が可能で、実際に改善を進めているとのことです。ChatGPTでは回答の右側に👍👎ボタンがあるのでこのフィードバックを利用してさらに学習するのでしょう。あな恐ろしや。
初手はAIでOK?
ChatGPTは、どうやら、プログラミングに関する話題には強いようです。プログラミングに関するQandAを行うサイトのデータを学習データにしていたのかもしれません。
私が試した例では、私が大学で所属している研究室で学生に出される「サインカーブをリカレントネットワークに学習させる課題をpytorchで書いてください」とお題を出したところ、t時刻の入力を入れるとt+1時刻の値を返すという意図通りのプログラムを作成してきました。
また、ROSで画像をやり取りするプログラムを書いてほしいとリクエストしたら書いてくれました。ここまで来ると、なにか定型的なプログラムを作りたければ初手AIでOKかなという気分になってきます。
一般的な話題にもついてきます。
弊社の広報担当が試した弊社ロボットのキャッチコピー案です。
むかし、博士課程の学生時代に学生同士の研究会のテーマを決めたいという会議で、思いつく複数単語を即席のプログラムに入力して、ランダムに「〇〇の△△」というお題を作りまくって、面白そうな文字列にそれらしいテーマ概要を書いたのを思い出しましたが、今ならAIでやるかもしれません。
共同創業者の豊吉がChatGPTにこのことについて聞いてみると、注意点を指摘されてしまいました。
ChatGPTにはAIには難しいとされた「常識」が刷り込まれているのかもしれません…
AIの回答にはご注意を
ただし、正しいことを言っているかは要確認です。以下のような知識を問うような質問をすると文章の整合性があるだけで内容はでたらめな回答を出してきます。わからないことは分からないと言ってくれたほうが誠実だし、そう返答する場合もあるのが面白いところですが、勝手な情報を入れて無理やり答えを出そうとしている場合も多いと感じます。
上の答えから早稲田実也という人物が本当にいるのかどうか、数分ググってしまいましたがいませんでした。お騒がせもいいところです…。結局はその分野の知識がそれなりにある中で、思考の省力化を進める分には問題は少ないけれど、新しい分野の勉強をする場合には非常に慎重に使わないといけないということです。むしろ使わない方が得策かもしれません。定評のある教科書やメディアなどの情報源を使いましょう。
AI大喜利!?
その他ネット上では様々な試みを行っている方々がおられますが、そのどれもに驚かされます。
以上の対話をまとめています。
ここまで汎用性が高く便利だと、ユーザーをAI漬けにしてから課金制になったり、しれっと広告を混ぜてくるようになるかもしれません。どうなんでしょうかね…。
まとめ
ChatGPTは本当に多岐にわたる問いかけに(正誤は別にして)それらしい回答を返してきますし、無茶な要求にも答えてきます。もしかすると、過去の検索ボックスへの入力に縛られている感覚では対話AIの魅力を十分には引き出してはいないのかもしれません。
気をつけるべき点が多いにしても、画像生成AI同様に、まずは活用方法を模索していくことになりそうです。
参考資料
この記事が気に入ったらサポートをしてみませんか?