限界をよく理解して、用法容量を守ってお使いください。という意味で、まだお薬に近い。薬剤師さん欲しい。APIやPlug-Inは試していないので、Webベースのことに限定する。
2021年9月問題
ChatGPTのデータセットは、最新が2021年9月まで。
ChatGPTのデータセットは、最新が2021年9月まで。このため、それよりも新しい情報をもとに何かをして欲しいときは、それは不可能。
例えばAIについてChatGPTに聞いてみるというのは良いのだが、例えば2022年に発表された論文の情報は入っていないはずなので、回答が本当に現時点のBest Practice かは誰も保証できない。
これは、最新の情報に、というのもそうだが、単純なところで「今何時?」というのにも答えることができない。
ちなみに、「今何時?」と聞くと、なんとか日付は出てくるのだが、少なくとも日本時間ではない。GMTなのか、アメリカのどこかの時間なのかは不明。前に私が話したコンテキストの日付を入れてくることはある。
逆にいうと、2021年段階で、枯れた問題に対する一般的な知見というものにアクセスするなら、まともな情報で返ってくる可能性が高い。
外部への情報アクセスができない
例えば要約することを求めて、ChatGPTに外部のソースにアクセスして、何かをして欲しいということはできない。外部のソース(URL)もダメ出し、PDFファイルなどをアップロードしてみてもらう、ということもできない。できることは、プロンプト内にテキストで書き込むこと。自ずと限界がある。
ただ、サードパーティでこれを解決しているものがある。
なかなかおすすめなのが、ChatPDF。PDFをアップロード(ドラッグ&ドロップ)して、この内容について要約をしてもらったり、用語について聞いたりすることができる。ちょっと遊ぶ程度なら、無料で十分なレベル。
日本語は万能じゃない
元のデータセットの量が、日本語が少ない。このため、一般的なことを聞くのであれば英語の方が良いことが多い。DeepLやGoogle Translateを使って、英語で質疑をすることで回避可能。
日本語で聞くべきは、日本ローカルの話。例えば、日本のビジネス文化とか、日本の都市や歴史の話とか。つまり、一次ソースに英語以外のローカル言語がある場合は、ローカル言語で、それ以外は英語で、というのがよさそう。
と言っても翻訳ソフトがきちんと訳してくれているのかわからないと、自分の質問や回答の理解であさっての方向を向く。このため、なんでもローカル言語でやり取りをするのが正しいのかと言われると、データの正しさの検証に、疑問が残るのだが。
このように、その分野の得意分野である一次情報にアクセスしやすい自然言語を選ぶのが大事らしい。
ハルシネーション
過学習などの要因によって、正確でないことをさも見てきたかように記述すること。
最近は、最新の情報などについては自分で確認してね、などという注意を促してきたりするものの、綺麗な日本語で知らない分野について話されると、信じてしまうのが、人間の弱いところ。
批判的精神で、ググって丹念に裏付けを取るしかなさそうであります。
自己検証プロンプト作成とその失敗
ちなみに、ハルシネーションを調べてもらうプロンプトをChatpGPT ver4 自身に作ってもらってみた。
ハルシネーションがないと思われる文章には、
1) 与えられた入力との関連性
2) 事実とデータの正確さ
3) 内容の明確さと一貫性
が、あるはずなので、この3点を基準にして文章を確認してみる、というのが、ChatGPTの言い分である。筋が通っていると思います。
さて、存在しない美術館の、存在しない絵画というハルシネーションを起こしそうな質問に対する回答が、もちろんハルシネーションを起こしていたので、ここに書いてみる。
出題で使ったプロンプト
英国国立軍事美術館というものはないし、キャスター作「マモン平原海戦のウスター伯ヴィランデル図」というものも存在しない。
回答前半:回答そのもの
なかなか好調にハルシネーションを起こしている。
回答後半:自己検証
「特に問題はないと考えます」と、検証に失敗した。
もちろん、うまい自動自己検証方法を考えつく方がいらっしゃると思うので、そのときはぜひご教示いただきたい。めんどくさいから自動化したいのよー。