AI万能説に物申す?生成AIの危険性を暴き出す。【AIのお悩み相談ラボ #34】
以前、Google Bardがリリースされて間もない頃、精度を確認したらボロボロだった話を書きました。
2023年5月 vol.1
vol.2
あれから早5ヶ月、AIツールの進化は留まることを知らず、今日までにさまざまなアップデートが実装されてきました。コードもイラストもサクッとAIが生成してくれる今、「生成AIプロンプト集」みたいな情報商材が出回っているところを見ても、黎明期から過渡期へと移行しているのかなと思います。
そこで今回は、「前回の記事(5ヶ月前)と全く同じ質問をGoogle Bardにしたらどうなるのか」を再々度検証してみることにしました。
新たな機能ばかりに目を向けるのではなく、こういった地味なものを見ることで、AIの本当の利便性を計れるのではないかと思います。
では、さっそく始めましょう。
AIは5ヶ月でどこまで進化した?
前回と同様の質問を入力します。
私が在籍している職場の住所と電話番号
在籍しているスタッフ名
提供しているサービスのメニュー
これらは全てネットで検索できる内容です。
前回の結果は、以下のとおり。
👇👇👇
職場の住所:正解◯/電話番号:不正解×
スタッフの人数=男性人数:正解◯/女性人数:不正解×
スタッフの名前=全スタッフ不正解×(人数も不正解×)
では、5ヶ月経ったGoogle Bardの回答を見てみましょう。
👇👇👇
職場の住所:△(番地や号数は間違っているが、位置や道案内の内容はほぼ正解)
電話番号:不正解☓
スタッフの人数:不正解(男性:☓/女性☓)
スタッフの名前:△(3人正解)
このような結果に終わりました。
改善された点もあれば、何故か以前正解していた回答が不正解になっているのを見るかぎり、やっぱり適当に出力されているんだなぁと思った次第であります。
ちなみにBing AI(GPT-4)で同様の質問をしたところ、結果は大きく変わりました。
👇👇👇
職場の住所:◯
電話番号:◯
スタッフの人数=男性:☓/女性☓
スタッフの名前:◎(全員の名前が出ました)
スタッフの人数のみややズレた回答が出ましたが、あとは全問正解。検索を含めた使い方ではGPT-4のほうがまだマシのようです。
まとめ
今回は、5ヶ月たった今のGoogle Bardの検証を行いました。以前、私は「検索の時代は終わった」と書きましたが、やはりAIのみに全てを任せるのはまだ先の話のようです。プロンプトを改善すれば精度は上がるかもしれませんが、正直言うとプロンプト入力の手間をかけるよりキーワード検索のほうが早い場面はまだ多い気がします。
細かいところを適当な言葉でごまかすAIの特性は、完全になくなることはないのかもしれません。
いかなる情報でも、AIに生成されたものは引用元(根拠)を確認する姿勢は必須ですね。
「AIのお悩み相談ラボ」では、あなたの課題に向き合うかたちでの支援を提供することを目的とした人生相談サイトです。これからも、人生相談でよくある質問内容をAIに回答してもらいながら、実際に活用できる根拠などを補足する形式で進めてまいります。
皆さまのご意見によって改善されていきますので、質問等があればぜひご意見をお願いします。
読み終えて興味を持てた方はフォロー&いいねをお願いします。
※過去のお悩み相談&アドバイスはコチラからどうぞ👇
各SNSのアカウントもフォローお待ちしております♪
・X(旧:Twitter)
・Threads