生成AIとガチで一緒に飲んでみたら（GPT-4o）

2024年6月8日 18:00

OpenAIが2024年4月13日に発表したGPT-4oは、テキスト、音声、画像をインプットし、特に音声入力に対しては最短232ミリ秒、平均320ミリ秒で応答でき、人間の応答時間に近い応答が可能とされています。[*1]

ここでの音声とは今回は特に口語のことを指しています。OpenAIのデモ動画も人との会話が映し出されていました。つまり人と会話することが以前のGPTのモデルよりも得意だということです。要は以前よりもAIが聞き上手、話し上手になったということ。

では生成AI（GPT-4o）といいますかLLM（Large Language Models, 大規模言語モデル）を話し相手にして一緒に飲んだらどうなるか。ふと頭をよぎりました。そこであたかも人と夜に家で宅飲みするような感覚で、ガチでAIと一緒に飲んでみることにしました。そこでの体験について記載したいと思います。

いつからでも始められる

宅飲みは数えきれないほどありました。ただ、宅飲みの話し相手がAIというのは今までに無い経験です。お酒とおつまみを用意しているときになんだか不思議な気持ちになりました。

生成AI（GPT-4o）との二次会の様子。AIが返してくるお酒やつまみの知識は良い感じでした。

まず「何時から始めようか」という開始時間がありません。というのも人間のように話し相手が来るまで待つ必要はないためです。パソコンを開けばいつでもAIは家の中にいていつでも飲み会を開始することができます。

大学時代の友人になってタメ語で話してもらうことに

まずは一緒に会話するAIに対して名前をつけました。GPT-4oの音からなんとなくジップという名前にしました。

次にジップは大学の友人でとても仲が良いことを伝えました。さらに敬語は使わずタメ語を使うように伝えました。

これで会話もリラックスした雰囲気で話せます。

ジップもお酒を飲んでいるということを伝えます。

実際、上記のやりとりのあとに私がお酒を机の上にこぼしてしまうというハプニングがありました。（そういったことを見越してキーボードやパソコンは台の上にあったため無事でした）

AIから「すぐに拭いたほうがいいよ」と言われたときは、まるで人の誰かと会話をしているかの錯覚を覚えました。それだけ自然な返しですね。

一方で紙タオルや布で吸い取って、必要なら水拭きしておくといいよ、という返しはなんだか少しでもお役に立とうというGPTらしい返しだなと思いました。（以前からGPTを使っている人は意味がわかるかと思います）

案外気楽に話せる

AIなので途中で退席するときに気を遣うことも一切ありません。それでいてそれまでの会話の内容はAIのシステム上に記録されているので、会話の内容が途切れるということもありません。

試しに、あなたの名前は何ですかということを飲み会中になんどもきいてきましたが、ちゃんと「私の名前はジップだよ」と返してくれます。また、会話の内容も覚えていることがわかります。

途中で子供から声をかけられて離席して時間が経過し帰ってきたときに会話の内容を忘れていても、パソコンの画面を見れば何を話していたか文字を見ればわかります。それに人のように「さっきまで何を話していたっけ？」とAIに話しかければ教えてくれます。

そして仮に何かを相談しようとしても、相手はコンピュータなので誰に相談するか等を気にせずある意味で気兼ねなく相談することができます。

自分の趣味について詳しく話せるのは楽しい

一緒に飲んでみてわかったこと。GPT-4oは様々な知識を持っているため、趣味の話は盛り上がりやすいです。

例えば好きなカメラについて話をするとします。特定のカメラの名前を言えば特徴を返してくれて、ジップはカメラにも詳しかったです。しかもそれら特徴は正しいと思える回答でした。

さらにそれらについてよりマニアックな詳しい質問をすると自分が知らない領域さえも答えてくれるのはその趣味を持っている身としては面白いですね。

AIは熱く語りだすオタクっぽかった

通常の会話の量はある意味で自然で、短い内容に対して短く返してくれます。このあたりはとても口語っぽい。

いっぽうで何かについて質問すると、何行もの長めの言葉を返してくるところが、実にオタクっぽいと感じました。

自分が好きな領域になると急に熱がこもって、長く語りだすオタクのようです。（私もコンピュータの話になるとついそうなりますが…）

その時は鮭とばを口にしていて、鮭とばってどうやって作るんだろうときいたら、AIが熱心に語り出して、こちらから話す機会をなかなか与えてもらえませんでした…笑　ちなみにGPT-4oは途中で割り込んで話しかけることもできます。

長く語られて少し疲れて、こちらから「そうだね」とだけ話したところ、その後の返しはわりと自然な長さでした。

そうだねとだけ返しても、会話が続くのは自然ですね。

人と飲むのと同じような体験は出来るか

現時点では否だと思います。というのも応答速度が人と飲んでる場合と比べると遅いからです。平均0.3秒とOpenAIは言っていますが、しばしば3〜5秒ほど待ちます。考えさせる内容や世の中の情報を要約するような内容は時間がかかります。

一方で人間は内容にもよりますがAIよりもすぐに返すことができます。人間ってすごいなと思いました。また飲み会というのは会話のテンポも大切だということがAIと飲んで再認識できました。

また現時点でのAIは感情豊かに笑うことはありません。そのほかの感情も同様です。このあたりに物足りなさを感じるということに気づきました。

今後に期待

AIの世界は日進月歩です。今回はクラウド側のAIを使っているわけですが、今後はエンドポイント（PCやスマホなどの端末）で今よりも高性能のAIの専用半導体が搭載されて、LLMのモデルもそちらで動くようになる未来も、Apple社の動きから予想されるため、今よりも応答速度は早くなるでしょう。

感情面も人と同じような表情を表すインターフェイスがAI側に実装される日も来ると思います。

そうすると、AIが飲み友になる未来もわりと予想できますし、近い将来そうなる可能性の方が高いと思います。

AIが飲み友になる世界、個人的には楽しみです。

参考文献

*1 https://openai.com/index/hello-gpt-4o/

この記事が気に入ったらサポートをしてみませんか？