見出し画像

ChatGPTが進化!まるで人間の様に会話する5つの新ボイスが今日から解禁

本日、ChatGPTのアドバンスドボイスモードがリリースされました。これを使用できるのはPlusユーザーなど課金ユーザーのみなのでご注意ください。(10月3日に無課金ユーザーにも解放されました)また、アップデートが始まらない人は一旦スマホからChatGPTアプリを削除し、再度インストールするとアドバンスドボイスモードに変更されます。

新しいChatGPTスマホアプリを再インストール

再インストールしてログインすると、すぐに下の左の画面が表示され、新しいモデルになった事がわかります。

OpenAIのスプリングアップデートでの発表からすでに3ヶ月がたちました。当時人間が会話しているようにタイムラグなく自然なテンポで会話できるアドバンスドボイスモデルと会話する様子がライブでデモンストレーションされ、ユーザーは非常に驚きました。(その時の様子は下記のNoteに解説していますので併せてご覧ください。)

そのライブでもで使用されたChatGPTがあなたの元に。ただし、ヨーロッパでは人の感情を声色や顔の表情から読み解くことのできるChatGPTが、プライベート保護の理由で使用禁止になっています。

選べる9つの音声

以前の4つの音声は男女ともにCNNのニュースキャスターのような推しの強い感じの音声で日本語が訛っていて外国人風でしたが、自然な日本語の話せるボイスが5つ追加されています。

6月にこのアップデートが秋になると告知された時は、ブーイングの嵐が巻き起こりその様子は下記のNoteで解説しています。不正利用を避けるため、大統領選終了後の年末になるのではないかとの憶測もされていました。

新ボイスは、Solはどちらかと言うとあまり感情を表に出さない会社の受付嬢っぽい応対をします。Mapleは少しハキハキした感じのスタートアップで働く女性の様で好感が持てました。しかしながら、文科省認定付きみたいな規範を持っているChatGPTですので、アニメ声のロリショタ音声は採用されていません。

音声は、すでにこちらの声色を察知して嬉しそうな、あるいは悲しそうん感情表現をするようになっています。話していて大変楽しいです。

下記のポストなんかすごいですね。まるで人。

でもまあ、日本でChatGPTを爆発的に普及させるには声優と契約するしかないと思うんですけどね。人気声優を起用したらユーザー数が100倍になると思うんですが、ロリ規制とかで引っ掛かるのでしょうか?それなら、スパイファミリーのヨルさんの声の早見沙織さんとかFF10のゆうなの声の青木まゆこさんとかを起用したらいいと思うんですよね。

スプリングアップデートで発表されたが未実装の機能

下記のポストは、スプリングアップデートで「ChatGPTに目と耳と口がついた」と言っていたのですが、「スマホのカメラを通してChatGPTは見る事ができる」と言う部分の実装がまだされていない事を指摘しています。

5 月の Advanced Voice のデモ イベントで、OAI は ChatGPT に話しかけながらその内容を表示できることを大々的に宣伝しました。 グレッグがこの機能を紹介しているところです。 これは出荷されたアップデートのどこにも存在しません。 音声モードには、単一の画像を撮影するためのカメラ ボタンすらありません。

デモ中の画面の左下にあるカメラ アイコンです。これはアップデートではまったく表示されません。 批判しすぎだと非難される前に、私はただ困惑しているだけです。 完全なビデオマルチモーダルを控えるのは理解できますが、カメラから GPT への変換はすでにアプリの一部になっています。 音声モード中に使用できないのはなぜですか?

公式とOpenAI幹部によるポスト

以下、OpenAI公式とOpenAIの面々のポストを掲載します。


この記事が気に入ったらサポートをしてみませんか?