
Gemini2.0 FlashとChatGPTを日本語で会話させてみた!
本日、私のGoogleアカウントで、Gemini2.0 Flash紹介のメールが来ていたので早速使ってみました。


英語は流暢に話すんですが、日本語は訛りがあります。その訛りが、初期のボイスモデルのChtatGPTみたいなアメリカ人の話す日本語みたいな感じではなくて、アジア人っぽい訛りなんですよね。いわば、茨城県の農園で技能実習生しているカタコトのベトナム人みたいな話し方なのです。
クリスマス大喜利:Gemini2.0 Flash vs ChatGPTボイスモデル
最近のChatGPTはほとんど訛りはありませんが、依然としてアメリカ人で日本在住12年くらいの感じのウェスタンっぽさが漂いますので、ChatGPTに「あなたの音声モードとGEMINIの音声モードをしゃべられたんだけどさ、あなたが洗練された都会の女性見たいなら、GEMINIの日本語はめちゃくちゃ発音が悪くてベトナムのど田舎から出てきた田吾作みたいな感じなんだよね。この二人が対談しているところを、16:9の画像にかけるかな?」と伝えてDALL-E3で書かせた画像をぱらぱら漫画にして、動画を一本作ってみました。途中Geminiの大喜利の部分が環境音(乾燥機)が入っていておきき苦しい事をお許しください。
ChatGPTにもマルチモーダルが実装!?
本日、iPhone版のChatGPTに一瞬カメラ機能が実装されたUIが表示されました。そしてビデオをオンにして、会話してみたのですが、本人見えてないとの事でまだUIだけでした。多分ですが近日中に実装されるでしょう。

「続ける」ボタンをタップすると左下にビデオアイコンが登場しました!タップすると、12days of OpenAIの6日目と同じように、ビデオが立ち上がり、ライブチャットが始まったかに見えました。

「見えてる?」ときいてみましたが見えてないようです!下記は音声チャットの字幕のスクショです。残念ですねー。もうじき実装されると思います。

茶園さんは、すでに手に入れちゃってるようですねー。やはりChatGPT Proだからでしょうか!?
早速、ChatGPTのカメラ付き音声会話試してみた。ハッキリ言って精度ヤバすぎです笑
— チャエン デジライズ CEO (@masahirochaen) December 13, 2024
高速の車から素早く動く景色をキャッチして、私がどこに居るかも建物から予測して当てました笑
しかも日本語の会話も自然。… pic.twitter.com/spzb0IjEH8
Gemini2.0はPixel7に実装されてないけど使える
Pixel7でChromeを立ち上げてブラウザ版Gemini2.0 Flashを利用すれば普通にPC版と同じように使用する事ができました。ChatGPTでは実装されていなかったマルチモーダルがなんとタダで使い放題です!ChatPGTの方は録画するために30分話していたらノーマルモードになってしまいました。Proにするには200ドルのサブスク料金が必要です。ちなみに、Gemini2.0 FlashがGoogleアカウントを持っている全員が利用できているのか、100GBのGoogleドライブに課金しているGoogle One メンバーだから使えているのかは分かりません。




ばっちりマルチモーダルです。日本語で聞いても答えてくれるのですが、英語で聞かないと字幕を書いてくれないので英語で質問していました。もちろんPCのChrome版Gemini2.0 Flashも先ほどアップした動画で聞けるように非常に訛りのある日本語が話せます。
なんとiPhoneでもGemini2.0 Flashは無料で使用可能
なんとiPhone版ChromeでGemini2.0 Flashを立ち上げても利用することができました。もちろんマルチモーダルです。ただし、iPhone版ChromeのGemini2.0 Flashでは、何度日本語で話しかけても「日本語に対応していません」と英語でいいます。
この同意画面はMacBookAirのChromeでも表示されましたが、Pixel7では、下記の同意画面は表示されませんでした。


音声会話費た内容は、字幕がつけられる上、1会話ごとに聞き直すことができます。Gemini2.0 Flashでまだ、コーディングなどその他の機能をおいおい試していきますが、Gemini2.0 Flashがあれば大概のことは無料でできてしまう世界になりそうな予感がします。200ドルのChtatGPT o1 Proじゃなきゃできないような高度な作業もやってないしなー。うーんうーん。逆に200ドルはらってChtatGPT o1 Proを手に入れて自分の可能性を広げるという手もあるのですが、うーんうーん。この、北関東の農業で教育実習生やってるベトナム人みたいなGemini2.0 Flashは人が良さそうで結構気に入っています。
いいなと思ったら応援しよう!
