
chatGPT4o(オムニ) vs Gemini 1.5 Flash どっちもヤバすぎ戦国時代
昨日chatGPT4o(オムニ) がリリースされて「ヤベェ早い!」と思って記事にしようとしたら、翌日にGoogleがGeminiFlashをリリースしてた。
プレステとセガサターン戦争かよ……まあ利用者には嬉しいね!
早速使ってみた。そして4oに前の4との違いを書いてもらった。

んー? 4と4Turboの比較している?
下段の星マークから、リアルタイムで言語のスイッチングができるようになってるね。
3.5に切り替えると、同じ質問で即時回答が返ってくる。

↓ 3.5は素直に「自分の知識には4oはないです」って回答してる

しゃーない、最新のGemini 1.5 Flashを実行してみよう!
Untitled prompt | Google AI Studio
↑こっちからログインして、下段に質問入れてRunボタンを押すだけ。


こちらも回答できない。
しゃーない。GPT4oで「ウェブブラウザ機能で「chatGPT-4o」を検索して、結果を表示して」→「日本語で訳して」をした。
https://chat.openai.com/share/e/80daf3ca-4523-434b-b099-b4b907d9c273
ChatGPT-4oは、ChatGPT-4の強化版であり、その性能と使いやすさが向上しています。
以下に主な違いと強化点を説明します。
マルチモーダル機能: ChatGPT-4oはテキストだけでなく、音声、画像、ビデオも
処理および生成することができます。このマルチモーダル機能により、
より幅広いコミュニケーション形式とユースケースに対応できるようになり、
対話がより多様で自然になります (Stealth Optional) (OpenAI Developer Forum)。
強化されたインタラクションと文脈理解: ChatGPT-4oは、
複数のモダリティ(音声、視覚、テキストなど)を統合することで、
より自然なインタラクションを促進します。
また、長くて複雑な対話においても文脈を効果的に保持し、統合する能力が向上しており、
ユーザーの入力をより正確に理解し応答することができます (Stealth Optional)
(OpenAI Developer Forum)。
高度な推論能力と適応性: このモデルは、推論能力が強化されており、
ユーザーの特定のニーズや好みに応じて適応する能力が向上しています。
これにより、パーソナライズされた文脈対応のインタラクションが可能になります
(Stealth Optional)。
広範なアプリケーション範囲: ChatGPT-4oは、さまざまなデータタイプを処理できるため、
カスタマーサポート、教育、クリエイティブなコンテンツ作成、医療など、
より広範なアプリケーションに適しています (Stealth Optional)。
拡張現実との統合: ChatGPT-4oは、Apple Vision Proのような拡張現実デバイスと
シームレスに連携するように設計されています。この統合により、
カメラを使用して環境やアバターとのインタラクションを理解し、
システムの感情解釈およびインタラクション能力を向上させることで、
より没入感のあるパーソナライズされた体験を提供します (OpenAI Developer Forum)。
価格と利用可能性: ChatGPT-4oは、標準のGPT-4モデルと比較して、
より多くのメッセージ制限や高度な機能を提供するさまざまなサブスクリプションプランで
利用可能です。チームおよびエンタープライズサブスクリプションのような上位プランには、
無制限のアクセスやより長い入力のための拡張コンテキストウィンドウが含まれています (OpenAI)。
これらの強化により、ChatGPT-4oはChatGPT-4に比べてより高度な機能を提供し、
性能が向上し、幅広いアプリケーションに対応できるようになっています。
うん、機能的には 4o > Gemini Flash > 3.5 かな。
ブラウザ機能などの痒い所に手が届く機能は4や4oが優秀。
一方のGemini Pro や Flashは、長文の入力と出力、出力速度に優れていると思った。
試しに書籍のテキストコピペ、9万文字をペタっと貼って「目次作って」と渡したら、4oではサイズオーバーエラーだったが、GeminiFlashはそのまま目次が出た。
他のLLMではClaude、ダチョウ枠のGroqがある。
最近のClaudeは何か英語交じりになって性能が落ちた感じ。
Groqは性能はともかく、応答速度を「839.91 T/s」みたいに表示するようになってた。
他のタケノコのような似たLLMじゃなくて、早さ! だけに特化したダチョウLLM(Llamaだからラマだけど)は好き♥。

さあ、AI戦国時代の始まりだ!!
今日時点のLLM性能体感
①chatGPT4o: 何でもできる汎用性があるが他よりは遅め
②GeminiFlash: 大量テキストの入出力が多く、速度も優秀
③Claude: 何か中途半端
④Groq: 早いダチョウ枠。ポンコツっぷりが好き
⑤他