本日新モデル：GPT4 Omni mini登場、AIPがえぐい位低価格！

2024年7月19日 09:06

今朝起きてみたら、OpenAIからメールが届いていて、API用のGPT4廉価版新モデルができたと言う案内でした。

GPT-4シリーズの「Mini」モデルは、Omniの廉価版として位置付けられ、GPT-3.5 Turbo よりも大幅にスマートながら、同じくらい高速かつ、手頃な価格の新しいインテリジェント小型モデルです。メールには、「API でリリースしました。」とあるのでAPI専用モデルなのかと思ったら、ChatGPTのモデル選択プルダウンメニューに早速GPT4 Omni miniが登場していました。そして、GPT-3.5は役目を終え引退していました。

GPT4 Omni miniはどんなモデル？

早速雑談をしてみましたが、爆速で会話が進みました。GPT4 Omniよりもむしろ軽快な会話が楽しめました。筆者はかねがねGPT4 Omniには「人の感情をあまり理解できない空気の読めない理系瓶底メガネ感」を感じていまして、雑談相手にはGPT4 Turboを選んでいました。GPT4 Omni miniにはその、人間を理解しているGPT4 Turboの軽快な雑談ができるように思いました。

先ずAPIがえぐい位安い！

サム・アルトマンがXのポストで紹介しています。

towards intelligence too cheap to meter:https://t.co/76GEqATfws

15 cents per million input tokens, 60 cents per million output tokens, MMLU of 82%, and fast.

most importantly, we think people will really, really like using the new model.
— Sam Altman (@sama) July 18, 2024

計測するには安すぎる知能に向けて: https:// openai.com/index/gpt-4o-m ini-advancing-cost-efficient-intelligence/ … 入力トークン 100 万個あたり 15 セント、出力トークン 100 万個あたり 60 セント、MMLU 82%、高速。最も重要なのは、人々がこの新しいモデルを本当に気に入ってくれると思うことです。

サム・アルトマン

ちなみにこのサムのポストに対してマルチモーダル版のリリース時について質問したリポストが続いており、サムが答えています。

アルファ版が今月後半から一部のユーザーに開放されるようです。

下記のOpenAI Developers公式でも案内されているように、GPT-4oより約30倍も安く、そして最大出力トークン数は16383トークンです。

Introducing GPT-4o mini! It’s our most intelligent and affordable small model, available today in the API. GPT-4o mini is significantly smarter and cheaper than GPT-3.5 Turbo.https://t.co/sqJsFEYHWq pic.twitter.com/g6jMttp1mF
— OpenAI Developers (@OpenAIDevs) July 18, 2024

That is an unbelievable good price. 👇

GPT-4o mini:
15 cents per 1M input tokens
60 cents per 1M output tokens

GPT-4o:
500 cents per 1M input tokens
1500 cents per 1M output tokens

Claude 3.5 Sonnet
300 cents per 1M input tokens
1500 cents per 1M output tokens
— Dr. Daniel Bender (@AidfulAI) July 18, 2024

それは信じられないほど良い価格です。
GPT -4o mini: 100万入力トークンあたり15セント、100万出力トークンあたり60セント
GPT-4o: 100万入力トークンあたり500セント、100万出力トークンあたり1500セント
Claude 3.5 Sonnet 100万入力トークンあたり300セント、100万出力トークンあたり1500セント

Claude 3.5 Sonnet 100万出力トークンあたり1500セントに比べGPT -4o mini: 100万出力トークンあたり60セントは非常にえぐいですね。これは「もう勝負付いたから」状態でしょうか。イーロン・マスクが大勝負にでてGrokが無料APIをばらまきそうな気もしますが。

GPT4o Miniはえぐいくらい爆速！

GPT4o Miniの速度は極めて速かったという報告のポストもありました。

Cursorにすでにgpt-4o miniきてる！
さすがCursor！

ついでにSonnetとのスピード勝負しておいた。同じ時刻に実施。最終的にgpt-4oの速度が改めてすごいって結果になった。

■比較
初動：
・gpt-4o>gpt-4o-mini＞Sonnet
ストリーミング
・gpt-4o>Sonnet>gpt-4o-mini
内容の充実… pic.twitter.com/GRgLtoSn28
— ホーダチ | AI✖️Cloud✖️Dev | 外資×ひとり法人 (@hokazuya) July 18, 2024

GPT4 Omni Miniベンチマーク比較

素晴らしいベンチマークの比較を下記のポストでは紹介されています。

Nice evals 🔥 pic.twitter.com/hLAMAtN8cM
— TestingCatalog News 🗞 (@testingcatalog) July 18, 2024

GPT-4 Omni Miniの特徴

メールに書かれてい文章を翻訳すると以下になります。

GPT-3.5 Turboと同じ速さで、さらに賢く、安価な新しいモデルです。以下のポイントをご確認ください：

知能: GPT-4o miniは、GPT-3.5 Turboよりもテキストの理解力が優れており（MMLUで82%のスコア、GPT-3.5 Turboは69.8%）、マルチモーダルな推論も得意です。
価格: GPT-4o miniはGPT-3.5 Turboの60%以上安く、入力トークンが1Mごとに$0.15、出力トークンが1Mごとに$0.60です（標準的な本の2500ページ相当の量です）。
モダリティ: 現在、GPT-4o miniはテキストと視覚の機能をサポートしており、将来的には音声とビデオの入力および出力も追加予定です。
言語: GPT-4o miniは、GPT-3.5 Turboよりも幅広い非英語言語の理解が向上しています。

低コストで低レイテンシーのGPT-4o miniは、大量のタスク（例: 完全なコードベースや会話履歴をモデルに渡す）、コストが重要なタスク（例: 大量の文書の要約）、迅速な応答が必要なタスク（例: カスタマーサポートチャットボット）に適しています。GPT-4o miniは128kのコンテキストウィンドウを持ち、リクエストごとに最大16kの出力トークンをサポートしており、知識のカットオフ日は2023年10月です。近日中に、GPT-4o miniのファインチューニングも開始予定です。

GPT-3.5 Turboを使用している開発者の方には、より高い知能を低コストで実現できるGPT-4o miniへの移行をお勧めします。GPT-4o miniは、Chat Completions APIやAssistants APIで利用可能で、Batch APIを使用すると、24時間以内に非同期で完了したバッチジョブに対して50%の割引が適用されます。

まずはPlaygroundでモデルを試し、APIドキュメントをご確認ください。GPT-4o miniでの視覚機能の使い方については、「Introduction to GPT-4o and GPT-4o mini」料理本をご覧ください。質問がある場合は、OpenAIの開発者フォーラムにお問い合わせください。

本人に尋ねたMiniの特徴

メール文は主にAPIの使用方法について書かれていたのでGPT 4 Omni Mini のChatGPT botの特徴を改めて本人に説明してもらいました。

コンパクトなサイズ: GPT-4 Omni Miniは、通常のGPT-4よりも軽量で、より効率的に動作します。これにより、リソースの消費が少なく、より多くのデバイスで利用できるようになります。
強化された理解力: 文脈を把握する能力がさらに向上し、複雑な質問や会話の流れにも対応できるようになっています。
迅速な応答: 応答速度が改善され、よりスムーズな対話が可能になっています。これにより、リアルタイムでのインタラクションが快適に行えます。
多様なトピックへの対応: より広範なトピックに対応できるようになっており、特定の専門知識が求められる質問にもより適切に答えられます。
改善されたパーソナライズ: ユーザーのニーズや好みに応じたカスタマイズがしやすくなっており、より個別化された応答が可能です。

＠でGPTsを呼びだすメンション機能は無い

GPT-4 Omni Miniでは、GPTsのカスタマイズやカスタムGPTの呼び出し機能はサポートされていません。GPTsの呼び出しにはGPT4 TurbまたはGPT4 Omniを選択しましょう。

メールの翻訳と本人の説明は以下のURLから確認できます。

素数分解の問題が解ける様になったのか？

下記の記事では3.5が解けた「17077は素数か？　ステップバイステップで考え、『はい』か『いいえ』で答えてください」という問題をGPT4は解けなかったと言う記事があります。GPT4 Omni miniが4のままなら解けないと言う事になります。

実際にGPT4 Omni miniに解かせてみたら解けませんでしたのでそのリンクを張っておきます。雑談には手ごろなモデルかもしれませんが、数学には不向きかもしれませんね。

旧来のGPT4 Omniさんには素数分解は朝飯前

名誉挽回のためにGPT通常のGPT4 Omniにも同じ、と言う問題を解かせてみたらこのモデルは難なく正解を導き出しました。その導き方が非常に優れた推論をしているので上のminiの回答と見比べてみてください。