見出し画像

新モデル、GPT-4o miniが登場。違いや特徴

[読了目安: 2分]

AI系のポッドキャスト(耳で学ぶAI)を運営している矢野哲平(@robothink_jp)です。この記事では新しく公開されたGPT-4o miniについて解説します。
引用: https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

GPT-4o mini

7月19日(日本時間)に公開されたOpenAIの新しいモデル。
特徴をざっくり言うと、

  • 低コストの速いモデル

  • GPT-3.5 Turboより60%以上安い

  • 入力トークン0.15ドル / 出力トークン0.60ドル(1M)

  • テキストと視覚をサポート。音声とビデオは追加予定

  • コンテキストウィンドウはGPT-4oと同じ12.8万

  • 知識のカットオフは2023年10月

まとめるとGPT-3.5 Turboより賢くてコスパに優れるモデルと言えます。
コンテキストウィンドウ(参照できる過去のテキスト量)もGPT-4oと同じ12.8万になります。

ただし画像処理はGPT-4oと同コスト

テキストの処理は確かに安いです。しかし、画像処理の場合はGPT-4oとコストが変わらないという落とし穴があります。OpenAIのフォーラムで話題になっていた内容で自分も勘違いしていました。
GPT-4o miniで画像が絡む処理を考えている人はご注意ください。

GPT-4o miniに切り替える

モデルの切り替えから変更できます。

こちらの画面は有料版の画面です。
無料版でもGPT-4o miniを利用できると公式からアナウンスされていますが、私の環境では表示されず..(確認できた方、コメント頂けると嬉しいです🙏)

GPT-4o miniとClaude Haiku, Gemini Flash

OpenAIの発表によると、GPT-4o miniは競合(Anthropic, Google)が開発する軽量型のの言語モデルClaude HaikuやGemini Flashに比べて主要なベンチーマークで優れているとのことです。
ピンクがGPT-4oでオレンジがGPT-4o miniです。

引用: https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

GPT-4oとminiでタスク比較

文章校正のタスクで比較してみたところ、GPT-4o > GPT-4o miniの結果でした。
肌感としてもベンチマークの結果と同じような感じですね。
GPT-4o > GPT-4o mini > GPT-3.5 Turboだと思います。

使い所

「GPT-4oの方が精度高いなら今まで通りGPT-4o使った方がよくない?」と思う人も多いと思います。確かに通常のチャットでの利用ならGPT-4oを使った方が良いように思います。
GPT-4o miniで恩恵を受ける人はAPIで利用している人ですね。GPT-3.5 Turboより60%以上安くなるのでコストを削減できます。
例えば、GPT-3.5 TurobのAPIを利用している人はGPT-4o miniに差し替えるとより高性能かつコストが安いモデルを利用できます。
GPT-4oのAPIを利用している人でもGPT-4o miniに任せれるタスクがあれば切り替えることで大幅にAPIの料金を安くできますね。

ボイスモード..?

スマホアプリから音声操作をした場合、GPT-4o miniはGPT-4oに比べてレスポンスが速いという投稿をXで見つけて試してみました。
「確かに速い..気がする」
これ、良かったら手元の環境で試してみてください。確かに速いと感じます。

【note読者限定】生成AIのおすすめツールの資料を配布中

  • 生成AIツールは何を使えばいいか分からない

  • もっと業務効率化に貢献するツールを知りたい

  • ChatGPT以外のAIツールを知りたい

こういった声に応えておすすめの生成AIツールを解説する資料を制作しました。もっとAIの情報をキャッチアップしたい人はぜひご覧ください。
👉資料を受け取る

noteでも月に20本ほどAI関連の記事を投稿しています。フォローよろしくお願いします😼

いいなと思ったら応援しよう!

この記事が参加している募集