GPT-4o mini がおすすめできる理由

2024年9月11日 22:24

少し前になりますが2024年6月18日にしれっとGPT-4o miniがリリースされました。　「とっくに使ってるぜ？」っな方も多いとは思いますが、使ってみたら意外と良かったのでNOTEします。

結論から書くと、使わない手はないです。これまで一番安かった3.5Turboと比べても金額は1/3で能力は１７％UPなので単純に3.51倍お得になりました。
また質的なことは数値に出来ない部分もあるので、より大きなメリットが出る場合もありそうです。
API呼び出しで数文字変更するだけですし、すぐに試してみる価値があります。

速くてお値段以上！

わたしがときどきドバーっとデータを投げて処理を試しているGPT-3.5 TurboはWebでは無料ですがAPIでは課金されています。便利で安くてよいのですが、おっちょこちょいな所があり、お願いしたことの何割かを「スルー」する性格が玉に傷でした。

新しい4o-mini では 100万トークンのインプットにかかるコストは3.5 Turboのなんと３分の1以下。（フラグシップの「GPT-4o」モデルの33分の1以下）
１０００円支払っていた仕事の場合３３０円になっちゃうわけですが、更に爆速処理のおまけ付き。私の利用用途では倍くらい早い印象で、続けてAPIを呼ぶサイクルは以前は５分以上あけて呼ぶようにしていたのが２分でも余裕で回るようになりました。

更にクオリティーがかなりUP

AIのベンチマークMMLU (Massive Multitask Language Understanding)　でみると有料モデルと遜色なく、GPT-3.5Turboの２割くらい賢い？とピンとこない感じでしたが、実際に使ってみたら「かなりよい！」です。
例えば、以前はダメダメだった文章中の数値の計算、これがすごく良くなっています。

文章の中にドルの金額があったらレートOOで計算して円にして、なんていう面倒なこと頼むと数値計算はパスしてたり、なんなら数値ごと消えたりとか、計算が１００倍になってたりしていました。しかし4o-mini だと上位の課金クラスと遜色ないレベルでやってくれている印象で質的にかなりアップグレードされています。

サマライズも自然に

普通はそんなに使わない機能かもですが、文書の要約なども以前だと説明の前後関係とかいろいろ微妙だったのが、かなり洗練されて出てきます。質の部分では「よくなってるな〜」というのが少しの使用でも実感できたので、なにかしら日本語の？進歩もしたようです。

更に期待できそうな？

APIを長期で使っていると、半年,１年と時間が経つとプロンプトは同じでもだんだん結果が良くなっている印象です。言葉の表現がより適切とか小さな事ですが使い勝手は確実に上がっています。

たまにアップデートのあと変になって叩かれたりもしていますが、事後にはいい感じに落ち着いて「悪口」は鎮静していることからも改善が日々図られているのでしょう。
4o-miniは９月に入ってからすでに改良された印象で（特に上述の数値計算？）価格を考えると夢のようです。何もしなくてもサービスが良くなるのですから、今後も期待して使い続けたくなります。AI依存がすでに始まってるのかも😓

海外の評価

海外での感想をチョロチョロ見ても概ね高評価。安くて速くて賢くなったので当たり前ですが（笑

（評価の抜粋）

人々は、このようなリリースのポイントを見逃しがちです。このモデルがこれほど優れていて、これほど安価であれば、効率性に関して何らかのアーキテクチャ上のブレークスルーが達成されたことを意味します。これを拡大すれば、ゲームチェンジャーとなるでしょう。
すでにテスト済みで、セマンティックルーターなどの単純なタスクに使用しています。価格とパフォーマンスの比率は最高です。
いつものストーリーテストを mini で実行しました。これはかなり優秀で、少なくとも GPT4o のレベルでは、GPT4 の問題のいくつかを回避しています。このモデルには、応答を計画する能力があるのではないかとさえ思います。
トークンの数が多いほど、画像の詳細度が高くなり、精度も高くなります。
AIがどのように進化しているかを印象づける素晴らしいモデル

https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

とはいえ、AI界隈は変な盛り上がり方をするので話半分で（笑

追記　次はOpenAI o1

9月13日未明にに新たに新しく発表されたo1はまだAPI利用は出来ませんが、こちらも期待できそうです。科学，コーディング、数学のためにチューニングされ、より考えてから反応するそうです。今後が楽しみです。

強力な推論能力と幅広い世界知識を備えた、当社の大規模モデル o1-preview。
当社の小型モデル o1-mini は、コーディングタスクでは o1-preview よりも高速で競争力があります (パフォーマンスについては、こちらをご覧ください)。

オマケ：　ChatGPT自身に聞いた良さ

「GPT-4-turbo（または4-o-mini）」の素晴らしさについては、主に次の点が挙げられます：

1. コスト効率: 通常のGPT-4に比べて、より低コストで利用できるため、コストパフォーマンスに優れています。
2. 高速化: レスポンス速度が向上しているため、リアルタイムな応答や大規模なトラフィックに対応しやすくなっています。
3 . 軽量設計: より軽量なモデルで、リソースの節約が可能です。そのため、アプリケーションに組み込みやすいです。
4. 高い応答精度: 通常のGPT-4に近い精度を保ちながら、処理能力を最適化しているので、多くのタスクにおいて十分なパフォーマンスを発揮します。

簡単に言うと、性能とコストのバランスが取れたバージョンです。

オマケ２：　実用例

AIでアルゴリズム取引戦略を作成したという記事です。

明らかに、o1-mini モデルは、反復処理を必要とせずにアプリに有効なポートフォリオを作成する方法をよりよく理解していました。対照的に、GPT-4 モデルでは、熟練したユーザーからの支援がもう少し必要でした。最終的に、両方のポートフォリオは市場を上回る優れたリターンを達成しました。

いいなと思ったら応援しよう！

サポートありがとうございます😊 ベトナムにお越しの際はお声がけくださいね🌻