OpenAIから最新モデル「GPT-4o mini」がリリースされたとのことで、早速調べてみました。
「GPT-4o mini」のリリースメールによると、GPT-3.5 Tubroと比較して優れている面があるとのことです。
「GPT-4o mini」は、GPT-3.5 Tubroの後継という位置付けの印象を受けました。
どこかのタイミングで、APIに関して、GPT-3.5 Turboから「GPT-4o mini」にユーザを切り替えたい意図が見えます。
「GPT-4o mini」は、API利用料やマルチモーダル機能もあり、画像、将来的には動画、音声も取り扱えるということで、モデルの最低限の機能の底上げをしています。
既に、ChatGPTのウェブ画面からは、GPT-3.5 Turboが消えています。
現在、ウェブ画面で使用できるモデルは、GPT-4o、GPT-4o mini、GPT-4の3種類となっています。
但し、APIに関しては、GPT-3.5シリーズは利用できるようです。
GPT-3.5シリーズのAPIをいきなり廃止してしまうと、API利用業者は、コード修正などが発生して、OpenAIのAPIを利用したサービスが動かなくなってしまいます。
OpenAIというプラットフォーマーの力が強すぎるというリスクを感じて、OpenAI以外のサービスを利用しようと考えてしまうのではないでしょうかということを避けるためにも、GPT-3.5シリーズはまだ使用できるようにしているのでしょう。
「GPT-4o mini」をPlaygroundで簡単に使ってみます。
https://platform.openai.com/playground/chat?models=gpt-4o-mini
次のOpenAIからのリリースメールの英訳を「GPT-4o mini」にしてもらいます。
和訳の結果は、次のとおりです。
英語の原文とほぼほぼニュアンスを変えることなく和訳できています。
次に、先ほどの英語のメールを画像にして、ここに記載されている文字を読み取ってもらいます。
こんな感じで、聞いてみます。
実行結果は、次の通りです。
所感としては、「GPT-4o mini」という最安のモデルがマルチモーダルのモデルになり、画像、動画、音声と扱えるようになり、技術の進歩を感じられました。