【ChatGPT】新モデル"o1"がリリース。特徴は「推論」と「コーディング」(追記:評価記事4件へのリンク)
はじめに
OpenAIの新しい大規模言語モデルが2つリリースされました。
各名称は、o1-previewとo1-miniです。
OpenAIからのEメールによる説明
2つのモデルのポイント
ポイントは以下の通りです。
o1-preview:強力な推論能力と幅広い世界知識を持つ大規模モデル。
o1-mini:コーディングタスクで高速かつ競争力のある小型モデル。
これから両方について試した結果をこのnoteで書いていきます。
o1-previewの注目点
o1-previewについては、推論能力をアップしていることで、論理パズルや数学の問題を解かせます。
昨年GPT-4で試した際は、論理的問題はほぼ0点で、むちゃくちゃな回答でした。大規模言語モデルの仕組みからして仕方がないのですが、明らかに論理的問題は処理できていませんでした。
今回論理問題を適切に処理できるか、いろいろな論理問題を与えて試したいと思います。
もし、論理問題が適切に処理できたら、本当にすごいことです。
アップデート:o1-previewに関する評価記事(2件)
o1-mininの注目点
o1-miniについては、OpenAIからのメールに面白いことが書いてありましたね。
”コーディング タスクでは o1-preview よりも高速で競争力があります”という記述です。
ChatGPTのコーディング能力については、以下のようなGPTsを作成し、その都度必要な小型Webアプリを作って日常業務に使用しているので、コーディング能力がどの程度向上したか興味津々です。
余談ですが、簡単なWebアプリでも、業者に依頼すると数週間、数十万円かかりますが、GPTで出力すれば、1分で作れます。
カスタマイズも人間に依頼するとまたそこで数十万円ですが、追加費用を気にせず自由にカスタマイズやバージョンアップできる点も魅力です。
以前、GPT-4からGPT-4oにモデルがアップグレードした際に、コーディング能力がかなり向上し、出力されたコードのエラー発生率が激減した経験があるので、今回も同様に期待しています。
今後、これらの新モデルのAPIが開放され、Cursorなどのプロジェクト全体を管理できるAIコーディングエディタで使えるようになると、更にプログラマーの生産性が上がります。
アップデート:o1-miniに関する評価記事(2件)
まとめ
今回の新モデルは、コードネーム「Strawberry」と呼ばれ、NSAに予めプレゼンテーションされていたモデルを指すのかもしれません。
いずれにせよ、新モデルの推論能力とコーディング能力、どちらも期待大です。
関連動画まとめ記事
【重版決定】AIアプリをプログラミング不要で開発する書籍
GPTsを自分で作って世界に公開したい方はこちら!