見出し画像

「opneAI o1」の概要と使い分け方法


◆youtube動画

↓↓youtube動画

https://youtu.be/BBRseMo5BfM

◆今回の動画の目次

◆CHATGPT-o1 previewの概要
◆o1-miniの概要
◆どの場面で使えるか
◆実験┃大学入試で一番難しい問題を解いてみる。
◆状況整理┃chatgptはどの場面で使えるか
◆実際の使い方の例

◆CHATGPT-o1 previewの概要

●難解な問題に対処可能
・GPQA・・一般的な質問応答タスクにおいて、AIモデルがどれだけ広いトピックに対して正確な答えを返せるか評価するテストにおいて、数値が向上した。

●正確性の向上
・モデルは応答前に時間をかけて考える。
・Codeforcesコンテストでは89%に上昇した。

●安全性の向上
・GPT-4oでは22点だった安全ルールテストで、「o1-preview」は84点を獲得
・AI安全性の強化のため、米国と英国のAI安全性研究所との契約を締結した

●誰にとって有益なモデルか。
・医療研究者や物理学者、開発者など、科学、インデックス、数学分野の複雑な問題に取り組むユーザー向け

●デメリットについて
・現在の「o1」プレビューはWeb閲覧やファイル・画像アップロードなどの機能は未搭載ですが、将来的に追加される

◆o1-miniの概要

●数学読解能力が向上した。
・AIMEにおいて数値が向上(アメリカの高校生数学コンテスト)

●コーディングがプレビュー版よりも強い
※Elo・・プレイヤーの実力を数値化してランク付けするためのレーティングシステムの単位

●AIモデルの性能を人間と比較して評価するテストがo1 previewよりもわずかに強い

◆状況整理┃chatgptはどの場面で使えるか

●chatgptGPTの魅力は、回答スピードと会話形式(過去の会話が反映される)
・とにかく質問しまくって、結論をだしていくという使い方に向く。
(他の検索AIと比較して)
●文章加工に適している。
・検索AIでだした情報を元に、ブログを書いたり、英語にしたり、
●画像をアップロードして、質問できる。
※o1previewについては、回答の正確性が向上したo1-miniについては、数学的な問題を解く能力が高まった。

◆実際の使い方の例

ポイントは、
「それぞれの強い場所をモデル欄で切り替えながら、使っていくこと。」

① 基本的な会話は「GPT-4o」┃スピード重視
② 高度な会話の際は「o1-preview」┃正確性・安全性重視
③数学的な問題は「o1-mini」で解かせる┃数学重視
④それを元に「GPT-4o」に切り替えて、最後は簡潔させる。

※今回の実験では、オープンAIがバージョン更新後、アクセス数の増加なのかわかりませんが、一時的に性能が落ちるというのがこれまであったため、今回もその現象が起こっていました。2024/9/16現在

◆youtubeチャンネル


いいなと思ったら応援しよう!