【OpenAI】連続発表中間まとめ！Day1~Day6で公開された内容を解説します！

SAMURAI Biz | 生成AI情報発信局

2024年12月13日 10:02

こんにちは！SAMURAIのしまです！

いやー、OpenAIの連続発表は衝撃的な内容が続きましたね。。
そこで、ここまでの発表をまだ追えていない人も、改めておさらいしたい人も、いろんな情報を見に行かなくてもいいように、Day1~6までの内容を本記事にまとめてみました！

情報をキャッチアップしたいけど時間がない、、という方にぴったりな記事になっていますので、ぜひご活用くださいませ！

今回の担当

【Day1】ChatGPTのモデルにo1が正式解禁！さらに月額200ドルのChatGPT Proもリリースへ

また、先日リリースされたo1 Pro modeもかなり話題になってるので、こちらも概要をまとめました↓

【o1モデルの特徴】
従来のpreviewモデルと比較して、主要なミスが約34%減ったうえ、処理速度も50%速く、さらにテキストに加え画像認識も対応し、マルチモーダル化へ

【o1promodeの特徴】…
— SAMURAI Biz | 生成AI情報発信局 (@samuraijuku_biz) December 10, 2024

【その1】OpenAI o1がpreview版から正式版リリースへ

今までpreview版として公開されていたo1が正式版となり、以下の機能が解禁されました。

①応答速度の向上：複雑な質問に対する処理がより迅速に
②エラー率の低下：preview版と比較して、エラー率が34%削減
③マルチモーダル処理への対応：画像認識機能が新たに追加され、画像とテキストを組み合わせた応答が可能に

これにより、コーディングや数学的推論、文章作成といった幅広い用途での利用価値が向上しています。

【その2】月額200ドルで約3万円？！ChatGPT Proプランの解禁

その衝撃な月額料金から話題を呼んだ「ChatGPT Pro」プランですが、大きく分けると以下の3つが通常プランのとの違いになるようです。

全モデルへの無制限アクセス：「OpenAI o1」「o1-mini」「GPT-4o」「Advanced Voice」など、用途に応じたモデルを自由に利用可能。特にOpenAI o1は無制限アクセスが可能に
高性能モードの利用：「o1 Pro mode」によるより高度な問題解決能力の提供

この中でも特筆すべきはo1 Pro modeが使用できることでしょう。
OpenAIの公式では以下のようなグラフが展開されました。

https://openai.com/index/introducing-chatgpt-pro/

上記はo1-preview、o1、o1 Pro modeにおけるベンチマークテスト(4 回施行したのち、4回とも正答した場合)の比較になります。まとめると以下のようななります。

数学能力（AIME 2024）

o1 preview：36.7%
o1 :67％
o1 Pro mode：80.0%

プログラミング（Codeforces）

o1 preview：25.6%
o1 :64％
o1 Pro mode：74.9%（49.3ポイント向上）

科学的推論（GPQA Diamond）

o1 preview：58.1%
o1:67%
o1 Pro mode：74.2%（16.1ポイント向上）

こうして比較すると、あらゆる分野でo1 pro modeが優れているかがわかります！
その理由として、o1 pro modeはモデルの中でも最も回答時間を費やし、モデル自身が思考することでより精度の高い回答を出してくれるようです。

今後、医療や金融、法務、エンジニアリングなど、色んな分野での活躍期待できそうです！

【Day2】Reinforcement Learning with Fine-Tuningで特定分野に対してモデルを微調整可能

併せて、#OpenAI がReinforcement Learning with Fine-Tuningも発表してるので、こちらも要チェック！
【Reinforcement Learning with Fine-Tuningの特徴】
・o1の推論能力をユーザーの専門分野に活かすために調整可能
→o1モデルをユーザーが微調整する
など

Reinforcement Learning with…
— SAMURAI Biz | 生成AI情報発信局 (@samuraijuku_biz) December 10, 2024

DAY2は、Reinforcement Learning with Fine-Tuning（長いので以下、「RFT」とします）の発表でした。

RFTは、o1モデルにおいて、ユーザーごとに異なる微調整を行うことで、それぞれの専門性に特化したモデルに仕上げることが可能になる機能だそうです。

例えば、弁護士であれば法務分野に特化するよう「微調整」することで、モデルが持つ推論能力を法務寄りにすることでより回答の精度を上げることができる、みたいな話です。

こちらの機能は来年リリース予定とのことなので、引き続き動向を追っていきましょう！

【Day3】ついにリリース！動画生成AI「Sora」

【ついにきた！待望の #Sora が高速モデルへと進化し利用開始】https://t.co/ZnaF0AMke5 #OpenAI が動画生成AIツールSoraの提供を開始したので、特徴や概要をまとめました↓

①特徴
・ストーリーボード機能で、画像や動画素材を取り込んで、生成した動画を編集可能…
— SAMURAI Biz | 生成AI情報発信局 (@samuraijuku_biz) December 10, 2024

Day3は待望の動画生成AI「sora」のリリース発表でした！

【soraの特徴】

①従来のpreview版よりも高速な動画生成を実現

②ストーリーボード機能でシーンごとにプロンプトを設定可能

③リミックス機能で、動画の要素単位で内容を変更することができる

④ループ機能で自然なループ動画の作成ができる

⑤2つの動画を融合させられるブレンド機能で生成AIならではのオリジナル動画を作成可能

⑥リカット機能で動画編集用な切り取り作業もできる

⑦スタイルプリセット機能で想像力豊かな動画を作ることも可能

【料金プランと使用感】

現在、soraはChatGPT PlusプランとChatGPT Proプランで利用可能です。

なお、クレジットは以下の通り消費され、最大の解像度かつ最大秒数で生成すると、Proプランでも月5本程度までしか生成ができないので注意は必要です。

【Day4】Canvas機能がアップデート！ついに無料ユーザー含めた全ユーザーに開放へ

【Day4　#Canvas の全ユーザーへの開放とアップデート】#OpenAI の連続発表会4日目、Canvas機能について言及がありました！
1. 無料ユーザーもCanvas機能を使用可能に
2. Canvas内でのPythonを実現
3. GPTsのカスタム機能でCanvasが追加され、自動連携が可能に… pic.twitter.com/62c2ZbcfrD
— SAMURAI Biz | 生成AI情報発信局 (@samuraijuku_biz) December 11, 2024

Day4は、従前よりChatGPTに標準搭載（有料ユーザーのみ）されていた、Canvas機能のアップデートについて発表されました。
また、嬉しいことに無料ユーザーにもCanvas機能が解禁されたのもありがたいですよね！

なお、Canvasについてはこちらの記事で詳しく解説しているので要チェックです！

【Canvasアップデート①】Canvas上でPythonの実行が可能になった

今までは、ChatGPTにPythonのコードを書かせてそれをCanvasで編集、、という作業自体はできたのですが、今回のアップデートでその場でPythonを実行することが可能になりました！

試しに、MatplotlibでダミーのYoutubeチャンネル登録者推移表を作り、Canvas上で実行してみました。

グラフがCanvas上に現れました！
これなら、共同で開発をする際、その場でデモンストレーションをすることもできるので、作業がかなり捗りそうですよね！

【Canvasアップデート②】GPTsのカスタマイズにCanvasが選択できる

アップデートの2つ目としては、GPTs機能にCanvasを導入できるようになりました。
例えば、契約書をチェックするGPTsを作った場合、Canvas機能をONにしておけば、チェックした契約書をその場で修正することができます！
つまり、自動連携することでさらなる時短につなげることができるのです。

実際に契約書をチェックして修正できるGPTsを作ってみました。

ちなみに、今回チェックを依頼するダミーの契約書内容はこちら

# 業務委託契約書

委託者（以下「甲」という）と受託者（以下「乙」という）は、以下のとおり業務委託契約（以下「本契約」という）を締結する。

第1条（目的）
本契約は、甲が乙に対してWebサイトの構築業務（以下「本件業務」という）を委託し、乙がこれを受託することに関し、必要な事項を定めることを目的とする。

第2条（業務内容）
1. 甲は乙に対し、以下の業務を委託し、乙はこれを受託する。
   - Webサイトの設計
   - Webサイトの開発
   - Webサイトの動作テスト
2. 詳細な業務内容については、甲から乙に交付される発注書に定めるものとする。

第3条（契約期間）
本契約に基づく業務の履行期間は、乙が甲から発注書を受領した日から1ヶ月間とする。

第4条（報酬及び支払方法）
1. 本件業務の報酬として、甲は乙に対して金100,000円（消費税別）を支払うものとする。
2. 甲は、乙からの請求書受領後、30日以内に前項に定める報酬を乙の指定する銀行口座に振り込む方法により支払うものとする。
3. 振込手数料は甲の負担とする。

第5条（成果物の納品）
1. 乙は、本件業務の成果物を第3条に定める期間内に甲に納品するものとする。
2. 甲は、成果物の納品を受けた後、10営業日以内に検収を行うものとする。
3. 甲は、成果物に瑕疵があった場合、乙に対して相当な期間を定めて修正を請求することができる。

第6条（権利の帰属）
1. 本件業務の成果物に関する著作権（著作権法第27条及び第28条の権利を含む）その他一切の知的財産権は、納品完了時に乙から甲に移転するものとする。
2. 乙は甲に対し、成果物に関する著作者人格権を行使しないものとする。

第7条（機密保持）
1. 甲及び乙は、本契約の履行に際して知り得た相手方の機密情報を、相手方の事前の書面による承諾なく第三者に開示、漏洩してはならない。
2. 前項の義務は、本契約終了後も存続するものとする。

第8条（契約の解除）
甲又は乙は、相手方が本契約の条項に違反し、相当な期間を定めて催告したにもかかわらず、その違反が是正されない場合には、本契約を解除することができる。

第9条（損害賠償）
甲又は乙は、本契約に違反して相手方に損害を与えた場合、その損害を賠償する責任を負う。

第10条（協議事項）
本契約に定めのない事項及び本契約の解釈に疑義が生じた事項については、甲乙誠意をもって協議の上、解決するものとする。

以上、本契約の成立を証するため、本書2通を作成し、甲乙記名押印の上、各1通を保有する。

    年    月    日

    甲：住所
       名称
       代表者          印
    
    乙：住所
       名称
       代表者          印

いい感じですね！
この他にも記事作成などのGPTsを作れば、作成した文章をその場でCanvasで編集できるのでかなり便利になりそうですね！！

【Day5】iPhoneとiPad向けのiOS、そしてMac OS向けに ChatGPTの統合機能をリリース！

【#OpenAI 連続発表DAY5】
iPhoneとiPad向けのiOS、そしてMac OS向けに #ChatGPT の統合機能をリリース！
・特徴
①Siriが、タスクをChatGPTと連携した方が良いと判断した場合、自動的に引き渡して回答を実施
②Apple…
— SAMURAI Biz | 生成AI情報発信局 (@samuraijuku_biz) December 12, 2024

Day5は、ChatGPTがApple製品の各種デバイスに標準搭載されるというものでした。OpenAIのメンバー自身もApple製品をこよなく愛しているらしく、今回の統合は悲願だったのかも知れません・・！

【特徴】

①Siriが、タスクをChatGPTと連携した方が良いと判断した場合、自動的に引き渡して回答を実施
②Apple Intelligenceのライティングツールで、ChatGPTを使って一からドキュメントを作成することが可能に
③iPhone 16のカメラコントロールで、ビジュアルインテリジェンスを呼び出し、被写体についてChatGPTを使って詳しく知ることができる

【対応するデバイス・言語】

①機種 -iPhone： 15 Proシリーズ、16シリーズ -ipad：A17 Pro/M1以降 -Mac：M1以降
②言語 -Apple Intelligenceは米英などの「localized English」(米英、英豪、英加、英愛、英NZ、英南アフリカなど)設定で利用可能 -日本語を含めたその他の言語については、2024年4月以降に実装の予定

今回注目されるのは、iphoneなどのデバイスと統合することで、生成AIの日常化が促進されることでしょう。

実際、発表動画の中でも、OpenAIのメンバーの顔をChatGPTに記憶させ、誰のクリスマス衣装が一番面白いかをChatGPTに判断させるなどのデモを行っていました。

こうしたエンターテインメント要素として生成AIが身近になると、近い将来各種SNSにも標準搭載され、利用が当たり前になる世の中も遠くないかもしれません。

【Day6】Advanced Voiceモードにビデオ機能が追加

【 #OpenAI 連続発表DAY6：Advanced Voicモードにビデオ機能が追加】
ライブビデオや画面共有を活用して #ChatGPT との会話が可能に！

画面共有した内容をChatGPTが理解し、解析した内容に基づいてアドバイスもしてくれるようです。…
— SAMURAI Biz | 生成AI情報発信局 (@samuraijuku_biz) December 13, 2024

Day6はAdvanced Voiceモードにビデオ機能が追加され、画面共有した内容をChatGPTが解析し、解析した内容に基づいた対話ができるようになりました！

発表動画内においても、画面共有してOpenAIメンバーを写したところ、トナカイの帽子を被ったエンジニアのMichelle氏をしっかりと認識しておりました。

また、OpenAIメンバーがコーヒーのハンドドリップを画面共有しながら実践し、蒸らし方や注ぎ方などChatGPTにレクチャーを受ける様子もありました。。

Now you can chat with ChatGPT over video and voice in real time. pic.twitter.com/6LySLJcFy5
— OpenAI (@OpenAI) December 12, 2024

先日のGemini2.0でも画面共有しながらの対話機能がリリースされましたが、今後各社でこの機能のアップデートが進むといろんな業務効率化が期待できそうですね。。！

最後に

いかがでしたでしょうか？

正直情報量が多すぎて、、という方もたくさんいらっしゃるかと思いますが、これでまだ半分です（笑）

個人的な印象としては、モデルのアップデートもそうですが、今後AIの市場がより活性化し、ある種のコモディティ化を目指していくのではないかと今回のOpenAIの発表を通じて感じました。

現に、Day5、6と私達が日常的に使用しているスマートフォンと密な機能となっているため、AIを使わない人がいないくらいの未来が着実に近づいてきてますね。

今後も、今回のような最新情報や活用事例を発信していきますので、ぜひフォローをお願いします！

それでは、またDay7以降のまとめ記事でお会いしましょう！