見出し画像

【世界が10年進んだ】OpenAI怒涛の12日連続発表総まとめ。知っておくべきポイントを抜粋解説《$200プラン、o1、o3、Sora、ビデオ通話 などなど》

みなさん、こんにちは。
チャエンです!(自己紹介はこちら

2024年12月6日(日本時間)からOpenAIが行った12日連続の発表「12 Days of OpenAI」が全て公開されました。

12日間の発表で、世界が10年進んだ気がします。o1 Proや$200の新たなプラン公開から始まり、10ヶ月越しのSoraの公開、Claudeに搭載されていたCanvasやProjectモードの追加、そして最終日には「o3」の発表など盛りだくさんの12日でしたね。

今回は、12 Days of OpenAIによる詳細を解説します。仕事納めや忘年会で忙しくアップデートできていないという方、ぜひこの記事を読んで便利な機能を覚えておきましょう!


1.12 Days of OpenAIの総括


この12日間で発表されたアップデートによって、「いつでも・どこでも・誰でも」AIを活用できる新たな時代が一気に加速したと言えます。o1やo3などの高性能モデルが登場し、電話や音声・画像解析、共同編集ツールなど、ありとあらゆる形でChatGPTが拡張されました。

https://openai.com/12-days/

また、高速化・高精度化によりビジネス導入がさらに進むだけでなく、動画生成AI「Sora」や音声+映像処理の進化など、マルチメディア分野にも本格的に展開が広がっています。Appleエコシステムをはじめとする幅広いプラットフォーム連携が進み、多様な働き方やライフスタイルにもスムーズに対応できるようになりました。さらに、CanvasやProjectsなどのコラボ機能の追加により、リモートワークやチームでの共同作業がより効率的になりました。

2.個人的に注目したい3つのポイント

2-1.月200ドルの“Proプラン”による「無制限のo1」と「高度な音声化」

まず1つ目は、月額200ドルのChatGPT Proプランです。

  • o1モデルとo1 Proモードが無制限に使える

  • 高度な音声機能(Advanced Voice) も無制限に利用可能

特に「高度な音声化の無制限」は、常に自分専用の通訳・アシスタントを持ち歩いているような感覚を実現します。リアルタイムに音声で質問できるだけでなく、ビジネスや学習面でも即戦力になるのが大きな魅力。月3万円ほどで「万能のAIコンシェルジュ」を雇うイメージですね。

2-2.画像付き解析のリアルタイム環境

次に注目したいのは、画像解析とリアルタイム世界の融合です。

  • スマホのカメラや画面を使ったリアルタイムの画像認識

  • 近い将来PC(パソコン)画面にも対応予定

これによって、常にAIチューターがついている状態で作業できる未来が見えてきます。PC画面を共有しながら「これはどうやるの?」「今このファイルで詰まってるんだけど…」と即座にアドバイスをもらえるのは、学習面や業務面で革命的です。画像認識と音声応答を組み合わせることで、実質“神がかった相談相手”がそばにいるような体験が可能になります。

2-3.ChatGPTの電話・WhatsApp連携

最後に3つ目は、ChatGPTの電話・WhatsApp連携です。

  • 「1-800-ChatGPT」で電話からAIとやり取り

  • WhatsApp連携による世界的ユーザベースの拡大

現在のChatGPTユーザは約3億人と言われていますが、通話やWhatsAppといったテキスト以外のアクセスルートが増えることで、世界中の人がAIを使う敷居が一気に下がります。文字入力に慣れない人でも電話やWhatsAppのチャットならハードルが低いため、これからユーザ数がさらに爆発的に伸びる可能性があります。


それでは、次の章からは各発表の詳細について見ていきます。

3.12 Days of OpenAIの詳細解説

1日目(12月6日):o1 & ChatGPT Pro

o1は、従来モデルと比較してエラー率を34%低減し、処理速度を50%向上させた高性能AIです。特に数学やプログラミングなどの複雑な推論タスクにおいて優れた性能を発揮し、国際数学オリンピック予選で83%の正答率を達成しました。
画像解析機能も搭載されています。

技術面では、段階的推論を可能にする「Chain-of-Thought」を採用し、128,000トークンのコンテキストウィンドウを搭載しています。また、人間のフィードバックを活用した強化学習により、さらに精度が向上しています。

月額200ドルのChatGPT Proプランでは、o1およびo1 proモードへの無制限アクセスに加え、GPT-4oやAdvanced Voice機能も利用可能です。

▼o1とChatGPT Proに関する詳細はこちら

2日目(12月7日):Reinforcement Fine-Tuning Research Programの開始

Reinforcement Fine-Tuningという新しいモデルカスタマイズ技術で、開発者が高品質なタスクを数十から数千用意し、参照解答を用いてモデルの応答を評価することで、モデルの推論精度を特定分野で向上させることができます。同様の課題に対するモデルの推論プロセスを強化することで、精度を高める仕組みです。

■対象者
研究機関、大学、企業を対象に、専門家が行う狭い範囲の複雑なタスクをAIで補助したい場合に最適です。法務、保険、医療、金融、エンジニアリングなど、結果に客観的な「正解」が存在する分野で効果が確認されています。

■プログラムの内容
この研究プログラムは、ドメイン固有のタスクでこの技術をテストするためのアルファ版APIが提供されます。参加者はAPIの改善に役立つフィードバックを求められ、データセットを共有することでモデル改善への貢献も期待されます。

参加希望者は応募フォームを提出し、選考結果は後日通知されます。この技術は2025年初頭に一般公開される予定です。

3日目(12月10日):Sora

Soraは、OpenAIが提供する動画生成AIです。ユーザーはテキストや画像を基に動画を生成でき、簡単に高度なクリエイティブ作品を作成することができます。
ChatGPTの有料プランであれば、追加で支払うことなく使用できます。

使ってみて感じた1番の驚いたポイントは、タイムライン上でシーン毎にプロンプトや画像・動画を埋め込んで動画を生成できることです。この機能が搭載されたことで、イメージとあった動画が作成できるようになりました。このアプローチはOpenAIが初の試みです。

動画生成AIという比較的未知の領域でも、最適解を毎度出してくるOpenAIのセンスに脱帽しますね。

▼Soraの詳細はこちら

4日目(12月11日):Canvas

ここから先は

3,809字 / 1画像

¥ 1,200

期間限定!Amazon Payで支払うと抽選で
Amazonギフトカード5,000円分が当たる

この記事が気に入ったらチップで応援してみませんか?