見出し画像

【徹底解説】OpenAIの12日間ライブ【前半まとめ】 「o1」「Sora」、3万円プラン、iPhone統合、高度な音声のビデオ統合など、まるごと整理【動画つき】

OpenAI社は、2024年12月5日から12日間にわたる連続ライブ配信イベントを開催中。この期間、毎日(土日を除く)新しい機能や製品の発表、デモを行っています。

  • 博士号レベルの推論モデル「o1」

  • 超リアル動画生成AI「Sora」

  • 月額約3万円の「ChatGPT Pro」プラン

  • iPhoneやMacとのChatGPTの統合

  • ChatGPT「高度なボイス」のビデオ機能統合

などなど。

ただし「情報量が多すぎて追いきれない」「見逃した」という悩みの種にもなっています。そこで、前半の6日目までの情報をいったんまとめます。

字幕・吹き替え音声つきの動画も付いています。

このイベントは、12月のホリデーシーズンに合わせたもので、随所にクリスマスに沿った例え話やジョークが織り交ぜられ、なごやかなムードや、英語の独特のユーモア、OpenAIの企業文化を楽しむことができる点も魅力になっています。

以下のVoicyでは、30分以上の音声で詳しく解説しています。


1日目 「o1」正式版と「ChatGPT Pro」(月額約3万円)

個人的に注目:

  • 博士号レベルの推論モデル「o1」が正式リリース。画像をアップできるように。実用面で各段に使いやすくなるのでは?

  • 月額200ドルの「ChatGPT Pro」プランの追加。全てのモードが無制限に。→高度な音声モードも使い放題になるのはヤバいのでは?一日中音声会話しっぱなし

OpenAIは博士号レベルの推論能力を持つAIモデル「o1」を正式にリリースしました。このモデルは従来のGPTシリーズとは異なり、じっくりと思考して回答を導き出す推論特化型として設計されています。特に計算やプログラミング、科学分野において人間の専門家以上のテスト結果を出しているとされます。また画像解析機能も追加され、今後はWeb検索連携やExcel、PDFファイルの解析機能も実装予定です。これに合わせて、o1の上位モデル「o1 Pro」を無制限で使用できる「ChatGPT Pro」プランも発表されました。月額200ドル(約3万円)という高額な価格設定は議論を呼びましたが、後の発表で動画生成AI「Sora」の実質無制限使用権も含まれることが明らかになり、プランの価値が再評価されることとなりました。初日のプレゼンテーションでは技術的な内容に加え、AIの機械学習用語を使ったクリスマスジョークも披露され、和やかな雰囲気で発表が行われました。

ジョーク:「raindeer enforcement learning」(トナカイの強制学習)

サンタが大規模言語モデルを使おうとしてうまく動作せず、最後にどう解決したかという話で、「RainDeer in for tune to the running(トナカイの強化学習を行った)」がオチでした。これは機械学習用語の「Reinforcement Learning(強化学習)」と掛けた技術者向けの言葉遊びでした。


2日目 「o1」の追加学習(ファインチューニング)

個人的に注目:

  • 「o1」を追加学習(ファインチューニング)して専門分野のタスクへ特化させることが可能。

  • このデモでは、o1-miniをファインチューニングして、o1以上の精度を発揮したとのこと。

  • 法律、金融、工学、保険などの専門分野に特化したo1が爆誕していくことに…

2日目はo1の追加学習機能「ファインチューニング」に焦点が当てられました。この新機能により、既存のAIモデルに特定分野のデータを追加で学習させ、専門性を高めることが可能になります。特筆すべき点は、従来より少ないデータ量でも効果的な学習が行えるという点です。オープンAI独自の手法「RFT(Reinforcement Fine-Tuning)」を採用し、法律、金融工学、保険など幅広い分野での活用が期待されています。この技術は2025年初頭の一般公開を予定していますが、先行してアルファ版の募集を開始し、大学や研究機関、企業を対象に提供されます。実際のデモでは、バークレー研究所の計算生物学者が登場し、難病の原因遺伝子特定研究への活用例が紹介されました。技術的な内容が中心でしたが、この日も「Pine-tune(松の木の調整)」という言葉遊びを交えたジョークで締めくくられました。

ジョーク:「pine tune」

サンタの自動運転が木に衝突する問題を「because he didn't fine-tune his mother(パインチューンしなかったから)」と答えるもので、その日のメインテーマだった「Fine-tuning(追加学習)」と「Pine(松)」を掛け合わせた親父ギャグでした。

3日目 超リアル動画生成AI「Sora」リリース

個人的に注目:

  • ついに超リアルビデオ生成AI「Sora」が本日公開

  • ChatGPT PlusまたはProアカウントがあれば追加料金なしで利用可能

  • 初期モデルを大幅に高速化・低コスト化した「Sora Turbo」も提供

ただし、ユーザー登録が殺到しすぎてシステムエラーとなり、登録できない状態が数日続いています。

2024年2月に発表され、業界に衝撃を与えた動画生成AI「Sora」が正式にリリースされました。Soraは単なる動画生成だけでなく、ストーリーボード機能やリミックス機能など、独自の編集ツールを備えています。料金プランはChatGPT+(月額20ドル)で月50回、ChatGPT Pro(月額200ドル)で月500回の高速生成が可能で、それ以降は低速モードで無制限に使用できます。他社の動画生成AIと比較すると単体の性能では劣る面もありますが、ユーザーインターフェースの独自性や使い勝手の良さが評価されています。特にChatGPTの有料プランに付随するサービスとして提供される点が大きな特徴で、これまで動画生成を試したことのないライトユーザーの参入障壁を下げることが期待されています。ただし、リリース直後からユーザー登録が殺到し、現在もシステムがパンク状態となっている点が課題となっています。

ジョーク:特になし
あえてジョークというなら、「システムエラー。ユーザー登録がいまだにできない」ということかな…

4日目 ChatGPT「Canvas」機能の開放とPython対応

個人的に注目:

  • 文章やコードをAIと共同編集できる「Canvas」が無料プラン含む全ユーザーに開放

  • Canvas内でPythonコードを仮想的に実行してデバッグでき、エラー修正ボタンを押すだけで直せる。

  • これはPythonのプログラミング学習がますます捗るのでは?

これまで有料ユーザーのみに提供されていた「Canvas」機能が全ユーザーに開放されました。Canvasは共同作業スペースとして機能し、文章の編集や添削をリアルタイムで行うことができます。特筆すべき点は、Pythonコードの直接編集と実行機能の追加です。プログラミング文法のハイライト表示やデバッグ機能を備え、エラーの自動修正も可能です。さらに、豊富なPythonライブラリに対応し、データ分析やグラフ作成などの視覚化も画面上で直接実行できます。バージョン管理機能も実装されており、過去の編集履歴に簡単に戻ることができます。この機能は特にプログラミング学習者やデータ分析者にとって有用なツールとなることが期待されています。発表ではクリスマスムードを盛り上げるため、サンタの帽子を被ったエンジニアによるデモンストレーションが行われました。

ジョーク:
サンタが写真を撮る方法を尋ねられ、「Polaroid(ポラロイドカメラ)」と答えるシーンで、これは「Polar(北極)」とかけた短い言葉遊びでした。

5日目 iPhoneやMacとChatGPTの統合

個人的に注目:

  • Siriが答えられない複雑な質問をするとChatGPTに引き継いでくれる

  • iPhone16系は本体ボタン1つでカメラ+ChatGPTにすぐ質問できるのは便利

  • Macでは⌘キー2回だけでSiri+ChatGPTを呼べて、どのアプリからでもChatGPTに質問できる。

  • PDFを開いていても直接それについて質問できるデモの様子はまさに「Copilot」

AppleのSiriとChatGPTの連携があらためてOpenAI自身から発表されました。iPhone 16シリーズでは新しいボタンが追加され、AIビジュアルインテリジェンス機能とChatGPTの連携が可能になります。Macでもコマンドキーを2回押すだけでSiriを呼び出し、複雑な質問はChatGPTに引き継がれる仕組みが実装されます。注目すべき点は、ChatGPTの利用にログインが不要という点で、Apple製品ユーザーの利便性が大幅に向上します。ただし、現時点でAppleインテリジェンス機能は英語のみ対応で、日本語を含む他言語は2025年中の対応が予定されています。発表では、マライアキャリーのクリスマスソングやクリスマスセーターコンテストなど、終始和やかな雰囲気でデモンストレーションが行われました。

ジョーク(?):

特定のオチはありませんでしたが、マライアキャリーのクリスマスソングがプレイリストに含まれていないことを「バグ」と冗談を言ったり、クリスマスセーターコンテストでサム・アルトマンCEOが予想外に優勝したことで盛り上がるなど、終始和やかな雰囲気でした。

[1]クリスマスのプレイリストをChatGPTで作成→「ここにマライア・キャリーの曲が含まれていなければバグ報告が必要ですね」

[2]アルバムカバーに「Froge」を入れることにこだわるシーン。ChatGPTは「Froge」が何か知らないだろうという予想を含めた会話

[3]クリスマスセーターコンテストでサムが優勝。デイブが「サムが優勝だって?」と驚愕するリアクションが面白かった。

6日目 ChatGPT「高度な音声モード」にカメラ機能が追加&サンタモード発動

個人的に注目:

  • ChatGPTの高度な音声モードに、ビデオ共有機能がついに統合!これは熱い。

  • さらに12月中「サンタさんモード」が選択でき、サンタAIと会話できる。

  • カメラ・画面共有機能:Teams、Plus、Proユーザーに順次、提供開始(欧州は後日) Enterprise/Edu向けは2024年初頭

ChatGPTの高度な音声モードに画像認識機能が統合され、映像を見ながらリアルタイムで会話やアドバイスが可能になりました。デモでは参加者の顔認識や、コーヒードリップの手順指導など、実践的な活用例が紹介されました。画面共有機能も追加され、パソコン作業中の質問やトラブルシューティングがよりスムーズになります。この機能はChatGPT+およびProプランのユーザーに順次提供され、特にProユーザーは24時間無制限で利用可能です。また、12月限定で「サンタモード」が導入され、サンタクロースの声で会話ができるようになりました。さらに、サンタモードを有効にすると音声モードの制限時間がリセットされるため、無料ユーザーにも追加の利用機会が提供されます。この発表は日常生活への実践的な影響が大きく、特にパソコン作業や英語学習などの場面での活用が期待されています。

ジョーク:

「エルフの好きな音楽は?」→「ラップミュージック」
ラップ(rap)と、ラップ(wrap):プレゼントを包む をかけている


まとめと感想

前半の1日目と2日目は、「o1」の推論モデルやファインチューニングなど、かなり技術的で難しい内容でした。このペースでさらに難しい話が続くのではと不安も感じました。3日目の「Sora」は確かに面白い機能を持っていましたが、すべてのユーザーにとってインパクトのある発表とは言えませんでした。5日目のiPhoneやMacとの統合は、夏からの予告があった内容とほぼ同じで、特に驚きはありませんでした。

しかし6日目の高度な音声モードのカメラ対応は、私にとって最も嬉しい発表でした。例えばパソコン作業中に画面を共有しながらAIに質問できたり、英語学習でも活用できたりと、実際の生活で大きなインパクトがある機能だと感じています。今までスクリーンショットを撮って状況を文章で説明する必要があった手間が、映像共有と音声で簡単に解決できるようになります。

このテンポの速い発表は後半も続くと思われ、まとめるのは大変ですが、私なりに注目すべき濃い情報を今後も皆さんにお届けしていきたいと思います。

いいなと思ったら応援しよう!