
12 Days of OpenAIまとめ
NO AI(人間が書きました✍️)
AI系ポッドキャスト(耳で学ぶAI)運営の矢野哲平(@robothink_jp)です。この記事ではOpenAIが発表した12 Days of OpenAIについて時系列ごとにまとめていきます。
Day0: 12 Days of OpenAIってなに?
突然、OpenAIから発表されました。
12日間に渡り発表を新機能などの発表をしていくと。(日本時間の12月6日からスタート)
年末の時期にいきなり投下してきましたね。さっそくネット上でも新モデルの発表?Soraの公開?と盛り上がっています。
なにせ12日間連続でOpenAIからの発表があるわけですからね…
以下では毎日の発表を時系列順に記していきます👇(いいねかブクマで保存してください)
Day1: OpenAI o1の発表
初日に発表されたのは3つ。
OpenAI o1のモデルとProプラン、o1での画像解析です。
一つずつ解説しますね。
まずはProプランから行きましょうか。
今まで無料プラン、20ドルのPlusプランがありましたが新しく200ドルのProプランが新設されています。

Plusのすべての機能
GPT-4oとo1への無制限アクセス
高度な音声への無制限アクセス
o1 pro modeへのアクセス
ちなみにPlus→Proへ移行する場合、日割り計算で割引されるようです。

そして、o1-previewのアップデート版であるo1も発表されました。
o1-preview, o1, o1 pro modeの比較がありますが、性能がアップグレードしていますね。

私の日常業務ではo1 pro modeはtoo muchな気もしますがコーディングの場面で活躍してくれそうです。
ちなみにo1はPlusユーザーなら使えるようになっています。モデルの変更から選択できます。
サムアルトマンがポストしていましたがo1のAPIの実装はまだだそうです。
これを機会に前から作りたかったアプリケーションを作ってみようかな🤔
そして最後にo1での画像解析。o1が画像アップロードにも対応しました🎉
OpenAI o1 is now out of preview in ChatGPT.
— OpenAI (@OpenAI) December 5, 2024
What’s changed since the preview? A faster, more powerful reasoning model that’s better at coding, math & writing.
o1 now also supports image uploads, allowing it to apply reasoning to visuals for more detailed & useful responses. pic.twitter.com/hrLiID3MhJ
Day2: Reinforcement Fine-Tuning
2日目はReinforcement Fine-Tuningに関してのトピックでした。
Reinforcement Fine-Tuningを用いて特定のドメインにおいてo1モデルをファインチューニングできるようになります。
それに伴い研究機関や大学、企業の応募を開始しています。
https://openai.com/form/rft-research-program/
Day3: Sora(動画生成AI)
土日の休みを挟んで3日目には動画生成AIのSoraが公開されました。
デモ動画が公開されてしばらく経ちますが年内に公開されましたね。
テキストから動画を生成できるAIです。
Soraについての概要をまとめると、
有料プランから利用可能
ChatGPT上からは利用できない。sora.comから利用する
プランに応じて生成できる数が変わる
具体的には以下のサイトから利用します。
またPlusプランとProプランで生成できる動画が変わってきます。

Day4: Canvas
今まで有料プランでしか使えなかったCanvas機能が無料プランでも使えるようになりました。
Canvas機能は簡単に言うと生成結果をインタラクティブに修正できる機能。
ライティングやコーディングのタスクでおすすめです。

キャンバスを選択しプロンプトを入力すると起動します。ちなみにCanvas上でPythonも実行できるようになっています。
Day5: ChatGPT 🤝 Apple
5日目はChatGPTとApple製品の統合に関しての発表ありました。
SiriやApple IntelligenceとChatGPTが統合し、Apple製品(Mac, iPhone, iPad)から利用可能に。
Day6: Video in Advanced Voice
ChatGPTの機能でAdvanced Voiceモードというものがあります。これにスマホから撮影したリアルタイムの動画と一緒に会話できる機能です。
「今、撮影しているメモに書かれた内容は?」
こんな感じの使い方ができます。デモ動画が分かりやすいと思います↓
なお、この機能は現時点ではPlusユーザー限定となります。
Day7: Projects
新しく追加されたProjectsという機能が追加されました。こちらもPlusユーザー限定。無料ユーザーにも先で追加予定とのことです。
Projectsは概念の理解が少し難しいかもしれません。
今までチャット単位で管理していたものがプロジェクト単位で管理できるようになったと言えばいいでしょうか。
プロジェクトの中にファイルやカスタム指示をまとめることができます。
利用シーンとしてはアイデア出しや壁打ちに便利かなと思います。
使い方や利用シーンはこちらの記事で詳しく解説しています↓
Day8: ChatGPT Search
8日目の発表はChatGPT Searchが無料ユーザーに解放されたことでした。
もともとChatGPTはブラウジング機能といって検索情報を参照する機能があります。
例えば「今日の日経平均株価を教えて」のような指示にも回答できるようになります。
ただ、ブラウジング機能は精度が低かったんですよね…
その後、ChatGPT Searchというブラウジング機能の上位互換のような機能が有料ユーザー向けに提供されました。その対象が今回の発表では無料ユーザーにも拡大されたというわけです。
Day9: API
9日目は開発者向けの発表となりました。o1のAPIが使えるように(ただしTier5)
あとはRealtime APIの改善。リアルタイム音声機能の追加が容易になったことと音声トークンの価格が60%値下げされました。
今回は開発者向けの発表となりましたがリアルタイム音声機能は気になります🤔(Youtubeの10分くらいから)
Day10: 電話の開設(ただし米国)
10日目は少し毛色が変わり面白い内容でした。
Youtubeで視聴するのが1番分かりやすいと思います。
要約するとChatGPTに繋がる電話番号を開設したと。デモではiPhoneから、旧式の携帯電話から、そして黒電話からChatGPTに電話をかけて会話していました。
Day11: Macとの連携強化
11日目の発表はMacとChatGPTについての発表がありました。
以前からMacのChatGPTアプリは提供されていましたが、今回はMacの純正アプリである「メモ」と連携できるようになりました。
以前はXcodeやVSCodeなどと連携できていましたが非エンジニア向けのツールとも連携が広がっている印象です。
Day12: o3とo3 mini
最終日に発表された内容は新モデルのo3とo3 miniについてでした。
こちらのモデルはまだ公開されておらず2025年1月末あたりと言われています。
新モデルの発表の発表ということで肩透かしを食らった人もいると思いますが、その性能の高さからワクワクしている人も多いのではないでしょうか。
現状のモデルo1の進化版で高度な推論、プログラミング、数学などのタスクが得意とのこと。
ちなみにo2ではないのか?という疑問に関してはスペインの通信会社とサービス名が被るからだとか。
【note読者限定】生成AIのおすすめツール資料を配布中
生成AIツールは何を使えばいいか分からない
もっと業務効率化に貢献するツールを知りたい
ChatGPT以外のAIツールを知りたい
こういった声に応えておすすめの生成AIツールを解説する資料を制作しました。もっとAIの情報をキャッチアップしたい人はぜひご覧ください。
noteでも月に20本ほどAI関連の記事を投稿しています。フォローよろしくお願いします😼