記事一覧
Claude 3.5のコンピュータ使用
Claude 3.5にコンピュータ使用が追加されました。
コンピュータ使用Anthoropic が生成AI Claude 3.5にコンピュータ使用を追加しました([anthropic])。
コンピュータ使用 (Computer Use) とは、コンピュータの画面を見て、カーソルを動かしたり文字を入力したりする機能です ([itmedia])。
まだβ版なので、遅いし、入力をミスすることもある、と
コストダウンが進む生成AI
OpenAIが先陣をきってコストダウンするので生成AIのAPI料金は下がる傾向です。
生成AIのAPIのコストダウンOpenAIのAPIコストは以下の通りです:
GPT-4からGPT-4o miniまで1年半で入力は 1/200、出力は 1/100になっています。精度があがってこの結果です。実質的なコストパフォーマンスはそれ以上の比率になっています。
GPUの寄与NVIDIAがすさまじい勢い
OpenAIのコンピタンス
OpenAIの強さは謎というお話をします。
生成AIをリードし続けるOpenAIOpenAIはエッジが効いています:
ChatGPTのアクティブ週間ユーザは2億人
チャットボットアリーナでは常に1位
OpenAI o1で高度な推論能力でもリード
動画のSora、画像のDALL-E 3、音声のVoice Modeでもリード
GPT-4o miniはコストでも優位
GPTsで生成AIアプ
生成AIソフトウェア開発ベンチマーク SWE-benchの課題
ソフトウェア開発ベンチマークのSWE-benchにいろいろ課題が指摘されているというお話をします。
SWE-benchの課題OpenAIが提案したプログラミング課題のHumanEvalが90%以上解けるようになったので、新しいベンチマークとして2023年10月にプリンストン大学のチームが提案したのがSWE-benchです。この原稿を書いている段階ではHumanEvalのSOTAは99.3%(o1
ノーベル賞を連発する生成AI
機械学習がノーベル物理学賞を受賞したかと思ったら、化学賞もGoogle(Alphabet) DeepMind のAlphaFoldが受賞しました。ついにノーベル賞まで来たかと思うと驚きです。
機械学習がノーベル物理学賞今週驚いたのはジェフリー・ヒントン名誉教授のノーベル物理学賞です ([nhk]) 。世界が驚いたと思いますが、それ以上に本人が驚いたと思います。
生成AIの世界へのインパクトを考え
OpenAIと競合しないソフトウェアサービス
ChatGPT がCanvas機能を発表しました。今後、さまざまな高度サービスがOpenAIと競合する予感がします。OpenAIと競合しないソフトウェアサービスのお話をします。
セキュリティ、スケーラビリティ、コスト管理、自社基盤連携
OpenAIのアプリケーション戦略OpenAIはすでに画像認識、画像生成、音声、動画生成などの基盤モデルを発表しています。
マルチモーダルへの展開だけでなく、Se
OpenAIが名指す5つのライバル企業
ロイターがOpenAIが投資家にライバルなので投資しないようにと言った5つの企業のお話をします。
OpenAIの資金調達OpenAIが66億ドルの資金調達をしました ([forbesjapan])。成長していますが、今でも赤字で資金を燃やし続けているようです。株式評価額は1570億ドル(約23兆円)です。東京証券取引所の時価総額ランキングでこれを超えるのは営業利益5兆円越えのトヨタ(約40兆円)
【生成AI月例短信2024年9月】OpenAI o1, Llama 3.2
2024年9月の気になる変化を書き留めておきます。備忘録でもあります。
大規模言語モデルOpenAIからo1-preview, o1-miniがリリースされました。推論を強化しています。IQ120レベルという報道もあり話題になっています([fragai])。個人的には事前学習をするだけでなく、推論時にも計算資源をかければかけるだけ精度が上がるというのが新鮮です。また、言語ではなく推論トークンで学
生成AIの新ビジネスモデル:企業内AI監査
生成AIでどんな仕事が生み出されるのかをお話しします。
OpenAIの新しいガイドラインOpenAIの安全委員会は新しい5つの重要な領域を2024年9月に発表しました [openai]。
安全とセキュリティについて独立した機関を持つ
セキュリティ基準を拡充する
仕事に透明性を持つ
外部と協力する
安全フレームワークをモデル開発やモニタリングと一体化する
生成AIが生む新たな仕事安全と
非営利企業のガバナンスを捨てたOpenAI
もともと非営利の研究企業だったOpenAIは本格的に営利化したようです。
OpenAIの営利企業への転換OpenAIはもともと汎用人工知能の人類貢献のために作られた非営利企業でした。生成AIの開発資金を得るためにMicrosoftからの投資をうける営利部門を作りました。昨年の秋までは非営利企業の役員会が営利部門をコントロールしていましたが、Sam Altman解任騒動でそれもなくなりました。
今
生成AI動画マーケティングでリーンスタートアップ
数秒の生成AI動画サービスが増えてきています。動画生成サービスのリーンスタートアップへの応用をお話しします。
動画生成AI推論AIのOpenAI o1だけでなく動画生成AIも進化がとまりません。
KlingAI が動画生成AI Kling 1.5を発表しました。パスをあたえて物体を動かす動画を生成する機能を追加しました ([archetyp])。キャラクターやオブジェクトの動きを細かく制御するこ
安すぎる生成AIと高すぎるロボット
生成AIが人間の仕事を代替する上で課題になる2つのことをお話しします。
安すぎる生成AIOpenAIが生成AIの価格を上げることを検討しているという報道がありました ([theinformation])。
現行の生成AIは消費者向けの価格設定で月10ドルとか20ドルとか30ドルとかいうサブスクリプションの体系が多くみられます。
AI PCやAIスマホがヒットしているという話は聞きません。消費者向
生成AIの第3段階の推論段階の到来
OpenAI-o1モデルの登場で、生成AIにいよいよ推論の段階が来たというお話をします。
大規模言語モデルという名前は過去の遺物元OpenAIの Andrej Karpathyは、大規模言語モデルという名前は過去の遺物だと言っています ([[ai_explained])。
言語モデルとは単語と単語の間の関係を表すモデルです。生成AIは最初言語モデルから発生しました。人間フィードバックによる強化学
点、線、面で使う生成AI
生成AIを組織で使う3段階についてお話します。
点、線、面で使う点、線、面で使うとは次のイメージです:
点で使う:場当たり的にその場でその場で使う
線で使う:処理フロー立案から始めてライフライクル全般で使う
面で使う:プロジェクトの目的に合わせて複数の案件ライフサイクルをコーディネートして使う→部署を連携して使う
時々資料を要約する、とか、メールの文案を出してもらう、とか、絵を描く、とか
Google/OpenAIマフィアの登場
現代の生成AI起業家育成工場の話をします。
起業家育成工場起業家を次々と輩出する企業というのがあります。
日本でいえば1990年代のリクルートがそうです。
起業家精神にあふれ、人と違うことを恐れず、猛烈に働く、そういう会社です。
アメリカでいえば、PayPalが数多くの連続起業家を生んだことで有名です。Elon Muskがその代表格です。OB同士で組んで連続起業するのでPayPalマフィアと
OpenAI o1の推論トークン
夏からコードネームStrawberry、コードネームOrionと噂が出ていたOpenAIの新しいモデルがようやく出ました。推論トークナイザが実用化したのが新鮮です。
OpenAIの新モデルOpenAIがGPT-4からGPT-4 Turbo、GPT-4o、GPT-4o miniとマイナーバージョンを繰り返して、GPT-4をさんざん引っ張っていました。これはGPTにこだわりがあるのかと思ったら、次の