見出し画像

[10/19~11/01] 生成AI Weekly News #59

今回も社内で話題になった生成AIに関するニュースをご紹介します。


ピックアップ|Claude Computer use


Claudeの「Computer Use」機能は、Anthropicが開発したAI技術であり、AIが人間のようにコンピュータを操作できる能力を持っています。この機能は、ユーザーがAIに指示を出すことで、PC上での操作を自動化することが可能です。

Computer Useの基本機能|LLMでのPCの画面操作が可能に

ClaudeのComputer Use機能は、ユーザーがAIに対して具体的な指示を与えることで、PC上での操作を実行させることができます。この機能は、従来のテキストベースの対話から一歩進んだものであり、AIが実際にアプリケーションを操作したり、ファイルを管理したりすることが可能です。ユーザーは、例えば「新しいフォルダを作成して、その中に特定のファイルを移動させて」といった具体的な指示を出すことができ、AIはその指示に従って動作します。このように、Computer Useは日常的なPC作業を効率化し、ユーザーの負担を軽減することを目的としています

実際の使用例

こちらは、firefoxを立ち上げて、Amaxzonで本を買ってみる例です。

こんな意見も

AI Friendly なデザインが重要になるという意見

AIが操作しやすいコンピュータ環境を新たに作るべきという意見



プロダクト・サービス


Claude 3.5 新モデル

Anthropicは、AIモデル「Claude」の最新版として「Claude 3.5 Sonnet」と「Claude 3.5 Haiku」を発表しました。これらの新モデルは、従来のClaude 3シリーズを上回る性能を持ち、特にコーディング能力や視覚タスクにおいて顕著な改善が見られます。

特徴:

  • Claude 3.5 Sonnetは、Claude 3 Opusの2倍の速度で動作し、上位モデルを超える性能を実現しています

  • コーディング能力が大幅に向上し、SWE-bench Verifiedでのスコアが33.4%から49%に改善されました

  • 視覚タスクにおいても性能が向上し、不完全な画像からのテキスト抽出や、チャート・グラフの解釈能力が改善されています

  • 新機能「Artifacts」が導入され、コード、テキスト、ウェブサイトデザインなどのコンテンツ生成をリアルタイムでプレビューできるようになりました

  • 「computer use」機能により、AIがPCを操作できるようになり、フォーム入力やウェブブラウジングなどのタスクを人間のように実行できます

  • Claude 3.5 Haikuは、従来のClaude 3 Haikuと同等のコストと速度を維持しつつ、前世代の上位モデルを上回る性能を実現しています

  • Amazon Bedrockでも利用可能となり、Claude 3 Opusと比較してコストが5分の1に抑えられています


Stable Diffusion 3.5

Stability AIが2024年10月22日に最新の画像生成AIモデル「Stable Diffusion 3.5」をリリースしました。高いカスタマイズ性と効率的なパフォーマンスを特徴としています。
80億のパラメータを持つLargeモデルと、高速処理が可能なLarge Turboモデルが提供されており、多様なスタイルと出力をサポートしています。消費者向けハードウェアでの実行に最適化されており、プロンプト順守率と美的クオリティの向上が図られています


Runway、Act-One

入力ビデオから、キャラクターデザインされた動画に変換してくれるサービスです。


perplexity、強力な推論モード

perplexity にアップデートで加わり、強力な推論が可能になりました。

今までは回答が微妙だったような質問にもしっかりと回答してくれるようになりました。

質問文:
"Please provide me with the latest information or releases from the following areas regarding Amazon: 1. Recent acquisitions or mergers 2. Executive leadership transitions 3. Technological innovations or IT infrastructure updates 4. Cybersecurity incidents or data breaches 5. Major company announcements or significant news stories 6. Developments in user data protection and privacy policies 7. Key points from their latest 10-K filing and annual report"

回答:
https://www.perplexity.ai/search/please-provide-me-with-the-lat-wXprqGQQQ2.hExhF4XQUsQ

https://x.com/perplexity_ai/status/1848801600195989940


Felo

Feloは、日本のAIスタートアップ企業Sparticle社が開発した革新的なAI検索エンジンです。
perplexity や genspark のような検索機能に加えて、マインドマップやプレゼン資料のスライド作成が可能です。
最近、100件以上のソースを参照して検索する「深度検索」が公開されました。


Ferret-UI

WWDCで発表された Ferret-UI のウェイトリストが公開されました。
Ferret-UIとは、スマホ画面のUIを理解することに特化したマルチモーダルLLMです。


Voice Ping



ニュース


楽天モバイル、メッセージアプリ「Rakuten Link」に生成AI機能を搭載


「Apple Intelligence」米国で開始 写真や文章のAI編集機能が無料で



論文・技術系


OpenAIが超高速画像生成技術「sCM」を発表

OpenAIが新たな画像生成技術「sCM」(simplified, stabilized and scaled Consistency Models)を発表しました。この技術は、従来の拡散モデルと比較して画像生成速度を約50倍に高速化し、わずか2ステップで高品質な画像を生成することができます。sCMは15億のパラメータを持つ大規模モデルで、A100 GPU 1基で約0.11秒という驚異的な速度で画像を生成できます。


Github Copilot


GitHubが自然言語でアプリ開発可能な「GitHub Spark」を発表

GitHubは2024年10月30日に開催された年次カンファレンス「GitHub Universe」にて、自然言語を用いてアプリケーションを開発できる新ツール「GitHub Spark」を発表しました。このツールは、開発者のスキルレベルに関わらず、自然言語でAIとやり取りしながらアプリを開発し、リアルタイムでプレビューを確認できる革新的な機能を提供します。


LLMへのプロンプトでは「質問文を文章の最初に置くだけで」理解力が大幅に向上する


SimpleQA という新しいベンチマークをオープンソース化



その他ニュース


Adobe Frescoを完全無料化


Advanced Voice が macOS および Windows デスクトップ アプリで


電通、AI絵本


NTTデータが“AI営業アシスタント”提供へ 提案資料作成などを代行 「営業活動を約2.5倍に増やせる」



[ご案内] 生成AI活用のお悩み相談、開催中


現在、DX推進者・新規事業担当者限定で、弊社生成AIコンサルタントとの壁打ち1時間を無料で実施しております。

「生成AIを活用したいが何からやればいいのかわからない」
「生成AIでやりたいことは決まっているが、本当に実現できるのかわからない」
という方はぜひご相談ください。

お申し込みはコチラ


今週もニュースが盛りだくさんの1週間でした。来週もどんなニュースがあるのか楽しみです!

今週もお疲れ様でした!

=========================================
この note が気に入ってくれた方は、
ぜひ「いいね」と「フォロー」をお願いします♪

X でも生成AI や LLM に関する情報を発信してますので、
ぜひ覗いてみてください!

「株式会社エクスプラザ(公式)」アカウント
https://twitter.com/explaza_inc

生成AI事例集

会社HP

いいなと思ったら応援しよう!