見出し画像

進化したClaude 3.5 「Sonnet」と「 Haiku」

みなさんこんにちは!
今日は、進化したClaudeがヤバすぎる!と、今話題の新モデル「Claude 3.5 Sonnet」と「Claude 3.5 Haiku」についてお届けします。


2024年10月23日、Anthropicはその最新モデル、「Claude 3.5 Sonnet」「Claude 3.5 Haiku」を発表しました。

画像元:Anthropic公式

「Claude 3.5 Sonnet」概要

Claude 3.5 Sonnetは、アップグレードされたモデルで、特にコーディングスキルが強化されています。
既存のモデルを大きく上回る性能を持ち、AIエージェントのコーディングタスクで高いスコアを叩き出しています。
例えば、GitLabはこのモデルを使って、複雑なソフトウェア開発プロセスをより効率的に進められることを発見しました。

Claude 3.5 Sonnetの主な特徴

  • コーディング性能の向上: SWE-bench Verifiedで33.4%から49.0%に、GPQAで59.4%から65.0%に向上し、OpenAI o1-previewや他の専用モデルを上回っています

  • 安全性とプライバシー: 厳格なテストを経て、ASL-2基準を満たしており、安全性とプライバシーの面で高評価を受けています。

  • ツール使用能力の進化: TAU-benchで小売分野で62.6%から69.2%、航空分野で36.0%から46.0%に改善しました。

  • 基礎的な理解力と推論: 大学院レベルの推論(GPQA)で65.0%、学部レベルの知識(MMLU Pro)で78.0%を達成しています。

「Claude 3.5 Haiku」概要

Claude 3.5 Haikuは、スピードとコストにおいて非常に優れたモデルです。
前モデルと同じコストとスピードで、最上位モデルのClaude 3 Opusに匹敵するパフォーマンスを発揮するんだとか。
特にコーディングタスクにおいては、以前の最大モデルを凌ぐ性能を発揮しており、多くの場面で役立つこと間違いありません。

Claude 3.5 Haikuの主な特徴

  • コーディング能力: 特にプログラミングタスクで優れており、HumanEvalでは88.1%のスコア、SWE-bench Verifiedでは40.6%のスコアを記録しています。

  • 数学的な推論: 数学的な推論を評価する「MATH」では69.2%のスコアを達成しています。

  • 高速処理: 応答速度が非常に速く、従来のモデルよりも3倍以上高速です。

  • セキュリティ: エンタープライズグレードのセキュリティと堅牢性を有しています。

画像元:Anthropic公式

「Computer use」 - 新しいAPI機能

今回の目玉は「Computer use」という新機能なんです。
なんと、クロードがまるで人間のようにコンピューターを操作できるようになったそうです。
API を介して Claude を統合することで画面を見たり、カーソルを動かしたり、ボタンをクリックしたり、テキストを入力したりして、人間と同じようにコンピューターを使用するように指示できます。
使い方はとってもシンプルです。
まず、開発者の方は、「Computer use」機能を統合したAPIを準備します。そして、クロードに指示を出すんです。
例えば、「コンピューターとオンラインのデータを使って、このフォームに入力してね」といった具合です。

すると、クロードはその指示を理解して、必要なコンピューター操作に変換します。
スプレッドシートをチェックしたり、Webブラウザを開いて情報を検索したり、フォームに数値を入力したりと、まるで人間のようにコンピューターを使いこなすんです。すごいですよね!

これにより、反復的なプロセスの自動化ソフトウェアのビルドとテスト研究などの自由形式のタスクが実現可能になります。

Anthropic 



この機能はまだ実験的であり、時々エラーが発生する可能性があります。
Anthropicは、開発者からのフィードバックを基に急速な機能の向上を目指しているそうです。

両モデルとも、Anthropic APIAmazon BedrockGoogle CloudのVertex AIで利用可能です。

プライシング

まとめ

  • Claude 3.5 Sonnet:コーディングスキルが強化
             
    既存のモデルを大きく上回る性能

  • Claude 3.5 Haiku:スピードとコストにおいて非常に優れたモデル
             
    低価格なのに高性能

  • Computer use:まるで人間のようにコンピューターを操作できる
           
    指示に従ってパソコンを操作する「頼れるアシスタント」      

この新機能により、私たちの仕事の仕方が大きく変わるかもしれませんね。反復作業の自動化やソフトウェアのテストなど、AIにお任せできそうです。
将来的には、もっと幅広い分野で活用できそうです。

参考:


最後まで読んでくださりありがとうございます!
suki♡が励みになります♪
毎週水曜日に、AIに関する情報を投稿しておりますので、ぜひフォローして覗きにきてくださいね☆

この記事が気に入ったらサポートをしてみませんか?