
Claude 3.7 Sonnet: AIの新時代を切り開くハイブリッド推論モデル
この記事で分かること
Claude 3.7 Sonnetの特徴や利用方法
API料金の比較
主要な大規模言語モデル(LLM)との違いについて

Anthropicは最新のAIモデル「Claude 3.7 Sonnet」をリリースしました。このモデルは、AI技術の新たなマイルストーンとして注目を集めています。
Claude 3.7はハイブリッド推論モデルとして設計されており、迅速な回答を提供する標準モードと、複雑な問題に段階的な推論で対応する拡張思考モードを備えています。
特にコーディングやフロントエンド開発で優れた性能を発揮し、主要なベンチマークでその実力を証明しています。
Claude 3.5 の段階でもかなりコーディングに優れた機能を発揮していたため、個人的にも待望の発表でした!
着々と確実に目的に向かって実装してくれる。
— 江頭 伸太郎/エンジニア起業 (@shintech_AI) February 25, 2025
継続してAIを触っていると、開発体験が徐々に変わっていくなと感じる。 https://t.co/ZKfegxbozd pic.twitter.com/eTBZ5DXhU6
Claude 3.7 Sonnetとは?
Claude 3.7 Sonnetは、Anthropicが開発した最新のAIモデルで、2025年2月24日にリリースされました。
このモデルは「ハイブリッド推論モデル」として特徴づけられ、ユーザーが状況に応じて以下の2つのモードを選択できます:
標準モード:迅速な回答を提供し、前モデル「Claude 3.5 Sonnet」のアップグレード版として機能します。
拡張思考モード:数学、物理、コーディングなどの複雑なタスクに対応するため、段階的な推論を行います。このモードでは思考プロセスが可視化され、ユーザーが結果の信頼性を確認しやすくなっています。
拡張思考モードでは、APIユーザーが「思考予算」を設定でき、最大128Kトークンの出力制限内で調整が可能です。
これにより、速度と品質のバランスをカスタマイズできます。Anthropicの公式発表によると、この柔軟性は企業がコストと性能を最適化するのに役立つとされています。
ベンチマークスコア

Claude 3.7 sonnetはコーディングとフロントエンド開発で特に優れた性能を発揮します。
例えば、SWE-bench Verifiedベンチマークでは、ハイコンピュート環境で70.3%(n=489タスク)、低コンピュート環境で63.7%のスコアを記録。
また、TAU-benchでは計画ツールを活用して最大100ステップの処理が可能です。
ユニークな例として、AnthropicはClaude 3.7をポケモン赤でテストし、
3つのジムリーダーを倒すことに成功したそうです。

Claude3.7 Sonnet 利用料金と比較表

Claude 3.7 Sonnetはユーザーと開発者に提供開始されましたが、モデルの推論機能へのアクセスは、Anthropicのプレミアムプラン(Claude Pro)を利用するユーザーに限定されています。
また無料プランでは2回プロンプトを打ち込んでだけで、使用制限にかかったので実質的には課金が必要かと思います。
Claude3.7 Sonnet API料金
基本料金:
入力100万トークン $3 / 出力100万トークン $15コスト最適化機能:
プロンプトキャッシュで最大90%削減 / バッチ処理で50%削減可能エンタープライズ向け:
API経由で思考トークン数制御(1-128Kトークン)可能
Claude開発者コンソール
この記事が気に入ったらチップで応援してみませんか?