
新時代の AIシステム:Claude 3.7 Sonnet と Claude Code の登場
2025年2月25日、Anthropicは同社最高の知能を持つモデル「Claude 3.7 Sonnet」と、開発者向けのコマンドラインツール「Claude Code」を発表しました。この記事では、これらの革新的なAIツールについて詳しく解説します。
Claude 3.7 Sonnet:市場初のハイブリッド推論モデル
Claude 3.7 Sonnetは、Anthropicが提供する中で最もインテリジェンスなモデルであり、市場初の「ハイブリッド推論モデル」として登場しました。このモデルの最大の特徴は、通常の生成モデルとリーズニングモデル(思考モデル)を切り替えて使用することが可能な点です。
主な特徴
二つのモード: 通常モードと拡張思考モードを切り替え可能
思考過程の可視化: ユーザーはClaudeの思考プロセスを見ることができる
API制御: APIユーザーは思考にかける時間を細かく制御可能
コーディング能力の向上: 特にコーディングとフロントエンド開発で大きな進歩
広範な利用可能性: Free、Pro、Team、Enterpriseの全プランで利用可能
(拡張思考モードはフリープラン以外で利用可能)一貫した価格設定: 入力100万トークンあたり$3、出力100万トークンあたり$15(思考トークンを含む)
推論モデルの新たな哲学
Anthropicは他の推論モデルとは異なるアプローチを採用しています。人間が単一の脳で即時応答と深い思考の両方を行うように、推論は別モデルではなく最先端モデルの統合機能であるべきという考え方です。
Claude 3.7 Sonnetはこの哲学を具現化しているとのことで、一つのモデルで通常のLLMと推論モデルの両方の機能を提供しています。また、APIでは最大128Kトークンまでの「思考予算」を設定できるため、速度(およびコスト)と回答の質のバランスを調整できます。
Claude Code:開発者のための画期的ツール
Claude Codeは、Anthropicが提供する初のエージェント型コーディングツールとして、限定的な研究プレビューとして公開されました。
できること
コードの検索と読み取り
ファイルの編集
テストの作成と実行
GitHubへのコミットとプッシュ
コマンドラインツールの使用
Anthropicの開発チームでは、このツールがテスト駆動開発、複雑な問題のデバッグ、大規模なリファクタリングに特に役立っているとのこと。通常45分以上かかる作業を1回の操作で完了させ、開発時間とオーバーヘッドを削減しているとのことです。
今後数週間で、ツール呼び出しの信頼性向上、長時間実行コマンドのサポート、アプリ内レンダリングの改善などが計画されています。
ベンチマークでの優れた成績
Claude 3.7 Sonnetは、SWE-bench VerifiedとTAU-benchで最先端の性能を達成しています。指示に従う能力、一般的な推論、マルチモーダル機能、エージェント型コーディングなど幅広い分野で優れた成績を収めています。
拡張思考モードでは、数学や科学分野でのパフォーマンスが大幅に向上しています。
セーフティと責任あるAI開発
Anthropicは、Claude 3.7 Sonnetが安全性、セキュリティ、信頼性の基準を満たすことを確認するため、外部の専門家と協力して様々なテストと評価を実施しました。新モデルは有害な要求と無害な要求をより細かく区別し、前モデルと比較して不必要な拒否を45%削減しているとのことです。
さいごに
Anthropicはプロダクトを生み出すのがうまいですね。
ユーザーの課題と現在の環境を見ながら今あるべきAIの形をは何かを的確に提案してきている印象があります。
AIの進化はますます加速しています。次世代の知的支援ツールとして、Claude 3.7 SonnetとClaude Codeが私たちの仕事や創造性にどのような影響をもたらすのか、今後の展開に注目していきましょう。
いいなと思ったら応援しよう!
