新時代の AIシステム：Claude 3.7 Sonnet と Claude Code の登場

2025年2月25日 13:34

2025年2月25日、Anthropicは同社最高の知能を持つモデル「Claude 3.7 Sonnet」と、開発者向けのコマンドラインツール「Claude Code」を発表しました。この記事では、これらの革新的なAIツールについて詳しく解説します。

Claude 3.7 Sonnet：市場初のハイブリッド推論モデル

Claude 3.7 Sonnetは、Anthropicが提供する中で最もインテリジェンスなモデルであり、市場初の「ハイブリッド推論モデル」として登場しました。このモデルの最大の特徴は、通常の生成モデルとリーズニングモデル(思考モデル)を切り替えて使用することが可能な点です。

Anthropicは他の推論モデルとは異なるアプローチを採用しています。人間が単一の脳で即時応答と深い思考の両方を行うように、推論は別モデルではなく最先端モデルの統合機能であるべきという考え方です。

Claude 3.7 Sonnetはこの哲学を具現化しているとのことで、一つのモデルで通常のLLMと推論モデルの両方の機能を提供しています。また、APIでは最大128Kトークンまでの「思考予算」を設定できるため、速度（およびコスト）と回答の質のバランスを調整できます。

Claude Codeは、Anthropicが提供する初のエージェント型コーディングツールとして、限定的な研究プレビューとして公開されました。

Anthropicの開発チームでは、このツールがテスト駆動開発、複雑な問題のデバッグ、大規模なリファクタリングに特に役立っているとのこと。通常45分以上かかる作業を1回の操作で完了させ、開発時間とオーバーヘッドを削減しているとのことです。

今後数週間で、ツール呼び出しの信頼性向上、長時間実行コマンドのサポート、アプリ内レンダリングの改善などが計画されています。

Claude 3.7 Sonnetは、SWE-bench VerifiedとTAU-benchで最先端の性能を達成しています。指示に従う能力、一般的な推論、マルチモーダル機能、エージェント型コーディングなど幅広い分野で優れた成績を収めています。

拡張思考モードでは、数学や科学分野でのパフォーマンスが大幅に向上しています。

Anthropicは、Claude 3.7 Sonnetが安全性、セキュリティ、信頼性の基準を満たすことを確認するため、外部の専門家と協力して様々なテストと評価を実施しました。新モデルは有害な要求と無害な要求をより細かく区別し、前モデルと比較して不必要な拒否を45%削減しているとのことです。

Anthropicはプロダクトを生み出すのがうまいですね。
ユーザーの課題と現在の環境を見ながら今あるべきAIの形をは何かを的確に提案してきている印象があります。

AIの進化はますます加速しています。次世代の知的支援ツールとして、Claude 3.7 SonnetとClaude Codeが私たちの仕事や創造性にどのような影響をもたらすのか、今後の展開に注目していきましょう。

記事を投稿する大きなモチベーションになりますので，宜しければサポートをお願い致します．