コンテンツにスキップ

Claude Code 完全ガイド

Claude Sonnet 4.5発表 - コーディング性能業界トップを主張

2025年9月30日(日本時間)発表

米Anthropicは最新AIモデル「Claude Sonnet 4.5」をリリース。同社は本モデルを「世界最高のコーディングモデル」と位置づけ、従来モデルから大幅な性能向上を実現したとしている。

この記事の対象者

  • AI開発ツールの最新動向を追う中級エンジニア

この記事のポイント

  1. Claude Sonnet 4.5の主要ベンチマーク性能を把握
  2. 30時間自律稼働などの技術的進化ポイントを理解
  3. 価格・利用可能性と今後の展開を確認

主要ベンチマーク性能

SWE-bench Verified

実世界のソフトウェアエンジニアリングタスクを測定するSWE-bench Verifiedにおいて、Claude Sonnet 4.5は77.2%を記録。高計算設定では82.0%まで到達し、業界トップの数値を主張している。

OSWorld

PC操作能力を評価するOSWorldベンチマークでは61.4%を達成。前モデルClaude Sonnet 4の42.2%から大幅に改善している。

技術的な進化ポイント

長時間自律稼働

最大の特徴は30時間以上の継続的な自律作業が可能になった点だ。企業での初期試験では以下のタスクを自律的に完遂した実績が報告されている:

  • データベースサービスの構築
  • ドメイン名の取得
  • SOC 2監査の実施
  • 複数ステップにわたる複雑なアプリケーション開発

コンピューター操作能力

ブラウザを直接操作し、Webサイトのナビゲーション、スプレッドシートへの入力などを実行できる。この機能は「Claude for Chrome」拡張機能として提供される予定で、現在はMaxプランユーザーの順番待ちリストに登録したユーザーから利用可能となっている。

詳細: 推論・数学能力の向上 ### AIME性能 数学オリンピック問題を扱うAIMEでは、拡張思考機能を用いて64Kの推論トークンを使用し、競合モデルと同等の性能を発揮。金融、法律、医療、STEMの専門家からも、従来のOpus 4.1と比較して専門知識と推論能力が大幅に向上しているとの評価を得ている。

安全性とアライメント

Anthropicは本モデルを「最もアライメントが取れたフロンティアモデル」と説明:

  • 過度な追従性、欺瞞、権力志向などの問題行動を大幅に低減
  • プロンプトインジェクション攻撃への耐性を向上
  • AI安全性レベル3(ASL-3)での公開
  • CBRN関連の入出力を検出するフィルター実装

関連製品のアップグレード

Claude Code 2.0

  • チェックポイント機能: 作業を保存し、前の状態へ即座にロールバック可能
  • VS Code拡張機能: IDEから直接Claude Codeを利用可能に
  • ターミナルインターフェース2.0: プロンプト履歴の検索機能(Ctrl+r)を追加

Claude Agent SDK

従来のClaude Code SDKをリブランディング。コーディング以外の多様なタスクにも対応できるエージェント構築ツールとして提供される。

Claude API

  • コンテキスト編集機能: 古いコンテキストを自動的にクリア
  • メモリツール: コンテキストウィンドウ外に情報を保存し、長時間実行タスクを管理

Imagine with Claude - 期間限定の実験機能

Maxサブスクライバー向けに5日間限定(2025年9月30日〜10月3日)で「Imagine with Claude」を提供。事前に決められた機能やコードが一切存在せず、Claudeがリアルタイムでソフトウェアを生成する様子を体験できる。

アクセスURL: https://claude.ai/imagine

価格設定と利用可能性

価格はClaude Sonnet 4と同額に据え置き:

項目価格
入力$3/100万トークン
出力$15/100万トークン

利用可能なプラットフォーム:Claude API、Amazon Bedrock、Google Cloud Vertex AI、OpenRouter、Cursor、GitHub Copilot

発表当日から主要プラットフォームで即座に利用可能。

市場への影響

前モデルのSonnet 4発表が2025年5月下旬だったことを考えると、わずか4ヶ月でのメジャーアップグレードは開発スピードの速さを物語る。Anthropicの内部関係者によれば、サブスクリプションサービスのランレートは8月時点で50億ドルを突破。

AppleやMetaが社内でClaudeモデルを利用しているとの報道もあり、エンタープライズ市場での採用が加速している。

次のステップ


本記事は2025年9月30日時点での公開情報に基づいています。