コンテンツにスキップ

Claude Fable 5公開:Mythos級モデルを一般提供する意味

対象 / ポイント

対象: Claude系モデルの最新動向を追う開発者/AIエージェント基盤を設計する技術リーダー/Anthropicの発表を誇張なしで理解したい読者

ポイント:

  • Claude Fable 5 は、Mythos級能力を一般提供する初のClaudeモデル である
  • Fable 5 と Mythos 5 の差は、基盤能力ではなく提供条件とセーフガード設計 にある
  • 導入判断では性能より先に、フォールバック、30日保持、APIの拒否処理を見る必要がある

2026年6月9日、Anthropic は Claude Fable 5 と Claude Mythos 5 を同時に発表した1。ニュースの中心は「また新しい高性能モデルが出た」ことではない。これまで限定枠に閉じていた Mythos級の能力が、Fable 5 という形で一般提供に入ったことだ。

ただし、Fable 5 は「Mythosをそのまま一般公開したモデル」ではない。Anthropic の説明では、Fable 5 と Mythos 5 は同じ基盤能力を共有する一方、提供対象とセーフガードのかかり方が違う12

本記事の問いはシンプルだ。Fable 5 は何が新しく、開発者は導入前にどこを確認すべきか。

Mythos級とは何か

Mythos級は、Anthropicのモデル階層でOpus級の上に置かれた能力帯である。 2026年4月の Claude Mythos Preview が最初の例で、当時は Project Glasswing 経由の限定提供にとどまっていた1

今回の発表で、同じ能力帯が2つに分かれた。

モデル提供範囲主な違い
Claude Fable 5一般提供サイバー、バイオ・化学、蒸留系の安全分類器を備える
Claude Mythos 5限定提供Project Glasswing などの承認済み枠で、対象領域のセーフガードを外して提供

ここで重要なのは、名前の違いではない。能力を広く配る側が Fable 5、危険領域の制限を外して承認済み利用者に出す側が Mythos 5 という分け方だ。

Anthropic は Fable 5 を、自社が広く提供した中で最も能力の高いモデルと位置づけている13。タスクが長く複雑になるほど、既存Claudeモデルとの差が広がるという説明だ。

Fable 5の肝は「拒否」ではなく「迂回」にある

Fable 5 の安全設計は、危険そうなリクエストを単純に止めるだけではない。 Anthropic の発表では、サイバー、バイオ・化学、蒸留に関わるリクエストを分類器が検知した場合、Claude Opus 4.8 が応答を引き受ける方式が説明されている1

この設計は、利用者体験としては「拒否」より柔らかい。Fable 5 が扱うには危険な領域でも、Opus 4.8 で答えられる範囲は残す。Anthropic は初期データとして、Fable 5 セッションの95%以上ではフォールバックが発生していないとも説明している1

ただし、API実装ではもう一段細かく見る必要がある。Claude API docs は、Fable 5 が拒否した場合に Messages API が stop_reason: "refusal" を HTTP 200 として返すこと、必要に応じて fallbacks パラメータやSDK側の再試行を使うことを説明している2

つまり、Claudeアプリ上の体験とAPI統合の責任範囲は同じではない。アプリ利用者は切り替え通知を見るだけで済む場面が多いが、API利用者は拒否レスポンス、フォールバック、課金、ログを自分の実装で扱う必要がある。

性能評価は強いが、読む順番を間違えない

公開情報だけを見る限り、Fable 5 と Mythos 5 は長期・自律タスクで大きく伸びたモデルとして描かれている。 Anthropic は、ソフトウェア工学、知識労働、視覚、長コンテキスト、生命科学の領域で強い結果を示したと説明している1

実利用に近い例も挙げられている。

  • ソフトウェア工学: Stripe が、5,000万行規模のRubyコードベースのマイグレーションを1日で進めたと報告
  • 視覚: Pokémon FireRed を、地図や追加ゲーム状態なしの最小限の視覚ハーネスでクリア
  • 長コンテキスト: 数百万トークン規模の長時間タスクで集中を維持し、メモを使って出力を改善
  • 生命科学: Mythos 5 がタンパク質設計プロセスの一部を約10倍に加速し、分子生物学の仮説評価でも社内科学者に高く選ばれたと説明

この部分は派手に読める。だが、公開記事として扱うなら、これらはAnthropicと早期アクセス先の報告であり、独立した外部検証とは分けて読む必要がある。

主要ベンチマークでも、Fable 5 と Mythos 5 は多くの行で Opus 4.8 を上回る。System Card の評価サマリーから、実務判断に効きやすい項目を抜粋すると次の通りだ4

領域Mythos 5Fable 5Opus 4.8GPT-5.5Gemini 3.1 Pro
SWE-bench Pro80.380.069.258.654.2
SWE-bench Verified95.595.088.680.6
Terminal-Bench 2.188.084.382.783.470.7
FrontierCode Diamond29.313.45.7
GDPval-AA1932189017691314
GDP.pdf29.822.524.916.7
Blueprint-Bench 238.614.536.226.5
AutomationBench17.415.512.99.6
OSWorld-Verified85.085.083.478.776.2
Legal Agent(Harvey held-out)13.310.42.10.0

この表で読み違えやすいのは、Fable列が空欄の行を「Fableも同じ」と読まないことだ。System Card は、Fable の数値は本番セーフガードと Opus 4.8 へのフォールバックを含むと説明している4

特にサイバーとバイオは別扱いで見る。ExploitBench では Mythos 5 が Cap% 78、Opus 4.8 が40、GPT-5.5 が34だった一方、Fable 5 のサイバーセーフガードは410エピソード中407件を検知している4。BioMysteryBench の hard subset でも Mythos 5 は46.1%、Opus 4.8 は40.0%だが、これは公開Fableの通常応答性能として読む数字ではない4

つまり、一般公開の Fable 5 は、多くの通常タスクでは Mythos級に近い能力を使えるが、危険領域ではMythos値ではなくセーフガード後の挙動を見る。ここを分けないと、ベンチマーク表だけが一人歩きする。

開発者にとっての実務上の価値は、「ベンチマークが何点か」よりも「どの種類の仕事を任せると差が出るか」にある。Fable 5 は短いQ&Aの置き換えより、長い調査、移行、設計、検証を1つの流れで進めるタスクに向くモデルとして読める。

価格と提供条件で見るべき点

価格は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルである。 Claude API docs でも claude-fable-5 がAPIモデルIDとして示され、1Mトークンのコンテキストウィンドウと最大128k出力が説明されている23

提供条件は、利用面でかなり重要だ。

項目内容
API / 従量制Enterprise2026年6月9日から利用可能
Pro / Max / Team / シート制Enterprise2026年6月9日から6月22日まで追加費用なし
2026年6月23日以降上記サブスクリプションでは利用にクレジットが必要
Mythos 5Project Glasswing などの承認済み利用者に限定

一時的にサブスクリプションへ含まれる点だけを見ると、通常の新モデル公開に見える。しかし、6月23日以降は扱いが変わる。継続利用の前提は、無料枠ではなくクレジット消費と容量制約で見るべきだ。

30日保持は導入前に確認する

Fable 5 と Mythos 5 は Covered Models に指定され、30日間のデータ保持が前提になる。 Anthropic のヘルプでは、該当モデルではゼロデータ保持が利用できず、プロンプトと出力が少なくとも30日保持されると説明されている56

Anthropic は、このデータを新しいClaudeモデルの学習や安全目的以外には使わないと説明している1。また、人間によるアクセスは重大リスクのフラグや顧客からの書面依頼などに限られ、アクセスはログ化されるという説明もある6

それでも、企業導入では軽い注記で済まない。ZDRを前提にしたワークスペース、規制対象データ、顧客データの持ち込みがある環境では、Fable 5 は単なるモデル差し替えではない

ここは法務・セキュリティ・調達の確認事項になる。特にClaude CodeやAPIで機密リポジトリを扱う組織では、モデルIDの変更だけで本番へ入れないほうがよい。

導入判断:最初に見る4点

Fable 5 を試す価値は高いが、導入判断は性能表から始めないほうがよい。 先に見るべきは運用上の摩擦だ。

  1. フォールバック設計: stop_reason: "refusal"、再試行先、ユーザー表示、ログを決める
  2. 対象領域: サイバー、バイオ・化学、モデル蒸留に近いワークロードでは誤検知を見込む
  3. データ保持: ZDRや第三者クラウド経由の扱いを確認する
  4. タスク設計: 短い質問ではなく、長時間の移行・調査・設計・検証に当てる

この4点を通せるなら、Fable 5 は既存のOpus級モデルとは違う役割を持つ。単発回答の品質改善ではなく、長い仕事をどこまで一続きで任せるかを試すモデルだ。

まとめ

Claude Fable 5 の本質は、Mythos級能力の一般提供である。ただし、それは「危険な能力をそのまま開放した」という話ではない。能力、セーフガード、データ保持、アクセス制御を組み合わせて、同じ基盤能力を複数の提供形態に分けたことが今回の構造だ。

ここから先のフロンティアモデルは、単純な「Haiku / Sonnet / Opus のどれが賢いか」だけでは選べない。モデルの能力差だけでなく、どの領域で止まり、どのモデルに迂回し、どのデータ保持条件で動くかが製品仕様そのものになる。

Fable 5 は、その変化をかなりはっきり見せたモデルだ。開発者が見るべきなのは性能の高さだけではない。性能と安全装置が一体化した実行環境として、Claudeをどう組み込むかである。

関連記事