Claude Fable 5公開：Mythos級モデルを一般提供する意味¶

対象 / ポイント

対象: Claude系モデルの最新動向を追う開発者／AIエージェント基盤を設計する技術リーダー／Anthropicの発表を誇張なしで理解したい読者

ポイント:

Claude Fable 5 は、Mythos級能力を一般提供する初のClaudeモデル である
Fable 5 と Mythos 5 の差は、基盤能力ではなく提供条件とセーフガード設計 にある
導入判断では性能より先に、フォールバック、30日保持、APIの拒否処理を見る必要がある

2026年6月9日、Anthropic は Claude Fable 5 と Claude Mythos 5 を同時に発表した¹。ニュースの中心は「また新しい高性能モデルが出た」ことではない。これまで限定枠に閉じていた Mythos級の能力が、Fable 5 という形で一般提供に入ったことだ。

ただし、Fable 5 は「Mythosをそのまま一般公開したモデル」ではない。Anthropic の説明では、Fable 5 と Mythos 5 は同じ基盤能力を共有する一方、提供対象とセーフガードのかかり方が違う¹²。

本記事の問いはシンプルだ。Fable 5 は何が新しく、開発者は導入前にどこを確認すべきか。

Mythos級とは何か¶

Mythos級は、Anthropicのモデル階層でOpus級の上に置かれた能力帯である。 2026年4月の Claude Mythos Preview が最初の例で、当時は Project Glasswing 経由の限定提供にとどまっていた¹。

今回の発表で、同じ能力帯が2つに分かれた。

モデル	提供範囲	主な違い
Claude Fable 5	一般提供	サイバー、バイオ・化学、蒸留系の安全分類器を備える
Claude Mythos 5	限定提供	Project Glasswing などの承認済み枠で、対象領域のセーフガードを外して提供

ここで重要なのは、名前の違いではない。能力を広く配る側が Fable 5、危険領域の制限を外して承認済み利用者に出す側が Mythos 5 という分け方だ。

Anthropic は Fable 5 を、自社が広く提供した中で最も能力の高いモデルと位置づけている¹³。タスクが長く複雑になるほど、既存Claudeモデルとの差が広がるという説明だ。

Fable 5の肝は「拒否」ではなく「迂回」にある¶

Fable 5 の安全設計は、危険そうなリクエストを単純に止めるだけではない。 Anthropic の発表では、サイバー、バイオ・化学、蒸留に関わるリクエストを分類器が検知した場合、Claude Opus 4.8 が応答を引き受ける方式が説明されている¹。

この設計は、利用者体験としては「拒否」より柔らかい。Fable 5 が扱うには危険な領域でも、Opus 4.8 で答えられる範囲は残す。Anthropic は初期データとして、Fable 5 セッションの95%以上ではフォールバックが発生していないとも説明している¹。

ただし、API実装ではもう一段細かく見る必要がある。Claude API docs は、Fable 5 が拒否した場合に Messages API が stop_reason: "refusal" を HTTP 200 として返すこと、必要に応じて fallbacks パラメータやSDK側の再試行を使うことを説明している²。

つまり、Claudeアプリ上の体験とAPI統合の責任範囲は同じではない。アプリ利用者は切り替え通知を見るだけで済む場面が多いが、API利用者は拒否レスポンス、フォールバック、課金、ログを自分の実装で扱う必要がある。

性能評価は強いが、読む順番を間違えない¶

公開情報だけを見る限り、Fable 5 と Mythos 5 は長期・自律タスクで大きく伸びたモデルとして描かれている。 Anthropic は、ソフトウェア工学、知識労働、視覚、長コンテキスト、生命科学の領域で強い結果を示したと説明している¹。

実利用に近い例も挙げられている。

ソフトウェア工学: Stripe が、5,000万行規模のRubyコードベースのマイグレーションを1日で進めたと報告
視覚: Pokémon FireRed を、地図や追加ゲーム状態なしの最小限の視覚ハーネスでクリア
長コンテキスト: 数百万トークン規模の長時間タスクで集中を維持し、メモを使って出力を改善
生命科学: Mythos 5 がタンパク質設計プロセスの一部を約10倍に加速し、分子生物学の仮説評価でも社内科学者に高く選ばれたと説明

この部分は派手に読める。だが、公開記事として扱うなら、これらはAnthropicと早期アクセス先の報告であり、独立した外部検証とは分けて読む必要がある。

主要ベンチマークでも、Fable 5 と Mythos 5 は多くの行で Opus 4.8 を上回る。System Card の評価サマリーから、実務判断に効きやすい項目を抜粋すると次の通りだ⁴。

領域	Mythos 5	Fable 5	Opus 4.8	GPT-5.5	Gemini 3.1 Pro
SWE-bench Pro	80.3	80.0	69.2	58.6	54.2
SWE-bench Verified	95.5	95.0	88.6	—	80.6
Terminal-Bench 2.1	88.0	84.3	82.7	83.4	70.7
FrontierCode Diamond	—	29.3	13.4	5.7	—
GDPval-AA	—	1932	1890	1769	1314
GDP.pdf	—	29.8	22.5	24.9	16.7
Blueprint-Bench 2	—	38.6	14.5	36.2	26.5
AutomationBench	—	17.4	15.5	12.9	9.6
OSWorld-Verified	85.0	85.0	83.4	78.7	76.2
Legal Agent（Harvey held-out）	—	13.3	10.4	2.1	0.0

この表で読み違えやすいのは、Fable列が空欄の行を「Fableも同じ」と読まないことだ。System Card は、Fable の数値は本番セーフガードと Opus 4.8 へのフォールバックを含むと説明している⁴。

特にサイバーとバイオは別扱いで見る。ExploitBench では Mythos 5 が Cap% 78、Opus 4.8 が40、GPT-5.5 が34だった一方、Fable 5 のサイバーセーフガードは410エピソード中407件を検知している⁴。BioMysteryBench の hard subset でも Mythos 5 は46.1%、Opus 4.8 は40.0%だが、これは公開Fableの通常応答性能として読む数字ではない⁴。

つまり、一般公開の Fable 5 は、多くの通常タスクでは Mythos級に近い能力を使えるが、危険領域ではMythos値ではなくセーフガード後の挙動を見る。ここを分けないと、ベンチマーク表だけが一人歩きする。

開発者にとっての実務上の価値は、「ベンチマークが何点か」よりも「どの種類の仕事を任せると差が出るか」にある。Fable 5 は短いQ&Aの置き換えより、長い調査、移行、設計、検証を1つの流れで進めるタスクに向くモデルとして読める。

価格と提供条件で見るべき点¶

価格は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルである。 Claude API docs でも claude-fable-5 がAPIモデルIDとして示され、1Mトークンのコンテキストウィンドウと最大128k出力が説明されている²³。

提供条件は、利用面でかなり重要だ。

項目	内容
API / 従量制Enterprise	2026年6月9日から利用可能
Pro / Max / Team / シート制Enterprise	2026年6月9日から6月22日まで追加費用なし
2026年6月23日以降	上記サブスクリプションでは利用にクレジットが必要
Mythos 5	Project Glasswing などの承認済み利用者に限定

一時的にサブスクリプションへ含まれる点だけを見ると、通常の新モデル公開に見える。しかし、6月23日以降は扱いが変わる。継続利用の前提は、無料枠ではなくクレジット消費と容量制約で見るべきだ。

30日保持は導入前に確認する¶

Fable 5 と Mythos 5 は Covered Models に指定され、30日間のデータ保持が前提になる。 Anthropic のヘルプでは、該当モデルではゼロデータ保持が利用できず、プロンプトと出力が少なくとも30日保持されると説明されている⁵⁶。

Anthropic は、このデータを新しいClaudeモデルの学習や安全目的以外には使わないと説明している¹。また、人間によるアクセスは重大リスクのフラグや顧客からの書面依頼などに限られ、アクセスはログ化されるという説明もある⁶。

それでも、企業導入では軽い注記で済まない。ZDRを前提にしたワークスペース、規制対象データ、顧客データの持ち込みがある環境では、Fable 5 は単なるモデル差し替えではない。

ここは法務・セキュリティ・調達の確認事項になる。特にClaude CodeやAPIで機密リポジトリを扱う組織では、モデルIDの変更だけで本番へ入れないほうがよい。

導入判断：最初に見る4点¶

Fable 5 を試す価値は高いが、導入判断は性能表から始めないほうがよい。 先に見るべきは運用上の摩擦だ。

フォールバック設計: stop_reason: "refusal"、再試行先、ユーザー表示、ログを決める
対象領域: サイバー、バイオ・化学、モデル蒸留に近いワークロードでは誤検知を見込む
データ保持: ZDRや第三者クラウド経由の扱いを確認する
タスク設計: 短い質問ではなく、長時間の移行・調査・設計・検証に当てる

この4点を通せるなら、Fable 5 は既存のOpus級モデルとは違う役割を持つ。単発回答の品質改善ではなく、長い仕事をどこまで一続きで任せるかを試すモデルだ。

まとめ¶

Claude Fable 5 の本質は、Mythos級能力の一般提供である。ただし、それは「危険な能力をそのまま開放した」という話ではない。能力、セーフガード、データ保持、アクセス制御を組み合わせて、同じ基盤能力を複数の提供形態に分けたことが今回の構造だ。

ここから先のフロンティアモデルは、単純な「Haiku / Sonnet / Opus のどれが賢いか」だけでは選べない。モデルの能力差だけでなく、どの領域で止まり、どのモデルに迂回し、どのデータ保持条件で動くかが製品仕様そのものになる。

Fable 5 は、その変化をかなりはっきり見せたモデルだ。開発者が見るべきなのは性能の高さだけではない。性能と安全装置が一体化した実行環境として、Claudeをどう組み込むかである。