AnthropicがClaude Fable 5を一般公開-「危険すぎて公開できない」Mythos クラスをセーフガード付きで解禁

セキュリティニュース

投稿日時: 更新日時:

AnthropicがClaude Fable 5を一般公開-「危険すぎて公開できない」Mythos クラスをセーフガード付きで解禁

2026年6月9日、Anthropicは公式サイトで「Claude Fable 5」と「Claude Mythos 5」を同時発表しました。最大のポイントはFable 5が「一般向けに公開されるMythosクラス初のモデル」である点です。

当サイトの既報で詳報したとおり、Anthropicは2026年4月に「Mythosクラスのモデルはサイバーセキュリティにおいて最も熟練した人間を除くすべての人間を凌駕できる能力に達しており、安全対策が不十分なため一般公開はできない」と宣言していました。

その「危険すぎて公開できない」とされていたモデルが、新しいセーフガードを施した上で今回一般向けサービスとして利用できるようになりました。

ベンチマークではほぼ全領域で現時点の最高水準を記録しており、Stripe社が5,000万行規模のRubyコードベースの移行を通常なら2か月以上かかる作業を1日で完了させたという実例は、その能力水準を端的に示しています。

価格は入力$10・出力$50(1Mトークン)であり、Claude Mythos Previewの半額以下です。本記事ではFable 5の詳細な能力・ベンチマーク・14社の顧客評価・セーフガードの仕組み・Mythos 5との関係・日本への含意を解説します。

サマリー

  • 2026年6月9日、Claude Fable 5(一般公開)とClaude Mythos 5(Project Glasswing向け)を同時発表
  • Fable 5とMythos 5は同一の基盤モデル。Fable 5はサイバーセキュリティ等の高リスク分野へのセーフガード付き
  • セーフガード発動率:平均セッションの5%未満。トリガー時はClaude Opus 4.8が代わりに応答
  • 価格:入力$10・出力$50(1Mトークン)——Claude Mythos Previewの半額以下
  • 性能:ほぼ全ベンチマークで現時点の最高水準。タスクが長く複雑であるほどFable 5の優位性が拡大
  • ソフトウェアエンジニアリング:Stripe社が5,000万行Rubyコードベースを2か月→1日で移行。CursorBench・FrontierCode・ViBenchで最高水準
  • 金融・知識業務:Hebbia Finance Benchmarkで全モデル最高スコア。IMCの取引分析評価をほぼ全項目でA評価
  • ビジョン:スクリーンショットのみでウェブアプリを再構築。ヘルパーなしのビジョンのみでPokémon FireRedをクリア
  • 長期タスク・メモリ:永続メモリ活用でOpus 4.8比3倍の性能向上(Slay the Spire実験)
  • アライメント評価:不整合行動レベルはOpus 4.8と同等の低水準
  • Mythos 5:同一モデルの一部セーフガード解除版。Project Glasswing経由で展開。日立・TrendAI(TrendAI)等の参画企業にMythos PreviewからMythos 5へのアップグレードが提供

Fable 5のソフトウェアエンジニアリング能力——長期・大規模タスクで圧倒的

Stripeの実例:5,000万行Rubyコードベースを1日で移行

Anthropicが公式に引用した中で最も印象的なのがStripeの事例です。5,000万行規模のRubyコードベースに対するコードベース全体の移行(codebase-wide migration)を、通常であれば専門チームが2か月以上かけて手作業で行う作業を、Fable 5は1日で完了させたと報告されています。これはFable 5の「タスクが長く複雑になるほど優位性が拡大する」という特性を最もよく示す事例です。

主要ベンチマーク

CursorBench(Cursorが公開するコーディングベンチマーク):Fable 5は現時点で最高水準。CursorのCEO Michael Truellは「以前のモデルでは手が届かなかった長期水平の問題クラスが解決できるようになった」と評価しています。

FrontierCode(Cognition AI):困難なコーディングタスクを高品質な本番コードベースの基準を満たしながら解決できるかを評価するベンチマーク。Fable 5はフロンティアモデルの中でトップスコアを記録しており、中程度の努力レベルでも最高水準であることが特徴です。

ViBench(Bolt):エンドツーエンドの「バイブコーディング」ベンチマーク。Fable 5は最高得点で、基本的なユースケースをほぼ飽和させつつ、より少ないトークンで速くアプリを構築します。

自律的なエンジニアリングデモ

Anthropicが公開したデモでは、Fable 5が以下を完全に自律して実行しました。

Factorioの自律プレイ:エンジニアに人気のファクトリー構築ゲームFactorioを戦略立案から自動化工場の構築まで自律的にプレイ。

VibeCAD:ブラウザベースのCADエディタを使って3Dプリント可能なモデルを設計。エディタ自体もFable 5が作成し、モデリングを行うAIコパイロット機能も内包。

流体シミュレーション:クラシック音楽のEDRリミックスに同期した流体シミュレーションをコードで作成。音楽も音声を一度も聴いたことなくコードのみで生成。

太陽系シミュレーション:物理の第一原理から惑星の軌道運動を導出し、日食の予測にも使えるシミュレーションを構築。

Fable 5とMythos 5の違い——同一モデルの「セーフガード設定違い」

項目 Claude Fable 5 Claude Mythos 5
基盤モデル Mythos 5と同一 Fable 5と同一
提供先 一般公開(claude.ai・API・Claude Code) Project Glasswing経由の限定提供
セーフガード 一部の高リスク領域に適用(発動率<5%) 一部の領域でセーフガードを解除
フォールバック 高リスク問い合わせ → Opus 4.8が応答 なし(解除領域において)
価格 入力$10・出力$50(1Mトークン) 入力$10・出力$50(1Mトークン)
Mythos Preview比 半額以下 半額以下
サイバーセキュリティ能力 セーフガードにより制限あり 「世界最強」(Anthropic公式)

「Mythos-class」の定義として、Anthropicは「このモデルのサイバーセキュリティ能力がClaude Mythos Previewと同等の範囲にある」ことを意味すると注記しています。

顧客14社・テクノロジーリーダーの評価一覧

Anthropicの公式発表には多数の顧客・パートナーからの評価が掲載されています。

企業 評価者 コメントの要旨
Cursor Michael Truell(CEO) CursorBenchで最高水準。長期水平問題の新クラスが解決可能に
GitHub Mario Rodriguez(CPO) 複雑な長期コーディングを高い自律性と信頼性でこなした
Notion Matt Colyer(Director) 最強の結果。エージェント型コーディングとプロトタイピングで明確な前進
Convergence Research Sean Ward(CEO) シニアリサーチサイエンティスト水準。方向選択・リソース配分・誤信念の棄却
Replit Fabian Hedin(CTO) 1年前に100プロンプト必要だったアプリをワンショットで生成
Leya Aveek Duttagupta(MTS) ブラインドレビューで弁護士が毎回現行モデルを超えると判定
Kore.ai Yusuke Kaji(GM) 最高努力レベルで自身の作業を内省・検証。高度な自律運用が可能に
Cloudflare Luke Anderson(CTO) 複雑なマルチエージェントワークフローをより少ないターンで処理
Cognition Scott Wu(CEO) FrontierBenchで最高スコア。長期推論と初見ツールへの汎化に優れる
Hebbia Damian Miraglia(主任エンジニア) 最強の金融ファーストモデル。全般的な金融能力と推論で顕著な進歩
ThoughtSpot Izzy Miller(AIリサーチリード) コアベンチマーク初の90%超え。Opusから10ポイント増
Bohr Matthew Pines(CEO) フロンティア物理研究で最強。推論トークンはGPT-5.5の3分の1
Bolt Michele Catasta(President) ViBenchで最高。より少ないトークンでより速くアプリ構築
Airtable Peter Wang(CSO) 全努力レベルでOpus 4.8超え。実行速度25〜30%向上

Fable 5のセーフガード—「5%フォールバック」の仕組み

なぜセーフガードが必要か

Anthropicの説明によれば「Mythosクラスのモデルは重大なリスクをもたらす閾値に達した」ため、Fable 5はセーフガードなしでは悪用される可能性があります。特にサイバーセキュリティ分野での能力が「深刻な被害を引き起こすために悪用される可能性がある」と明記されています。

セーフガードの動作

Fable 5のセーフガードはリクエストを分析し、高リスクと判定したものにはClaude Opus 4.8が代わりに応答します。このフォールバックが発動するのは平均セッションの5%未満です。

Anthropicは「安全性を優先してセーフガードを保守的に調整しており、場合によっては無害なリクエストもトリガーされる。これは現時点では理想的なレベルより厳しい」と率直に認めています。より高性能なモデルが登場する今後数か月で、誤検知率を下げる改善を進める予定としています。

その他の能力

Fable 5の金融・知識業務能力——シニアレサーチサイエンティスト水準

Hebbia Finance Benchmark

Hebbiaが公開する金融業務向けシニアレベル推論のベンチマークでFable 5は全モデル最高スコアを記録しました。特に以下の3分野での大幅な改善が確認されています。文書ベースの推論・チャートとテーブルの解釈・問題解決。

Hebbiaの主任エンジニア(Applied AI)Damian Miraglaは「最もテストしてきた金融ファーストのモデルの中で最強。全般的な金融能力と推論の両面で顕著な進歩がある」と評しています。

IMCの取引分析評価

金融・トレーディング企業IMCは、Fable 5が社内の取引分析評価をほぼ全項目で最高評価を獲得したと報告しています。評価対象の分野は事実のルックアップ・概念的推論・根本原因分析・期待値分析と、実際のトレーディング業務に直結する幅広い能力をカバーしています。

Convergence Researchの評価

AIスタートアップのCEO Sean Wardは「シニアリサーチサイエンティスト水準——方向性の選択、リソースの配分、誤った信念の棄却、第一原理から新規出力の生成が可能」と評価しています。これはFable 5が単に既存の情報をまとめるだけでなく、真に自律的な研究活動を行える可能性を示唆しています。

ThoughtSpotの分析ベンチマーク

ThoughtSpotのAIリサーチリードIzzy Millerは「複雑な長期分析タスクのコアベンチマークで初めて90%を超えた——Opusから10ポイント増。最難関の問題では強い判断力と細部への注意力を示す」と報告しています。

Fable 5のビジョン能力—スクリーンショットのみでゲームをクリア

Fable 5はビジョンを活用したタスクで現時点の最高水準モデルです。

精密な数値抽出:詳細な科学図から正確な数値を抽出する能力があり、研究論文やレポートの視覚的な情報処理に活用できます。

スクリーンショットからのソースコード再構築:スクリーンショットのみからウェブアプリのソースコードを再構築できます。これは製品のリバースエンジニアリングやコードレビューへの応用が考えられます。

Pokémon FireRed クリア(ビジョンのみ):従来のClaudeモデルはPokémon FireRedをプレイするために追加の情報を提供する補助ハーネスが必要でしたが、Fable 5は生のゲームスクリーンショットのみ(マップ・ナビゲーション補助・追加ゲーム状態情報なし)でゲームを最初から最後までクリアしました。複雑な空間認識・状況判断・長期目標の維持を視覚情報のみで実現するというこの能力は、実際の業務においても視覚情報を多用するドキュメント処理・製品分析・品質検査での活用に直結します。

Fable 5の長期タスク・メモリ能力—Opus比3倍の持続的性能

Slay the Spireの実験

Anthropicはカードゲーム「Slay the Spire」を使ったメモリ活用の実験を公開しています。Fable 5は永続的なファイルベースのメモリへのアクセスを与えることで性能がOpus 4.8の3倍以上向上しました。ゲームのファイナルアクトへの到達率も3倍高くなりました。

これはFable 5が自分自身のメモを使って出力を改善する能力——エージェント的な長期タスクにおいて特に重要な能力——がOpusクラスよりも本質的に高いことを示しています。

数百万トークンの長期集中

Fable 5は数百万トークンにわたる長期タスクにおいて集中力を維持します。企業の大規模ドキュメント処理・複数ファイルにわたるコードレビュー・長期にわたる調査タスクなど、コンテキストウィンドウの限界を試すような作業でもより安定した品質を維持します。

参考:Mythos 5の固有能力—研究・科学・防衛向け強化

セーフガードが一部解除されたMythos 5は、特に以下の分野でFable 5を上回る能力を発揮します。

創薬プロセスの約10倍加速:タンパク質設計・バイオインフォマティクスツールを使って、通常なら熟練した人間の研究者が行うすべての工程(バインディングサイトの選択・ツールの実行・失敗からの回復)を自律的に実行。14個のタンパク質標的のうち9つで有力な創薬候補を発見。

分子生物学の新規仮説:OpusクラスとのブラインドH2H比較でAnthropicの科学者が約80%の確率でMythosを選好。1つの仮説は独立した研究室のbioRxivプレプリントで独立して裏付けられました。

ゲノミクス研究:1週間以上の自律的作業で138種の動物の単一細胞データを整理し、Science誌掲載モデルを上回るモデルを構築(サイズは100分の1)。

世界最強のサイバーセキュリティ能力Project Glasswingを通じて展開。日本の日立製作所・TrendAI(トレンドマイクロ)等の参画企業にMythos PreviewからMythos 5へのアップグレードが提供されます。

アライメント(AI安全性)

自動化されたアライメント評価においてMythos 5の不整合行動(欺瞞・悪用への協力等)のレベルは「低く、Opus 4.8と同等」とされています。Fable 5は同一モデルであるため同様の水準です。詳細はシステムカードに公開されています。


FAQ

Q. Fable 5は今すぐclaude.aiとAPIで利用できますか? A. はい。2026年6月9日の発表と同時に一般公開されています。claude.aiのウェブ・モバイル・デスクトップアプリ、API、Claude Codeで利用できます。

Q. Fable 5のセーフガード(5%のフォールバック)は実際の業務に支障をきたしますか? A. Anthropicは「意図的に保守的に調整しており、無害なリクエストがトリガーされることがある」と認めています。サイバーセキュリティ関連の業務を多く行う組織では、一部の問い合わせがOpus 4.8にフォールバックされる場合があります。セキュリティ診断・脆弱性調査などの用途では、Project Glasswing経由でのMythos 5アクセスを検討することになります。

Q. Fable 5はOpus 4.8と比べてどの程度優れていますか? A. Anthropicは「ほぼすべての能力ベンチマークで最高水準を達成。タスクが長く複雑であるほど優位性が拡大する」としています。ThoughtSpotのベンチマークでは90%超え(Opusから10ポイント増)、Airtableの実行速度は25〜30%向上など、幅広い業種で顕著な改善が報告されています。

Q. Fable 5とMythos 5の価格はMythos Previewと比べてどう変わりましたか? A. Mythos Previewの半額以下です。入力$10・出力$50(1Mトークン)という価格設定により、大規模な本番活用のコストが大幅に下がります。Anthropicは「できる限り多くのユーザーにできる限り速く安全に先進的なAI能力を届けるという目標に向けた一歩」と説明しています。


参考情報