Claude Fable 5とMythosの輸出規制解除が確定-Anthropicが7月1日から全世界での提供を再開

セキュリティニュース

投稿日時: 更新日時:

Claude Fable 5の輸出規制解除が確定-Anthropicが7月1日から全世界での提供を再開

Anthropicは2026年6月30日、米国商務省から自社のフロンティアモデル「Claude Fable 5」および「Claude Mythos 5」の輸出規制が解除されたという通知を受けたと公式ブログで発表しました。

Fable 5は翌7月1日よりClaude Platform・Claude.ai・Claude Code・Claude Coworkで全世界のユーザーへの提供を再開します。6月12日の突然の規制発動から18日間にわたってグローバルでのアクセスが遮断されていた今回の事態は、フロンティアAIモデルが事実上の輸出管理対象品目として扱われた初の事例として各方面に強い印象を残しました。解除にあたってAnthropicは指摘された安全装置バイパス(ジェイルブレイク)手法に対応する新しい安全分類器を実装し、商務省のCenter for AI Standards and Innovation(CAISI)による検証を経ています。

サマリー

  • 6月30日、米商務省がClaude Fable 5とMythos 5の輸出規制を解除。Anthropicは7月1日からFable 5の全世界提供を再開
  • 規制の発端は6月11日にAmazon研究チームが政府へ報告したFable 5のサイバーセキュリティ分類器バイパス手法。6月12日に政府指令を受け、Anthropicは全顧客向けのアクセスを停止
  • Anthropicの検証で、当該バイパス手法で発見できた脆弱性はOpus 4.8・GPT-5.5・Kimi K2.7など既存のより低性能なモデルでも同様に再現可能であることが判明。「Mythos固有の能力を露出するものではなかった」とAnthropicは説明
  • Anthropicは新しい安全分類器を訓練し、問題のバイパス手法を99%以上のケースでブロックできることを確認。残り1%のケースでも既知またはパッチ済みの脆弱性情報のみが出力されるとしている
  • 6月26日にCommerceはMythos 5を約100の米国の重要インフラ組織・連邦機関に先行して再開。6月30日の規制解除で全世界への展開が再び可能に
  • AmazonとMicrosoft・Google・Glasswingパートナーとの共同で業界横断のジェイルブレイク深刻度評価フレームワークの策定を提案。HackerOneを通じたFable 5向けの脆弱性開示プログラムも発足
項目 内容
規制発動日 2026年6月12日17:21(ET)
規制解除日 2026年6月30日
規制期間 18日間
Fable 5の再開日 2026年7月1日
対象モデル Claude Fable 5・Claude Mythos 5
再開プラットフォーム Claude Platform・Claude.ai・Claude Code・Claude Cowork(API/AWS/Google Cloud/Microsoft Foundryは順次)
サブスクリプション向け Pro/Max/Team/一部Enterpriseに7月7日まで週間利用上限の50%で提供、以降は利用クレジット方式
規制のきっかけ Amazon研究チームがFable 5のサイバー分類器バイパスを政府に報告
対処内容 新安全分類器を訓練・商務省CAISIが検証・99%以上でブロック確認

Fable 5停止に至る経緯

6月9日にAnthropicはClaude Fable 5とClaude Mythos 5を公開しました。2つのモデルは同一の基盤ウェイトを共有しており、Fable 5は一般向けに3層の安全分類器(サイバーセキュリティ・生物/化学・蒸留)を実装した版、Mythos 5はそれらの制約を解除した版として、Project Glasswing参加の信頼できるサイバーセキュリティ組織向けに限定提供されていました。

6月11日、Amazon研究チームがFable 5のサイバーセキュリティ分類器を迂回する多段階の手法を政府関係者に提示しました。

その手法では、リクエストを防御的なコードレビューとして組み立てることで分類器をすり抜け、ソフトウェアの脆弱性を列挙させることができました。1件のケースではその脆弱性を実際に攻撃するコードも出力されたとされています。翌6月12日の17時21分(ET)、商務省は国家安全保障当局を根拠に「外国人によるFable 5・Mythos 5への一切のアクセスを停止するよう」Anthropicに命じる輸出規制指令を送付しました。

Anthropicは「外国人のアクセスのみを技術的に遮断することは不可能」と判断し、全世界の全ユーザーへのアクセスを即日停止しました。同社は指令に対して「商用モデルで狭義のジェイルブレイクが発見されたことをもってモデルのリコール理由とすることには同意しない」という立場を同日の公式声明で明言しましたが、法令遵守の観点からアクセス停止を選択しました。

何が問題で、何が明らかになったか

停止から18日間、Anthropicは政府と協力してAmazonのレポートおよびその根拠となる証拠を精査しました。その過程で判明した最も重要な事実は、問題の手法を使ってFable 5が特定した脆弱性は、すでに市場に出回っているより低性能なモデル、具体的にはClaude Opus 4.8・OpenAIのGPT-5.5・中国のKimi K2.7でも同様に再現可能だったというものです。

Anthropicの公式ブログはこの点について「問題の手法は、Mythos固有のサイバー能力を露出させるものではなかった。Fable 5の安全分類器にとってのグレーゾーンの事例であり、危険性は低いが過剰な注意から遮断されるケースのひとつを開放したにすぎなかった」と説明しています。言い換えれば、問題の手法によってアクセス可能になったのはFable 5ならではの特別な攻撃能力ではなく、防御目的の通常のサイバーセキュリティ作業の範囲内のものであったということです。

新しい安全分類器の実装と商務省による検証

Anthropicは政府・Amazon・その他パートナーと協力して、問題のバイパス手法を標的としたより精度の高い安全分類器を新たに訓練しました。検証の結果、この新しい分類器はAmazonのレポートが記述した具体的な手法を99%以上のケースでブロックできることが確認されています。

また残りの1%未満のケースにおいても、出力内容はすでに世間に知られている脆弱性か、あるいは既にパッチが適用済みのものに限られることが確認されました。

商務省のCenter for AI Standards and Innovation(CAISI)も独立してFable 5の従来の安全分類器と今回の新しい安全分類器の双方をテストし、その有効性を確認しています。これは今後のフロンティアAI規制において、第三者機関による事前評価と政府機関による独立検証を組み合わせる枠組みの先行事例として位置づけられると考えられます。

なお今後も新たなジェイルブレイクを素早く検知・対処する体制を整えるため、Fable 5の全トラフィックには引き続き30日間のデータ保持ポリシーが適用されます。ブロックが発生した場合はユーザーへの通知とともに、リクエストはClaude Opus 4.8へ自動的に転送されます。

Fable 5とMythos 5の再開スケジュール

Anthropicの公式発表によれば、Fable 5は7月1日(日本時間)からClaude Platform・Claude.ai・Claude Code・Claude Coworkで全世界のユーザーへの提供が再開されます。

サブスクリプションプランへの組み込みについては段階的なロールアウトが予定されており、

Pro・Max・Team・一部Enterpriseプランのユーザーに対しては7月7日までの期間、Fable 5が週間利用上限の50%に相当する範囲で利用可能になります。

7月7日以降は利用クレジット(Usage Credits)方式での提供に切り替わります。

AWS・Google Cloud・Microsoft Foundryへの提供再開については「できる限り迅速に対応する」とされており、具体的なタイムラインは発表時点では示されていません。API単体契約や消費ベースのEnterpriseプランについては当日からフル対応とのことです。

Mythos 5については6月26日にCommerceのルトニック長官が「適切な安全策が整備された」として、重要インフラの運用・防衛にあたる約100の米国組織・連邦機関向けの提供を先行して認可していました。今回の全面的な規制解除を受け、Glasswingプログラムを通じた国内外の組織へのアクセス拡大について引き続き政府と協議を続けるとしています。

業界横断フレームワークとHackerOneプログラム

今回の事態から得られた重要な教訓として、Anthropicは「ジェイルブレイクの深刻度を評価するための標準的な尺度が業界に存在しなかった」点を挙げています。ある手法がどの程度の危険性を持つのか、他のモデルとの比較においてどう位置づけられるのかを判断する共通の枠組みがない状態では、今回のように政府が過剰に反応するか、逆に見落とすかのどちらかになりかねません。

この問題に対処するため、AnthropicはAmazon・Microsoft・Google・Glasswingパートナー企業との共同で、ジェイルブレイク深刻度のスコアリングフレームワークを業界横断で策定することを提案しています。詳細は近日中に公表されるとのことです。

あわせて、Fable 5に対するサイバー関連のジェイルブレイクをセキュリティ研究者が報告するためのHackerOneプログラムを新たに立ち上げることも発表されています。これは責任ある開示(Responsible Disclosure)の枠組みをAIモデルのジェイルブレイクに適用する試みであり、伝統的なソフトウェア脆弱性の開示手続きをAIモデルの安全性管理に転用した先進的な取り組みといえます。

先例として持つ意味

戦略物資化するAIとブロック経済を論じた当サイトの分析記事が指摘したとおり、今回の一連の事態はAIモデルが輸出管理対象品目と同等の扱いを受けることができると示した歴史的な事例です。今回の解除によってその枠組みが取り下げられたわけではなく、「一定の安全基準を満たせば提供できる」というモデルが初めて機能したということになります。

OpenAIのGPT-5.6(Sol/Terra/Luna)も同様の枠組みのもとで限定提供を経てのリリースを進めていることを踏まえると、今後のフロンティアAIモデルは事前の政府との協議・評価・段階的承認というプロセスを標準として設計していくことが現実的な対応になっていくと考えられます。8月の行政命令締め切り(高度AIモデルの安全性を評価する標準化されたベンチマークの策定)に向けた議論も引き続き進む見通しです。

国際的な含意では、ファイブ・アイズが警告するAIとサイバー能力の変容G7でのMythos対策の議論という流れの中で、今回の解除は「高度なAIサイバーモデルの利用管理は二国間・多国間の交渉と評価を経て進める」という実践モデルを初めて実証したものでもあります。日立製作所をはじめとする日本企業のGlasswing参画が実現しているなか、Glasswingへの参加条件や日本の政府機関・金融機関へのMythos 5提供の可能性については、Anthropicと日本政府の間で進行中の協議の行方が引き続き注目されます。

情報システム部門への示唆

サーバサイドエンジニアとしてAnthropicのAPIを使った業務系システムの設計に携わってきた経験から言うと、今回の事態で最も実務的に影響が大きかった点は「当日17時にAPI呼び出しが突然全滅する」という可能性が現実のものとなったことです。今後も同種の事態が起きた場合にシステムが適切にフォールバックできる設計になっているかを、Fable 5やMythos 5を業務システムに組み込んでいる組織は改めて確認しておく価値があります。

具体的には、Fable 5のリクエストが遮断されてOpus 4.8へルーティングされるケースは規制解除後も安全分類器のトリガーによって引き続き発生します。アプリケーション側でどのモデルが応答したかをログに残し、結果の品質差を把握できる仕組みを持つことが、今後のシステム品質管理の観点から重要になります。

また、Fable 5のトラフィックには30日間のデータ保持ポリシーが継続適用されます。企業がAPIを通じてFable 5を利用する場合、そのリクエスト・レスポンスはAnthropicが30日間保持します。プライバシー評価やデータガバナンスの観点から、どのカテゴリの業務データをFable 5に入力するかについて改めてポリシーの整備を行うことが推奨されます。

今後、ジェイルブレイク深刻度の業界横断フレームワークが整備されれば、情報システム部門がAIモデルの導入可否を判断する際の評価基準としても活用できる可能性があります。この分野の動向は引き続き注目しておく意義があります。

出典

当サイト関連記事: