OpenAI、サイバーセキュリティ戦略を再編-Codex Securityが50万件超の脆弱性を自動修正|セキュリティとAIのニュース-セキュリティ対策Lab

投稿日時: 2026年06月25日更新日時: 2026年06月25日

OpenAIは2026年6月22日、サイバーセキュリティイニシアティブ「Daybreak」を大幅に拡張し、Codex Securityプラグインの更新、GPT-5.5-Cyberフル版のリリース、Trail of Bitsとともに設立した「Patch the Planet」プログラム、そしてサイバーパートナープログラムの4点を同時に発表しました。

今回の発表の核心にあるのは、OpenAIがセキュリティ上の焦点を「脆弱性の発見」から「パッチの適用と修正の完遂」に意図的に移したという点です。AIモデルによって脆弱性の発見速度が劇的に上がったことで、今日のセキュリティチームとオープンソースメンテナーを圧倒しているのは発見の不足ではなく、膨大に積み上がった未修正の発見事項への対処です。OpenAIはこのボトルネックを解消するためのツール・人材・エコシステムを一体的に整備する方向へ舵を切りました。

サマリー

発表日：2026年6月22日（OpenAI公式ブログ）
イニシアティブ：Daybreak（サイバーセキュリティ）の大幅拡張
方針の転換：脆弱性の発見から、パッチ適用・修正完遂へ
Codex Security：3月のプレビュー以来、3万件超のリポジトリ・3000万件超のコミットを処理。7万件超を人間のレビュワーが修正確認、50万件超が自動的に修正完了と判定
GPT-5.5-Cyberフル版：CyberGym 85.6%（GPT-5.5の81.8%比）、ExploitGym 39.5%（同25.95%比）、SEC-bench Pro 69.8%（同63.1%比）。認証済み防御者限定
Patch the Planet：Trail of Bitsの全セキュリティ研究組織を投入。cURL・Go・Python・Sigstore・pyca/cryptographyなど30件超のOSSプロジェクトが参加
Daybreak Cyber Partner Program：セキュリティベンダーがGPT-5.5をTrusted Access for Cyberとともに自社製品に統合可能
米国政府との連携：CAISI・ONCD・OSTFとの協力を継続

項目	内容
発表日	2026年6月22〜23日
方針	発見→パッチ適用のボトルネックシフト
Codex Security実績	3万リポジトリ・3000万コミット・50万件超自動修正
GPT-5.5-Cyber	CyberGym 85.6%・ExploitGym 39.5%・SEC-bench Pro 69.8%
Patch the Planet	Trail of Bits全組織投入。30件超のOSSが参加
パートナープログラム	セキュリティ大手がGPT-5.5をTrusted Access経由で統合
アクセス制限	GPT-5.5-Cyberは認証済み防御者のみ。大多数はGPT-5.5+Codex Securityが推奨

1 何が起きたか
2 原因 ─ なぜOpenAIはパッチ適用にフォーカスを移したか
3 Codex Securityの能力と組み込み方
4 Patch the Planetの仕組みと初期成果
5 GPT-5.5-Cyberのベンチマークと使用制限
6 情報システム部門・開発チームへの示唆
7 FAQ

何が起きたか

OpenAIは2026年6月22日、Daybreakサイバーセキュリティイニシアティブの拡張を発表しました。Daybreakは2026年初頭にOpenAIが立ち上げたサイバー防衛を主眼としたイニシアティブで、今回の発表は3月のCodex Securityプレビューリリース以来の大型アップデートに当たります。

4つの発表が同日に行われました。Codex Securityプラグインのアップデート、GPT-5.5-Cyberのフル版リリース、Trail of BitsとともにHackerOneとCalifとの連携で立ち上げた「Patch the Planet」イニシアティブ、そして「Daybreak Cyber Partner Program」です。

同日には、翌23日に公表されたFive Eyesの「Five Eyes Cyber Security Agency AI Call to Action」声明も準備されており、AIがサイバー攻撃の速度と複雑度を高めているという共通の認識のもとで、攻撃・防御双方のAI活用が加速しています。。

原因 ─ なぜOpenAIはパッチ適用にフォーカスを移したか

AIが脆弱性発見を加速した結果として生まれた「パッチ適用のボトルネック」は、個々の組織の問題ではなくソフトウェアエコシステム全体が直面する構造的な問題です。

特にオープンソースプロジェクトのメンテナーは小規模なチームで広範なコードベースを維持しており、バグ報告・プルリクエストの対応・ドキュメント更新・リリース管理など、セキュリティ以外の業務も並行して担っています。AIが脆弱性レポートの流量を何倍にも増やした結果、もともと手薄なメンテナーへの負担が臨界点に達しつつあります。

この問題はFive Eyesが6月23日に発表した声明でも取り上げられており、「AIがパッチ適用から脆弱性発見までの時間を縮めているため、パッチ適用プロセスの加速が急務」という内容と直接対応しています。OpenAIは技術とビジネスの両方から、この問題を解決しようとしています。

GPT-5.5-Cyberのフル版リリースも、この文脈で読む必要があります。最初のプレビューが主に「不必要な拒否の削減」にフォーカスしていたのに対し、今回のフル版は脆弱性の発見・再現可能なコードへのリーチャビリティの確認・パッチ開発・テストという修正ループ全体を通じた支援能力に重点が置かれています。

Codex Securityの能力と組み込み方

Codex Securityは開発者が日常的に使うCodexのワークフローに直接統合される設計になっています。コードベース全体または特定のコミット・変更範囲を対象にスキャンを実行し、脆弱性の重要度・影響を受けるコードの場所・検証手順の証拠・修正ガイダンスを含むレポートを生成します。攻撃経路のトレース、脅威モデルの構築、発見事項の検証、コードベースに特化したパッチの生成まで一連の作業を担います。

スキャンの出力はSARIFファイルやCodeQLクエリの形式で既存の脆弱性管理システムに取り込めるため、Jira・GitHub Issueなど組織が既に使っているツールとの接続が容易です。また、外部の脆弱性スキャナー・セキュリティアドバイザリ・バグバウンティレポート・チケットシステムからの既存の発見事項をCodex Securityがトリアージ・検証してパッチを自動生成するというバックログ消化のユースケースも設計に含まれています。

「すべての開発者の隣にセキュリティエンジニアを置く」というコンセプトは、現実的には難しい専門人材の確保問題へのアプローチとして機能します。サーバサイドエンジニアとして開発に関わってきた立場からすると、セキュリティレビューが開発フローの外に置かれている組織ではコードが本番に出た後に問題が発見されるケースが多く、この統合アプローチには実効性があると感じます。

Patch the Planetの仕組みと初期成果

Patch the Planetの設計で注目すべき点は3つあります。

第1に、Trail of Bitsがセキュリティ研究組織の全員をこの取り組みに投入したことです。バグハンターの一部ではなく、組織全体をコミットするという規模感は異例で、OpenAIが提供するツールと専門人材の組み合わせによって短期間で成果を出すことを優先した設計です。

第2に、成果の再利用可能性です。Trail of Bitsはファジングハーネス・過去CVEの分析パイプライン・差分テストシステム・脅威モデル・拡張されたテストスイートなど、特定のプロジェクトの修正にとどまらず将来のセキュリティ改善にも使えるインフラを構築しています。1日でファジングラボを立ち上げた（通常は数週間かかる）、歴史的なCVEパターンを活用した類似脆弱性の自動探索パイプラインを構築した、差分テストを数日で実装した（通常は数週間〜数か月）という具体的な成果は、人間のエンジニアがAIを活用した場合の生産性の変化を示す実例です。

第3に、すべての発見事項をメンテナーに届ける前に専門家が確認するという人間レビューの義務化です。AIモデルはフォルスポジティブも大量に出力するため、それをそのままメンテナーに流すとすでに過負荷状態のメンテナーの負担をさらに増やすだけになります。Trail of Bitsのエンジニアがフィルターとして機能することで、メンテナーには検証済みで実際に修正が必要なものだけが届く設計になっています。

参加するオープンソースプロジェクトはインターネットインフラや言語実行環境の広範な基盤を担っているものばかりです。cURLは事実上すべてのインターネット通信ライブラリに使われており、Pythonはほぼあらゆる自動化・AI・データ処理の基盤で動いています。Sigstoreはソフトウェアサプライチェーンのコード署名インフラです。これらのプロジェクトのセキュリティ強化は、直接の修正を超えた広範な下流への効果をもたらします。

GPT-5.5-Cyberのベンチマークと使用制限

フル版のGPT-5.5-CyberはCyberGymで85.6%を記録し、標準のGPT-5.5の81.8%を上回りました。

CyberGymは既知の脆弱性を再現できるかを測るベンチマークです。ExploitGymでは39.5%（GPT-5.5は25.95%）、SEC-bench Proでは69.8%（GPT-5.5は63.1%）と、いずれも標準モデルを大きく上回っています。

ExploitGymの数字が特に注目に値するのは、これが「既知の脆弱性を実際の未認可コード実行を達成するワーキングエクスプロイトに変換できるか」を測るものだからです。つまりこのモデルが持つ攻撃的な能力の水準を示す数値であり、アクセスが認証済み防御者に限定されている理由の背景にあります。

OpenAIは多くの防御者にとってはGPT-5.5とTrusted Access for Cyber、そしてCodex Securityが適切な出発点であり、GPT-5.5-Cyberは最も高度なサイバー能力と許容的な挙動が必要な認証済み防御者向けの位置づけだと明記しています。アクセスには強化された本人確認・監視・スコープ制限・レビューが伴います。

GPT-5.5-Cyberは開発にあたりCAISI（米国AI標準技術革新センター）との事前テスト評価、ONCD（国家サイバー長官室）およびOSTP（科学技術政策室）との大統領令の実施に向けた協力が行われており、米国政府との連携を前提とした管理された展開になっています。

情報システム部門・開発チームへの示唆

今回のOpenAIの発表は、セキュリティの現場で起きているボトルネックの移行を認識する機会として重要です。

開発チームにとって最も直接的な示唆は、Codex Securityのようなツールが開発ワークフローに統合されることで、セキュリティレビューが開発サイクルの外に置かれた「後工程」から、コードを書く人の隣で動く「並走プロセス」へと変わるという点です。これは開発者がセキュリティエンジニアになることを意味するのではなく、AIがセキュリティ上の問題を開発中に指摘し、修正案まで提示することで、問題が本番環境に出てから対処するコストを下げるという意味です。

情報システム部門としては、既存のVulnerability Managementパイプライン（Jira・ServiceNow・GitHub Issuesなど）にSARIFやCodeQLを通じてAIベースのスキャン結果を統合できる環境の準備を検討してください。今後、Daybreak Cyber Partner Programに参加するセキュリティベンダーのツールにGPT-5.5が統合されていくため、既存のセキュリティツールスタックがAI強化された発見事項を受け取り、トリアージできる体制かどうかを確認することが先決になります。

オープンソースを利用している組織にとっては、Patch the Planetの動きは間接的に有利に働きます。cURL・Go・Python・pyca/cryptographyなど広範に使われているライブラリの脆弱性が発見・修正されてリリースされた場合、アップストリームの改善として取り込まれるからです。ただしその恩恵を受けるには、依存ライブラリの更新を追跡し、速やかに取り込む運用体制が前提になります。

FAQ

Q. Codex SecurityはGitHub Copilotと何が違いますか？

A. GitHub Copilotは主にコード生成の補助を目的としており、セキュリティはその一部の機能です。Codex SecurityはOpenAIのCodexに統合されたセキュリティ専用のプラグインで、脆弱性の発見・検証・パッチ生成・既存の脆弱性管理システムへのエクスポートまでをセキュリティワークフローとして一貫して扱います。GitHub Advanced Securityと競合する位置づけに近いですが、OpenAIのフロンティアモデルを使った推論が差別化の核心です。

Q. GPT-5.5-Cyberは誰でも使えますか？

A. 現時点では使えません。認証済み防御者向けの限定リリースとなっており、強化された本人確認・監視・スコープ制限・レビューが伴います。多くの組織にとっては、OpenAIが「適切な出発点」と推奨しているGPT-5.5とTrusted Access for Cyber、そしてCodex Securityの組み合わせが現実的なアクセス経路になります。

Q. Patch the Planetに参加するオープンソースプロジェクトを使っている組織は何かすべきことがありますか？

A. 参加プロジェクトから修正がリリースされた場合、それを速やかに取り込む体制を整えておくことが重要です。脆弱性が発見・開示・修正される速度がAIによって上がっているため、パッチが出てから組織が適用するまでのタイムラグをどれだけ短縮できるかが、実際のリスク低減に直結します。

Q. この発表はAnthropicのClaude Mythosとどう違いますか？

A. Claude Mythosは「自律的なゼロデイ脆弱性の発見・悪用能力」を持つとして一般公開を見送り、Project Glasswingとして防衛目的の限定提供を選択しました。OpenAIのGPT-5.5-Cyberは認証済み防御者向けではあるものの、より多くの組織へのアクセスを前提とした展開を目指しており、Codex SecurityやPatch the Planetを通じたツールのエコシステム整備に重点を置いています。アプローチの違いは「AIサイバー能力をどの範囲の主体に提供するか」という設計思想の差として読むことができます。

出典

当サイト関連記事