AIの脱獄(ジュエルブレイク)テストでDeepSeekは攻撃成功率が100%

セキュリティニュース

投稿日時: 更新日時:

AIの脱獄(ジュエルブレイク)テストでDeepSeekがChatGPT、Geminiと比較

Cisoと子会社の Robust Intelligencetとペンシルバニア大学の研究者たちは、DeepSeek R1、MetaのLlama 3.1 405B、OpenAIのGPT-4oとo1(ChatGPT)、GoogleのGemini 1.5 Pro、AnthropicのClaude 3.5 SonnetをAIの脱獄(ジュエルブレイク)テストを実施しました。

DeepSeekとは

近年、AI技術の進化は著しく、自然言語処理(NLP)を中心に、業務効率化や研究開発、セキュリティ強化など、さまざまな分野で活用が広がっています。その中でも、中国発の大規模AIモデル DeepSeek は、従来のAIモデルとは一線を画す性能と応用範囲の広さで注目を集めています。

DeepSeekは、OpenAIのGPTシリーズやGoogleのGeminiなどと同様に、強力な言語理解・生成能力を備えた大規模言語モデル(LLM)をベースにしています(正確には、推論型大規模言語モデル(Frontier Reasoning Model))。ただし、その独自の学習方法や高度なデータ分析機能により、企業の業務改革、セキュリティ強化、科学研究など多くの分野に変革をもたらす可能性を秘めています。

特に、企業のセキュリティ対策においては、従来の手法では検知が難しかったサイバー攻撃の兆候をより早期に発見できる機能を持ち、脆弱性管理の自動化を促進することで、企業の防御力を大幅に向上させると期待されています。また、NLP技術を活用し、リアルタイムでリスク評価や意思決定を支援できるため、今後のAI活用の新たなスタンダードとなる可能性があります。

AIの脱獄(ジュエルブレイク)テストでDeepSeek は攻撃成功率が 100% の唯一のモデル

AIの脱獄(ジュエルブレイク)テストはサイバー犯罪、誤報、化学兵器、著作権侵害、嫌がらせ、違法行為、一般的な危害など 7 つのカテゴリにわたる数百の行動を網羅するHarmBenchを基に使用してテストされました。

シスコは、HarmBench からの 50 のプロンプトで自動ジェイルブレイク アルゴリズムを実行しました。 

テストの結果、DeepSeek は攻撃成功率が 100% の唯一のモデルであることが判明しました。中国企業のモデルに対する脱獄の試みはすべて成功しました。対照的に、OpenAI の o1 モデルの成功率はわずか 26% でした。

AIの脱獄(ジュエルブレイク)テストでDeepSeek は攻撃成功率が 100% の唯一のモデル

画像:Ciso

結果を踏まえてCiscoは

「DeepSeek R1 は、他の最先端のモデル プロバイダーがモデルの開発に費やす予算のほんの一部でトレーニングされたと言われています。ただし、安全性とセキュリティという別のコストがかかります。

私たちの研究チームは、100% の攻撃成功率で DeepSeek R1 を脱獄することに成功しました。これは、HarmBench セットからのプロンプトで DeepSeek R1 から肯定的な回答が得られなかったものは 1 つもなかったことを意味します。これは、モデル ガードレールで敵対的攻撃の大部分をブロックする o1 などの他の最先端モデルとは対照的です。」としています。

DeepSeekが世の中に与えたインパクト

DeepSeekが登場したことで、AI技術に対する世界の見方が変わった点がいくつかあります。

開発コストの低さ

DeepSeekが注目を集めた最大の理由の一つは、その開発コストの低さです。通常、大規模言語モデル(LLM)の開発には 数十億ドル規模の投資が必要とされ、OpenAIのGPT-4やGoogleのGeminiのようなモデルは膨大なリソースと時間を費やして作られています。しかし、DeepSeekは、これらと同等の性能を持ちながら、はるかに低コストで開発されたことが大きな驚きをもたらしました。

低コストで開発できた理由は、以下が挙げられます。

  • NVIDIA製GPUへの依存を減らし、中国製のAIチップを活用することで、計算コストを大幅に削減
  • 中国国内のデータリソースを最大限活用し、高額なデータライセンス費用を削減
  • クラウド・オンプレミスのハイブリッド活用による計算資源の最適化により、トレーニングコストを抑えつつ高性能を実現
  • 転移学習やモデル圧縮技術を活用し、開発スピードを向上しつつコストを抑制したトレーニング手法の導入

このような工夫により、DeepSeekは大規模AIモデルの開発コストを劇的に削減しながらも、世界トップレベルの性能を実現しました。この事実は、多くの専門家を驚かせると同時に、今後のAI開発のあり方に大きな影響を与えると考えられています。

中国発のLLMの台頭

これまでの大規模言語モデル(LLM)は、米国のOpenAI(GPTシリーズ)やGoogle(Gemini)などが中心となって開発されてきました。しかし、DeepSeekは、中国が独自に開発したAIモデルであり、その性能が世界トップクラスと評価されました。このことは、AI技術の主導権が必ずしも西側諸国に限られないことを示し、AI技術の多極化が進む象徴的な出来事として、世の中を驚かせました。

AIによる労働環境の変革

DeepSeekの導入により、企業の業務効率が大幅に向上することが期待されています。例えば、セキュリティレポートの自動生成や、リアルタイムでのリスク評価など、これまで人手を要していた業務がAIによって自動化される可能性があります。