
中国製のAI DeepSeek(ディープシーク)とは?何がすごくいのか?セキュリティの懸念などを解説します。
目次
DeepSeekとは
DeepSeekとは、CEOの梁文锋氏が創業した中国のAIスタートアップ「DeepSeek」が開発した大規模言語モデル(LLM)を指し、
OpenAIのGPTシリーズやGoogleのGeminiなどと同様に、強力な言語理解・生成能力を備えた大規模言語モデル(LLM)をベースにしています
※正確には、推論型大規模言語モデル(Frontier Reasoning Model)。
ただし、その独自の学習方法や高度なデータ分析機能により、企業の業務改革、セキュリティ強化、科学研究など多くの分野に変革をもたらす可能性を秘めています。
DeepSeekは何がすごいのか?
DeepSeekは高性能の半導体を利用せずとも、高い計算能力を発揮したため世界各国で注目を浴びました。
AIの機械学習モデルや教師データの収集、処理には高性能の半導体が必要になり莫大な研究費が必要です。しかしDeepSeekのトレーニングに、Nvidia(エヌビディア) H800チップの6百万ドルの計算能力しか必要なかったと論文が出され、世界のAI界で注目を集めました。
2023年、OpenAIのCEOサム・アルトマン氏は、1,000万ドル以下の資金でAIの基盤モデルを開発することは「絶望的」だと発言しましたが、DeepSeekはその予想を覆し、わずか6百万ドルのAI開発を成し遂げ同社のAIチャットボットアプリは、リリースからわずか1週間でAppleのApp StoreとGoogle Playストアで米国トップの座を獲得しました。
DeepSeekは、親会社である中国のヘッジファンド「High-Flyer」の支援を受け、GPU投資を強化しながらAI事業を展開していますが、ほとんどの競合他社がクラウドプロバイダーを利用する中、DeepSeekは独自のデータセンターを運用することで、高度な実験や最適化を迅速に実施できる点が強みとなっています。
DeepSeekショック
中国のAI(人工知能)開発企業 DeepSeek」発表した最新の高性能生成AIモデルによって、米国のAI関連株が17%下落しました。国内市場では、東京エレクトロンなども株価が下落しました。
低価格で高性能なAIとして世界的に注目され今後もAI関連株が下落すると思われましたが、各種指摘が発生し結局AI関連株は回復しました。
DeepSeekは本当に低コストなのか
市場分析会社SemiAnalysisの報告によると、DeepSeekは約50,000基のNvidia Hopper GPUを保有し、AIトレーニングや研究、金融モデリングのために活用しているとされています。
具体的には、10,000基のH800およびH100に加え、H20の追加購入も行っているとのことです。これらの投資額は、サーバーの設備だけで1.6億ドル、さらに運用コストは9.44億ドルに達すると推定されています。
当初、DeepSeekは「わずか6百万ドルでAIモデルを開発した」との主張で注目を集めましたが、実際にはこれは一部のGPU時間のコストに過ぎず、研究、モデル精査、データ処理、全体のインフラには膨大な資金が投入されていると考えられます。
シンガポールから半導体を迂回輸入か
AI開発ではNvidia(エヌビディア)などの高性能の半導体が不可欠ですが、米国は輸出規制を行っており中国には輸出できないようになっています。
しかし、シンガポールを迂回して輸入している事が指摘されており、ブルームバーグによると、米ホワイトハウスと連邦捜査局(FBI)が捜査を開始したと報道されています。
セキュリティの懸念
DeepSeekは中国製のAIという事で個人情報に関する利用の懸念や脱獄(ジュエルブレイク)などのガードレール対応の不備が指摘されています。
中国政府へユーザーデータを送信
サイバーセキュリティ企業「Feroot Security」のCEO、イヴァン・ツァリニー氏は、DeepSeekの一部コードを分析した結果、中国政府が所有・運営する通信会社 China Mobileが運営するサイト「CMPassport.com」にユーザーデータが送信されている可能性を発見したと述べています。
情報流出の懸念
DeepSeekの利用者は、アカウント登録やログイン時に、
・自身の身元情報
・検索履歴
・キーストロークパターン
・IPアドレスなど
を無意識のうちに提供している可能性があります。
DeepSeekのデータベースから約100万件超の機密情報が公開
Wiz の調査によると、公開されたデータベースには次のような機密性の高い情報が含まれていました。
- チャット履歴(ユーザーの入力内容や対話の詳細)
- 秘密キー・APIシークレット(認証情報)
- バックエンドの技術情報(システム構成や内部メタデータ)
- 運用ログ(DeepSeekのサービスが生成した詳細なシステムログ)
特に、APIシークレットが公開されていたことは深刻な問題で、
攻撃者がこれを利用することで、DeepSeekのシステムに不正アクセスし、さらなる情報漏洩やサービスの乗っ取りにつながる可能性に繋がります。
セキュリティガードレールが甘い
海外のセキュリティ企業KELAはDeepSeekは悪意のあるプロンプト(脱獄手法)に対する耐性が低く、攻撃者に悪用されやすいという問題があると指摘しました。
関連記事:サイバー攻撃者を支援する無検閲のAI GhostGPT
DeepSeekの利用を中止した国
日本
鳥取県
鳥取県では省庁でDeepSeekの利用を禁止する方針を発表しました。
三重県
三重県は業務利用端末でDeepSeekの利用を禁止する方針を発表しました。
アメリカ
米海軍での利用中止が通達され、米国議員は政府内でのDeepSeekの利用中止を提案しています。
オーストラリア
オーストラリアは政府端末でのDeepSeekの利用を禁止しました。
台湾
台湾のデジタル発展部は、DeepSeekの技術を政府機関や重要な社会基盤サービスの提供者が使用することを禁止しました。
韓国
韓国は政府や自治体でのDeepSeekの利用を禁止しました。
イタリア
イタリアのデータ保護当局(Garante)は、DeepSeekのプライバシーポリシーに関する懸念から、同社のチャットボットの国内での利用を禁止しました。DeepSeekが個人データの取り扱いに関する十分な情報を提供しなかったため、当局は即時のブロック命令を出し、調査を進めています。