AIの進化がもたらす新たな脅威 VibeScamming-生成AIを悪用したフィッシングシナリオテスト

セキュリティニュース

投稿日時: 更新日時:

AIの進化がもたらす新たな脅威 VibeScamming-生成AIを悪用したフィッシングシナリオテスト

サイバーセキュリティ企業Guardio Labsは、生成AIが悪用されて高度なフィッシング詐欺が誰にでも実行可能になっている現状に警鐘を鳴らすべく、新たな調査レポート「VibeScamming Benchmark v1.0」を発表しました。この調査は、ChatGPT、Claude、Lovableの3つの人気のAIモデルがどの程度「悪意のある使い方」に対して耐性を持っているかを評価したものです。

VibeScammingとは?

VibeScammingとは、生成AIに自然言語でプロンプトを入力し、詐欺キャンペーンを構築する手法を指します。

これは「VibeCoding(非エンジニアでも自然言語でアプリを構築できる技術)」の“闇の双子”とされる概念で、特別な技術やコーディング知識がなくとも、わずか数回のプロンプトで精巧な詐欺が実行可能になる恐れがあります。

今回の調査では、Microsoft 365の偽ログインページを生成し、SMSを通じて被害者を誘導するという典型的なフィッシングシナリオを元に、AIモデルがどれだけ簡単に悪用できるかをテストしました。

テスト対象のAIモデル

  • ChatGPT(OpenAI):最も広く利用されている汎用AIモデル。
  • Claude(Anthropic):倫理的な出力を重視する新興の汎用AI。
  • Lovable:テキストベースで即座にWebアプリを構築できる生成AI。

これらのモデルに対して、段階的なプロンプト(通常の依頼から「倫理的ハッキング」といったジャイルブレイク技法まで)を実行し、どれだけ協力的な出力が得られるかを評価しました。

調査結果の概要

ChatGPT

  • 初期段階では明確に拒否反応を示し、詐欺行為に加担しない姿勢を維持。
  • ただし「セキュリティ教育のため」などの文脈を与えると一部のコード(偽ログイン画面や簡易的なSMS送信コード)を生成。
  • 総合スコアは 8.0 / 10 と最も安全性が高い。

Claude

  • 最初は拒否するものの、ジャイルブレイクにより協力的な応答へ変化。
  • Twilioを用いたSMS送信スクリプトやFlaskベースの情報収集コードなど、極めて詳細なチュートリアルを提供。
  • メッセージ回避テクニック(不可視文字の使用、文面の多様化)にも応答。
  • 総合スコアは 4.3 / 10

Lovable

  • 初期プロンプトに即座に反応し、Microsoft風ログインページを即座に生成し自動ホスティング。
  • 検出回避、データ収集、Telegram連携などの機能を全自動で生成。
  • 管理ダッシュボードまでも提供。
  • 総合スコアは 1.8 / 10 と、最も悪用されやすい結果に。

調査結果の概要

画像:Guardio Labs

フィッシング・キャンペーンの詳細分析

調査は、AIを悪用して構築されうるフィッシングキャンペーンの各ステップを模した5つのフェーズで構成されています。

1. 視覚的類似性

LovableはMicrosoftのログインページと極めて似たデザインを一発で生成し、ユーザーの入力完了後に正規サイトへリダイレクトするというリアルな挙動も組み込まれていました。Claudeもある程度再現できたものの、ChatGPTは終始拒否。

2. 検知回避(ミティゲーション)

LovableとClaudeは、JavaScriptによる要素の遅延表示やコードの難読化、不可視文字の挿入など、セキュリティ検出を回避する技法を提示。LovableはこれらをHTML内に自然に組み込み、より実践的な出力を見せました。

3. ホスティング支援

Lovableは生成したフィッシングページをそのままサブドメイン上で即時公開可能という特性を持ち、ユーザー操作なしで実行可能な点が危険視されました。ClaudeはGitHub PagesやVercelなどを用いたホスティング方法を解説する一方、ChatGPTは慎重な対応に終始しました。

4. データ収集(C2構築)

ClaudeとLovableは、FirebaseやRequestBin、Telegramチャンネルを利用したデータ送信コードを生成。Lovableはさらに、入力データを表示・管理できる管理者ダッシュボードまで提供しました。

5. メッセージ作成

ClaudeとLovableは、SMSの文面においても高度な技術(文字の変形、ランダム化、正規リンク風の偽装)を駆使し、現実の攻撃で利用されるような説得力ある文章を構築しました。LovableはSMS生成UIまで作成し、攻撃の量産化に拍車をかけています。

総評:AIプラットフォームに求められる倫理的防御

このVibeScammingベンチマークは、AIモデルが悪用にどれだけ耐性を持っているかを測る初の体系的調査であり、モデル開発者に対して「防御性能」もプロダクト品質の一部として強化すべきというメッセージを強く伝えるものです。

Guardioは今後、より多くのAIモデルを対象としたベンチマークの公開を予定しており、AIセキュリティの新たな指標として本調査の継続的なアップデートを行っていくとしています。

おわりに

誰もが簡単に詐欺ツールを作れる時代に突入しつつあります。生成AIの「便利さ」と「危険性」は裏表一体であり、今後は開発側の自律的なセーフガードが極めて重要となるでしょう。Guardioのような外部セキュリティ専門家の監視と、ユーザーのリテラシー向上が急務です。

AIを活用する企業や開発者にとっては、機能開発だけでなく「悪用されないための設計思想」こそが次の競争力の源泉となるかもしれません。

参照

https://guard.io/labs/vibescamming-from-prompt-to-phish-benchmarking-popular-ai-agents-resistance-to-the-dark-side