2025年9月11日に公開された調査によれば、中国拠点とされるグループ「Cyberspike」が、AIを活用したペネトレーションテストツール「Villager」を公開し、短期間で約1万件のダウンロードが確認されています。VillagerはKali Linuxのツール群と大規模言語モデル(DeepSeek系)を組み合わせ、自然言語の指示から偵察・脆弱性診断・侵入・持続化までを自動連鎖できる点が特徴です。
正規目的のツールですが、容易に悪用できサイバー攻撃を自動化・高度化が懸念されています。
AI活用ペネトレーションテストツール Villagerとは
Villagerは、人が与えた曖昧な目標から出発し、必要な作業を機械側で順番に考え、足りない情報を拾いに行き、実行結果を踏まえて次の一手を選び直す、という一連の流れを自動で実行します。
イメージとしてはユーザーが普段、診断計画を組むときにやっている思考手順を、モデルが代わりに進める といった流れです。
たとえば「あるドメインの安全性を確かめたい」と入力すると、Villagerは周辺のサブドメインや公開ポートを洗い出し、検出した技術要素に合わせて適切なツールを呼び分けます。
WordPressが見つかればWPScanに切り替え、APIの挙動が鍵だと判断すればブラウザ自動化に軸足を移す、といった具合です。各段階では、成功とみなす条件を自分で設定し、その条件を満たしたかどうかを確かめながら進みます。
もう一つの特徴は、作業環境そのものをその場で用意して、終われば消す運用に最初から寄せている点です。
Kali Linuxの機能を持つコンテナを必要に応じて立ち上げ、短期間だけ使って自壊させます。ログが残りにくく、環境差に悩まされにくいので、攻撃側から見れば回転が速く、守る側から見れば痕跡が追いにくい構造です。出力形式もPydanticで厳密に縛っているため、結果のばらつきが少なく、長い手順を途中で取り落としにくいのも実運用では効いてきます。
入手面ではPyPI経由で導入できるため、開発端末や検証環境にも入り込みやすく、試しやすいツールになっています。
DeepSeek連携
Villagerが“AIネイティブ”と呼べる理由は、DeepSeekと連携し意思決定エンジンとして使っている点にあります。
バックエンドではOpenAI互換のエンドポイントに接続し、独自指定のモデルを呼び出して、与えられた目標をどう分解し、どの順序で何を確認し、結果が条件に達しなければどう組み替えるか
この一連の判断をモデルに任せています。モデル出力の形式はPydanticで厳格に縛るため、返り値は機械がそのまま処理でき、手戻りが少ないのが運用上の強みです。
もう一つの肝はRAG(取得強化生成)の実装です。
Villagerは4,000件超のシステムプロンプト群を道具箱のように参照し、状況に応じて最適な手筋を選びます。
前段の例の通り、WordPressが見えればその切り口、APIが鍵ならブラウザ自動化、といった戦術の差し替えが滑らかに起きるのは、この下支えがあるからです。
開発グループ Cyberspikeとは
Cyberspikeは2023年に活動が観測され、過去プロダクトにはRAT(リモート管理ツール)相当機能(リバースプロキシ、マルチステージ生成、キーロガー、Webカメラ制御等)を内包。分析ではAsyncRAT派生コンポーネントとの強い類似が指摘されています。
2025年7月、同グループはPyPIにVillagerを公開し、AI×攻撃自動化の方向へと舵を切りました。これにより悪用されサイバー攻撃の簡易化、高度化が懸念されています
正当ツール悪用の前例:Cobalt Strikeの教訓
正規ツールの悪用は過去から発生しており、例えばCobalt Strikeは本来、レッドチーム演習向けに設計された商用フレームワークでしたが、2010年代後半から海賊版・クラック版の流通を契機に広く拡散し、複数のランサムウェアオペレーションやAPTに悪用されてきました。
特徴的なのは、Beaconによる柔軟なC2通信、Malleable C2によるプロファイル偽装、ペイロードの多段ローダー化、そして多様な横展開機能です。
正規利用を前提に作られた設計上の強みが、そのまま攻撃者にとっても利点となり、検知を擦り抜ける「実戦仕様」の挙動が一般化しました。








