NRIセキュアテクノロジーズは12月17日、AIエージェントシステムの内部状態を可視化し、従来手法では検出困難だった脅威を検出するセキュリティ診断サービス「深層型AI Red Team」を提供開始することを発表した。

従来の手法では検出困難な脅威に対応するため、NRIセキュアは内部状態を可視化して診断するアプローチを開発。AIエージェントの自律的な実行能力の悪用や、AIエージェントが果たすべき目的の改変、正当な権限と機能を組み合わせた攻撃など、外部からの観察が困難なケースを想定した診断にも対応可能。これにより、AIエージェントシステムの大幅な安全性向上が期待できる。

サービスの主な特徴は以下の2点。

1.独自ツールによる内部状態の可視化

独自開発したツール「ai-guard」により、マルチエージェント環境を含む内部動作(メモリーやエージェント相互作用等)を、ユーザーのプログラムを変更することなくリアルタイムで分析。AIエージェントの推論プロセス、メモリ状態の変化、エージェント間通信などを包括的に可視化することで、OWASPが定義する15項目の脅威すべてに対応可能。

2.専門家とAIのハイブリッドアプローチ

NRIセキュアの専門家が、可視化された内部状態を観察しながら、従来の診断や標準的なソリューションでは検出困難な攻撃シナリオを立案して診断。これにAIを活用した効率的な自動検出を組み合わせることで、品質と効率性を両立させた診断を行う。

関連リンク

プレスリリース