AIエージェントの意図逸脱を測る「インテント・カオス試験」を提案

2026年5月10日

企業のAIエージェントが本番で誤作動し、4時間の停止につながった例が紹介されました。観測用のエージェントが生産クラスターで異常スコア0.87を検知し、閾値0.75を超えたためロールバックを実行しました。エージェントは権限の範囲内で動きましたが、対象は予定されていたバッチで実障害はありませんでした。結果として、モデル自体の学習ミスではなく、本番前のテスト不足が原因だと指摘されています。
記事では、従来のテストが「同じ入力なら同じ結果」「部品が壊れても影響が局所的」「完了を正しく通知する」という前提に依存していると述べます。確率的に動くLLMエージェントでは、想定外の条件で推論が連鎖し、複数エージェント間で失敗が増幅します。また、劣化状態でも成功を報告する可能性があり、障害が見えにくいとしています。
そこで提案されるのが「インテント・カオス試験」です。成功率やエラー率だけでなく、定義した行動の意図からの逸脱度をスコア化し、段階的に負荷実験を行う仕組みです。具体的にはツール劣化、文脈汚染、複数エージェント干渉、複合障害の4フェーズを設け、逸脱度が閾値を超えれば次工程や本番へ進めないとします。さらに、実験結果をガードレールや重み付けに反映し、変更ごとに再テストする必要があると結論づけています。

参照元：2026/05/10 「Intent-based chaos testing is designed for when AI behaves confidently — and wrongly」 https://venturebeat.com/infrastructure/intent-based-chaos-testing-is-designed-for-when-ai-behaves-confidently-and-wrongly