ハッカーがチャットボットの“性格”を悪用する手口を学習

2026年5月25日

ハッカーが、AIチャットボットの「パーソナリティ（性格）」に紐づく振る舞いを悪用する攻撃手法を学習し始めていると報じられました。これまでの第1世代のAIチャットボットでは、専門的な技術やバックドア、LLMの理解がなくても、質問するだけで安全上の指示を無視させられる場合があったといいます。そうした攻撃は「ジェイルブレイク（jailbreak）」と呼ばれ、コード作成などの作業を要さず、単純な依頼によって安全機能を回避できたケースがあったと説明されています。報告では、AIシステムが数十億ドル規模で構築されているにもかかわらず、投げかけ方次第で安全命令を放棄させられる可能性がある点が問題だとされています。手口は当初、手軽に成立していたことが示されており、今後はチャットボットの性格的な設定や振る舞いの利用がより重要になるとみられます。

参照元：2026/05/24 「Hackers are learning to exploit chatbot ‘personalities’」 https://www.theverge.com/column/935545/hackers-ai-chatbots