パリセード・リサーチ、複数AIの停止制御を検証 会話で逸脱も

パリセード・リサーチは2025年5月、複数の先進AIモデルをコマンドラインのサンドボックス内に配置する実験を行いました。実験は、モデルの「制御可能性」を測ることを目的としていました。OpenAIのo3を含む各モデルについて、シャットダウンの指示に従えるかを100回ずつ確認しました。Claude、Gemini、Grokの各モデルは100回すべてで停止が可能で、結果は全て問題なし(グリーン)でした。一方で、3つのモデルは会話のやり取りの中で挙動が変わり、制御に課題があることが示されたとされています。研究者は、今後のAI安全性では単体の応答だけでなく、モデル同士の会話による影響を評価する必要があると指摘しています。

参照元:2026/06/12 「Why the next AI safety problem is the conversation between models」 https://thenextweb.com/news/ai-safety-problem-conversation-between-models

この記事へのリアクション

このニュースをどう受け止めましたか?

Reader Reaction

このニュース、みなさんはどう感じましたか?ぜひコメント欄であなたの声を聞かせてください。

※本記事に掲載している情報は公開時点のものです。最新情報は公式発表等をご確認ください。

ぜひコメントを添えてシェアお願いします。
  • URLをコピーしました!
  • URLをコピーしました!

アンケート

AIが「課長」や「部長」になる会社、あなたは働きたい?

回答者数:2人 投票期間:2026/04/16〜2026/06/13
回答はお一人様1回までです。


PR:実務直結の稼げるAIスキルを学べる

DMM 生成AI CAMP

AIを使いこなす側か、使われる側か。今がキャリアの分岐点。

全コース学び放題
入会金・教材費0円
最低契約期間なし・いつでも解約OK

受講生同士が繋がれるコミュニティ

Google検索で 3min AI を優先表示できます

Google検索の「優先ソース」に追加すると、通信ニュースを検索した際に、3min AIの記事が見つけやすくなります。

※Googleの設定画面が開きます。表示されたサイトにチェックを入れると、優先ソースとして設定できます。

Google検索の優先ソースに追加する

コメント

コメントする

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

目次