Xiaomi、AIエージェントの“枠組み”をタスク中に自動改良し性能向上

Xiaomiの研究者は、AIエージェントが環境と連携するためのソフト「ハーネス」を自動で改良する枠組み「HarnessX」を発表しました。
従来のハーネスは手作業で固定されており、実行データを基に自律的に改善されないのが課題でした。
HarnessXはハーネスを“第一級のオブジェクト”として扱い、モデル設定とハーネス設定を分離して、コードを壊さずに処理部品を差し替えられるようにしました。
また、ログのトレースを使って進化を行う「AEGIS」を導入し、強化学習の形でハーネスの改良を進めます。
AEGISは失敗箇所を要約するDigester、構造的な変更を計画するPlanner、動作確認のためのEvolver、報酬ハッキングや既存の成功を壊さないためのCriticとゲートで構成されます。
実験ではソフトウェア開発やWeb操作、マルチターン対話、身体化計画など5つのベンチマークで、14/15の組み合わせで性能が改善しました。
平均の絶対性能向上は+14.5%で、特に小型のオープンウェイトQwen3.5-9Bは身体化計画で+44.0%、SWE-bench Verifiedで+18.2%と大きく伸びました。
さらに、ハーネス進化中に得たデータで基盤モデルも学習させると、平均+4.7%の上乗せが確認されました。
研究者は、メタエージェント役に強力な閉域モデルが必要な点や、タスクモデル自体の能力限界がある点を制約として挙げています。
それでも同社は、モデルの大型化だけでなくハーネス進化が実運用の改善レバーになると示しました。

参照元:2026/06/25 「Xiaomi’s HarnessX rewrites its own AI scaffolding mid-task — and smaller models gain the most」 https://venturebeat.com/orchestration/xiaomis-harnessx-rewrites-its-own-ai-scaffolding-mid-task-and-smaller-models-gain-the-most

この記事へのリアクション

このニュースをどう受け止めましたか?

Reader Reaction

このニュース、みなさんはどう感じましたか?ぜひコメント欄であなたの声を聞かせてください。

※本記事に掲載している情報は公開時点のものです。最新情報は公式発表等をご確認ください。

ぜひコメントを添えてシェアお願いします。
  • URLをコピーしました!
  • URLをコピーしました!

アンケート

悩み相談をするなら、どちらに打ち明けたいですか?

回答者数:2人 投票期間:2026/04/16〜2026/06/25
回答はお一人様1回までです。


PR:実務直結の稼げるAIスキルを学べる

DMM 生成AI CAMP

AIを使いこなす側か、使われる側か。今がキャリアの分岐点。

全コース学び放題
入会金・教材費0円
最低契約期間なし・いつでも解約OK

受講生同士が繋がれるコミュニティ

Google検索で 3min AI を優先表示できます

Google検索の「優先ソース」に追加すると、通信ニュースを検索した際に、3min AIの記事が見つけやすくなります。

※Googleの設定画面が開きます。表示されたサイトにチェックを入れると、優先ソースとして設定できます。

Google検索の優先ソースに追加する

コメント

コメントする

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

目次