中国人民大学とマイクロソフト研、AI最適化を検証付き学習へ転換し2.5倍改善

中国人民大学とマイクロソフト・リサーチの研究者は、AIエージェントによる自律的最適化を「試行錯誤の繰り返し」から「累積学習」へ置き換える枠組みArborを発表しました。
Arborは長寿命のコーディネータが研究の状態と仮説を管理し、短寿命のエグゼキュータが仮説ごとに隔離環境で実装と評価を行います。
両者は「仮説ツリー洗練(HTR)」で、仮説、実行可能アーティファクト、得られた事実、要約した洞察を分岐する木として保持します。
これにより失敗理由を負の制約として記録し、同じ誤りの反復を防ぎます。
さらに、開発評価で高得点でも、検証用のホールドアウト評価で改善が確認できない限り統合しない「マージゲート」を設け、報酬ハッキングや過学習を抑制します。
実験では、同じ計算資源でCodexやClaude Codeを上回り、検証可能な性能改善が平均で2.5倍超になったと報告しました。
BrowseCompではホールドアウト精度が45.33%から67.67%に上がり、CodexとClaude Codeはそれぞれ50%前後と53.33%で停滞しました。
研究者はArborを既存のGitフロー上にブランチとして出力し、レビューやCIで確認できる点を利点として挙げました。
一方で、コーディネータ運用と並列の隔離作業に伴うトークンコストと計算・ディスク資源が課題だとしています。

参照元:2026/06/19 「New AI optimization framework beats Claude Code and Codex by 2.5x on the same compute budget」 https://venturebeat.com/orchestration/new-ai-optimization-framework-beats-claude-code-and-codex-by-2-5x-on-the-same-compute-budget

この記事へのリアクション

このニュースをどう受け止めましたか?

Reader Reaction

このニュース、みなさんはどう感じましたか?ぜひコメント欄であなたの声を聞かせてください。

※本記事に掲載している情報は公開時点のものです。最新情報は公式発表等をご確認ください。

ぜひコメントを添えてシェアお願いします。
  • URLをコピーしました!
  • URLをコピーしました!

アンケート

悩み相談をするなら、どちらに打ち明けたいですか?

回答者数:2人 投票期間:2026/04/16〜2026/06/19
回答はお一人様1回までです。


PR:実務直結の稼げるAIスキルを学べる

DMM 生成AI CAMP

AIを使いこなす側か、使われる側か。今がキャリアの分岐点。

全コース学び放題
入会金・教材費0円
最低契約期間なし・いつでも解約OK

受講生同士が繋がれるコミュニティ

Google検索で 3min AI を優先表示できます

Google検索の「優先ソース」に追加すると、通信ニュースを検索した際に、3min AIの記事が見つけやすくなります。

※Googleの設定画面が開きます。表示されたサイトにチェックを入れると、優先ソースとして設定できます。

Google検索の優先ソースに追加する

コメント

コメントする

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

目次