RecursiveMAS、テキスト連携をやめ潜在表現で多段推論し2.4倍高速化

多人数で推論するマルチエージェントAIでは、各エージェントがテキスト列を生成して受け渡すため、待ち時間が増えトークン費用も膨らむ課題がありました。
この問題を解決するため、イリノイ大学アーバナ・シャンペーン校とスタンフォード大学の研究者は、RecursiveMASという枠組みを開発しました。
RecursiveMASは、エージェント間の情報伝達をテキストではなく埋め込み(embedding)空間の潜在表現で行います。
各エージェントはテキストを出さず、連続的な潜在表現を次のエージェントへ渡し、最終エージェントのみが最終ラウンドで文章出力します。
エージェント間の潜在表現の受け渡しには、学習コストを抑える軽量モジュールのRecursiveLinkを導入し、モデル本体のパラメータは凍結したままRecursiveLinkのみを学習します。
9つのベンチマークで検証した結果、RecursiveMASは最強の基準手法に比べ平均で8.3%精度が向上しました。
推論速度は、テキストを毎ステップ生成しないことにより全体で1.2倍から2.4倍に高速化しました。
トークン使用量も、テキスト連携版のRecursive-TextMASと比べて第1ラウンドで34.6%削減され、3ラウンド目には75.6%削減されました。
学習面でも、RecursiveLinkが約1,300万パラメータで全学習可能パラメータの約0.31%に相当するため、GPUメモリ使用量と学習コストを半分以上抑えられるとしています。
研究者はコードと学習済みモデル重みをApache 2.0ライセンスで公開しました。

参照元:2026/05/16 「How RecursiveMAS speeds up multi-agent inference by 2.4x and reduces token usage by 75%」 https://venturebeat.com/orchestration/how-recursivemas-speeds-up-multi-agent-inference-by-2-4x-and-reduces-token-usage-by-75

この記事へのリアクション

このニュースをどう受け止めましたか?

Reader Reaction

このニュース、みなさんはどう感じましたか?ぜひコメント欄であなたの声を聞かせてください。

※本記事に掲載している情報は公開時点のものです。最新情報は公式発表等をご確認ください。

ぜひコメントを添えてシェアお願いします。
  • URLをコピーしました!
  • URLをコピーしました!

アンケート

AIはあなたの仕事を「奪う」存在?それとも「助ける」存在?

回答者数:2人 投票期間:2026/04/16〜2026/05/31
回答はお一人様1回までです。


PR:実務直結の稼げるAIスキルを学べる

DMM 生成AI CAMP

AIを使いこなす側か、使われる側か。今がキャリアの分岐点。

全コース学び放題
入会金・教材費0円
最低契約期間なし・いつでも解約OK

受講生同士が繋がれるコミュニティ

Google検索で 3min AI を優先表示できます

Google検索の「優先ソース」に追加すると、通信ニュースを検索した際に、3min AIの記事が見つけやすくなります。

※Googleの設定画面が開きます。表示されたサイトにチェックを入れると、優先ソースとして設定できます。

Google検索の優先ソースに追加する

コメント

コメントする

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

目次