スタンフォード研究、同一思考予算なら単一エージェントが多くで上回る

2026年4月23日

スタンフォード大学の研究チームが、単一エージェント型と複数エージェント型のAIを、同一の「思考トークン」予算で比較しました。
複数エージェント型は複数モデルが部分文脈をやり取りするため、推論の中間ログが長くなりやすく、計算コストが増える傾向があると指摘されています。
そのため、精度向上が「構造の優位」なのか「より多くの計算資源の消費」なのかが判別しにくい問題がありました。
研究では、複数ホップの推論課題で、思考トークン数を厳密に揃えた条件を設定しました。
実験の結果、多くの場合で単一エージェント型が複数エージェント型と同等、または上回る性能を示しました。
一方で、単一エージェントの文脈が長すぎる、あるいは破損している場合には、複数エージェント型が優位になりました。
単一エージェントが早期に推論を打ち切りやすい点には、SAS-Lとして「利用可能な思考予算を事前分析に使う」ようプロンプトを組み替える工夫を提案しています。
研究者は、複数エージェントのオーケストレーションには通信や要約による情報損失、誤りの増幅といった二次コストがあるとも述べました。
開発者には、APIのトークン集計だけに頼らず、可能な範囲で推論トレースを計測し、数字を慎重に扱うよう促しています。
この結果を踏まえ、単一エージェントで一貫した文脈を扱える場合は、複数エージェント導入が「スウォーム税」になる可能性があるとしています。

参照元：2026/04/23 「Are you paying an AI ‘swarm tax’? Why single agents often beat complex systems」 https://venturebeat.com/orchestration/are-you-paying-an-ai-swarm-tax-why-single-agents-often-beat-complex-systems