MetaやGoogleが自動で推論戦略を設計し、LLMのトークン使用量を大幅削減

MetaとGoogle、複数の大学の研究者は、推論時に追加計算を配分する「テストタイムスケーリング(TTS)」の戦略を自動で探索する枠組みAutoTTSを発表しました。
従来のTTSは人手でルールや閾値を調整しており、探索できる戦略空間が限られていました。
AutoTTSでは、探索用のエージェントとなるLLMが、分岐・深掘り・枝刈り・停止の方針をコード化したコントローラを反復提案し、事前収集した推論軌跡で評価して改善します。
評価には、ベースモデルの推論軌跡と中間の「プローブ信号」を用いるオフライン・リプレイ環境を使い、都度のトークン生成コストを抑えました。
発見された最適コントローラは「Confidence Momentum Controller」で、瞬間的な自信ではなく指数移動平均の傾向で停止を判断し、幅と深さを連動させ、合意に近い枝へ計算を優先配分します。
Qwen3の0.6B〜8BやDeepSeek-R1蒸留版で検証した結果、コスト重視の設定でSC@64比の総トークン消費を約69.5%削減し、平均精度は同等でした。
予算を増やすと、8ケース中5ケースで手作り手法を上回るピーク精度も示しました。
さらにGPQA-Diamondでは510Kトークンから151Kトークンへ削減し、精度もわずかに改善しました。
AutoTTSの探索にかかった費用は39.90ドルで160分とされ、GitHubで公開されています。

参照元:2026/05/29 「Researchers automated LLM reasoning strategy design and cut token usage by 69.5%」 https://venturebeat.com/orchestration/researchers-automated-llm-reasoning-strategy-design-and-cut-token-usage-by-69-5

この記事へのリアクション

このニュースをどう受け止めましたか?

Reader Reaction

このニュース、みなさんはどう感じましたか?ぜひコメント欄であなたの声を聞かせてください。

※本記事に掲載している情報は公開時点のものです。最新情報は公式発表等をご確認ください。

ぜひコメントを添えてシェアお願いします。
  • URLをコピーしました!
  • URLをコピーしました!

アンケート

悩み相談をするなら、どちらに打ち明けたいですか?

回答者数:2人 投票期間:2026/04/16〜2026/05/31
回答はお一人様1回までです。


PR:実務直結の稼げるAIスキルを学べる

DMM 生成AI CAMP

AIを使いこなす側か、使われる側か。今がキャリアの分岐点。

全コース学び放題
入会金・教材費0円
最低契約期間なし・いつでも解約OK

受講生同士が繋がれるコミュニティ

Google検索で 3min AI を優先表示できます

Google検索の「優先ソース」に追加すると、通信ニュースを検索した際に、3min AIの記事が見つけやすくなります。

※Googleの設定画面が開きます。表示されたサイトにチェックを入れると、優先ソースとして設定できます。

Google検索の優先ソースに追加する

コメント

コメントする

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

目次