アリババのQwenチームは2026年5月20日、Alibaba Cloud Summitで推論型エージェントモデル「Qwen3.7-Max」を正式発表しました。テキスト入力・出力に対応し、コーディングやデバッグ、オフィス業務の自動化、数百〜数千ステップの長期タスクを想定しています。モデルはクローズドウェイトの独自仕様で、APIアクセス可能です。
同時に「Qwen3.7-Max-Preview」と「Qwen3.7-Plus-Preview」も公開され、LM ArenaのランキングではMax-Previewがテキストで全体13位、Plus-Previewがビジョンで全体16位でした。Qwen3.7-Maxは「Extended-Thinking mode」によって、計画や確認、軌道修正を経てから最終回答を出す仕組みです。インターフェース上では「Thinking」モードとして切り替え可能で、推論により出力トークンが増えるため短い作業では遅延が増える点に注意が必要です。
人工分析の評価では、Qwen3.7-MaxはIntelligence Indexで56.6を獲得し総合5位となり、前モデルから4.8ポイント伸長しました。主な伸びは科学的推論、エージェント能力、コーディング領域に集中しています。一方でAA-Omniscienceでは、正確性の生データが低下し、代わりに「分からない」と回答する割合が増える傾向も示されました。
最大の特徴として、1Mトークンのコンテキストウィンドウを搭載し、Qwen3.6 Max Previewの256Kから拡大しています。価格は未発表で、Qwen3.6 Max Previewは入力・出力各100万トークンあたり1.30ドル/7.80ドルでした。アリババは新チップ基盤で1,000回超のツール呼び出しと反復的なコード修正を行い、推論速度が約10倍になったと社内テストで主張していますが、独立検証はありません。
記事では、プレビューモードであるため挙動や価格が変わり得ること、また1M文脈は上限であり長文脈の信頼性は用途ごとに検証が必要だとしています。
参照元:2026/05/22 「Qwen Introduces Qwen3.7-Max: A Reasoning Agent Model With a 1M-Token Context Window」 https://www.marktechpost.com/2026/05/21/qwen-introduces-qwen3-7-max-a-reasoning-agent-model-with-a-1m-token-context-window/
この記事へのリアクション
このニュースをどう受け止めましたか?



コメント