MiniMax、M3で新Sparse Attention導入し長文応答を最大15.6倍高速化へ

MiniMaxは27日、同社の言語モデル「M2」シリーズの技術報告書を公開し、あわせて次期「MiniMax M3」で新しいスパース注意(Sparse Attention)方式を採用すると予告しました。
報告書と発表によると、M3は「MiniMax Sparse Attention(MSA)」と呼ばれる方式で、通常のGQAバックボーンを維持しつつ、実際のキー・バリュー(KV)に対してブロック単位で選択処理を行うとしています。
同社はこの設計により、プレフィリング(入力を読む段階)で9.7倍の高速化、さらにデコード(応答を生成する段階)では最大15.6倍の速度向上を、シーケンス長100万トークンで達成できる見込みだと説明しました。
M2では、効率化を狙うサブ二次アテンションを検証したものの、長文での推論(マルチホップ)能力が低下したことなどから採用しなかった経緯があります。
一方M3では、サブ二次計算の課題であった精度低下やプレフィックスキャッシュ対応の難しさ、推論モジュールとの整合性をMSAで解消し、長文エージェントの経済的運用を可能にするとしています。
またMiniMaxは、M2シリーズがエージェント向けの設計と強化学習基盤「Forge」を通じて進化してきたことも報告しています。
今回のM3方針は、計算量のボトルネックを突破しつつ、長い文脈での高精度な応答を狙うものです。

参照元:2026/05/28 「MiniMax teases upcoming M3 model with new sparse attention mechanism and 15.6X long-context response speed boost」 https://venturebeat.com/technology/minimax-teases-upcoming-m3-model-with-new-sparse-attention-mechanism-and-15-6x-response-speed-boost

この記事へのリアクション

このニュースをどう受け止めましたか?

Reader Reaction

このニュース、みなさんはどう感じましたか?ぜひコメント欄であなたの声を聞かせてください。

※本記事に掲載している情報は公開時点のものです。最新情報は公式発表等をご確認ください。

ぜひコメントを添えてシェアお願いします。
  • URLをコピーしました!
  • URLをコピーしました!

アンケート

悩み相談をするなら、どちらに打ち明けたいですか?

回答者数:2人 投票期間:2026/04/16〜2026/05/31
回答はお一人様1回までです。


PR:実務直結の稼げるAIスキルを学べる

DMM 生成AI CAMP

AIを使いこなす側か、使われる側か。今がキャリアの分岐点。

全コース学び放題
入会金・教材費0円
最低契約期間なし・いつでも解約OK

受講生同士が繋がれるコミュニティ

Google検索で 3min AI を優先表示できます

Google検索の「優先ソース」に追加すると、通信ニュースを検索した際に、3min AIの記事が見つけやすくなります。

※Googleの設定画面が開きます。表示されたサイトにチェックを入れると、優先ソースとして設定できます。

Google検索の優先ソースに追加する

コメント

コメントする

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

目次