Liquid AIがオンデバイスMoE推論モデル「LFM2.5-8B-A1B」を発表

Liquid AIは、オンデバイス向けMixture-of-Experts(MoE)推論モデル「LFM2.5-8B-A1B」をリリースしました。
同モデルは総パラメータ8.3Bを保持しつつ、トークンごとに1.5Bのみを有効化する設計です。
これにより、生成時の計算コストを抑えながら推論を行えるとしています。
モデルは推論専用で、回答の前に明示的な推論(chain of thought)を出力する仕様です。
また、24層構成で、コンテキスト長は131,072トークン、対応言語は9言語としています。
前モデル「LFM2-8B-A1B」からは、コンテキスト窓を32,768から128,000へ拡大し、事前学習トークン数も12Tから38Tへ増やしました。
語彙数は65,536から128,000へ倍増し、非ラテン文字のトークナイズ効率を高めたと報告されています。
ベンチマークでは、AA-Omniscienceの非幻覚率が7.46から63.47へ、IFEvalが79.44から91.84へ向上したとしています。
推論速度はCPUでM5 Maxが253トークン/秒、スマートフォンでは約30トークン/秒、NVIDIA H100 SXM5で18.5Kトークン/秒に達するとしています。
推論基盤としてllama.cpp、MLX、vLLM、SGLangなどのフレームワークに対応し、学習済み重みはLFM1.0ライセンスのもと公開されています。

参照元:2026/05/29 「Liquid AI Releases LFM2.5-8B-A1B: An On-Device MoE Model With 8.3B Total and 1.5B Active Parameters」 https://www.marktechpost.com/2026/05/28/liquid-ai-releases-lfm2-5-8b-a1b-an-on-device-moe-model-with-8-3b-total-and-1-5b-active-parameters/

この記事へのリアクション

このニュースをどう受け止めましたか?

Reader Reaction

このニュース、みなさんはどう感じましたか?ぜひコメント欄であなたの声を聞かせてください。

※本記事に掲載している情報は公開時点のものです。最新情報は公式発表等をご確認ください。

ぜひコメントを添えてシェアお願いします。
  • URLをコピーしました!
  • URLをコピーしました!

アンケート

悩み相談をするなら、どちらに打ち明けたいですか?

回答者数:2人 投票期間:2026/04/16〜2026/05/31
回答はお一人様1回までです。


PR:実務直結の稼げるAIスキルを学べる

DMM 生成AI CAMP

AIを使いこなす側か、使われる側か。今がキャリアの分岐点。

全コース学び放題
入会金・教材費0円
最低契約期間なし・いつでも解約OK

受講生同士が繋がれるコミュニティ

Google検索で 3min AI を優先表示できます

Google検索の「優先ソース」に追加すると、通信ニュースを検索した際に、3min AIの記事が見つけやすくなります。

※Googleの設定画面が開きます。表示されたサイトにチェックを入れると、優先ソースとして設定できます。

Google検索の優先ソースに追加する

コメント

コメントする

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

目次