カナダのAI企業Cohereは、2180億パラメータの大規模言語モデル「Command A+」を発表しました。
同社は、複雑な推論やマルチモーダルな文書処理、エージェント型ワークフロー向けに最適化したとしています。
最大の特徴として、モデルの重みをHugging FaceでApache 2.0ライセンスとして無償公開しました。
同社のCEOであるエイダン・ゴメス氏は、Apache 2.0が企業の利用制限を伴わない真のオープンソースだと説明しています。
Command A+はデコーダのみのスパースMixture-of-Experts(MoE)で、生成時にアクティブになるのは25Bパラメータのみです。
量子化にも重点を置き、4ビットのW4A4形式を中心に「ほぼロスレス」圧縮を実現したとしています。
推論に必要な計算量を抑えつつ、単一のNVIDIA Blackwell B200または2基のH100での運用を想定します。
性能面では、W4A4で低い同時実行条件において375トークン毎秒、TTFTは113ミリ秒としています。
さらにトークナイザーを更新し、48言語にネイティブ対応し、非欧州言語で必要トークン数を削減したと発表しました。
加えて、外部ツールから取得した事実に対し、根拠となるソースを出力内のタグで紐づける「ネイティブ引用」を提供します。
同社は、金融や医療、法務など規制の厳しい業界でのトレーサビリティに有効だとしています。
Command A+はテキストと画像を128K入力コンテキストで扱えるマルチモーダル対応も備えます。
同モデルは主要な推論基盤であるHugging FaceやvLLMと初日から連携できるとしており、企業の自社サーバー運用を後押しするとしています。
参照元:2026/05/21 「Cohere cracks lossless quantization and native citations with first full Apache 2.0 licensed open model Command A+」 https://venturebeat.com/technology/cohere-cracks-lossless-quantization-and-native-citations-with-first-full-apache-2-0-licensed-open-model-command-a
この記事へのリアクション
このニュースをどう受け止めましたか?



コメント