Cerebrasが商用で1兆パラメータAIをGPUクラウドより高速推論

2026年5月21日

Cerebras Systems（サニーベール）が、企業向けに1兆パラメータのオープンウェイトAIモデル「Kimi K2.6」を提供し、推論速度でGPUクラウドを上回ると発表しました。
同社は月曜に、Moonshot AIが開発したKimi K2.6を約1,000トークン/秒で稼働させたと説明しました。
ベンチマーク会社Artificial Analysisが独立検証した結果、出力は981トークン/秒で、次に速いGPUベースのクラウドより6.7倍高速、中央値より23倍高速だったとしています。
また、10,000入力トークンのエージェント型コーディングで、プロンプト処理や推論を含めて500出力トークンまで5.6秒で完了し、公式Kimiエンドポイントの163.7秒に比べて最終回答まで29分の1程度の時間だったとしました。
Cerebrasは、ウェハースケールの「Wafer-Scale Engine 3」を用い、MoEの専門家配置を同一ウェハ内に置くことで通信ボトルネックを抑えるとしています。
同社は一般公開せず、フォーチュン500企業が本番ワークロードのクラウド試験を実施していると述べました。
人工知能推論市場での競争が激化する中、NvidiaによるGroq買収にも触れつつ、同社のアーキテクチャ優位が継続すると自信を示しました。

参照元：2026/05/21 「Cerebras says its chips run a trillion-parameter AI model nearly 7 times faster than GPU clouds」 https://venturebeat.com/technology/cerebras-says-its-chips-run-a-trillion-parameter-ai-model-nearly-7-times-faster-than-gpu-clouds