Cerebrasが商用で1兆パラメータAIをGPUクラウドより高速推論

Cerebras Systems(サニーベール)が、企業向けに1兆パラメータのオープンウェイトAIモデル「Kimi K2.6」を提供し、推論速度でGPUクラウドを上回ると発表しました。
同社は月曜に、Moonshot AIが開発したKimi K2.6を約1,000トークン/秒で稼働させたと説明しました。
ベンチマーク会社Artificial Analysisが独立検証した結果、出力は981トークン/秒で、次に速いGPUベースのクラウドより6.7倍高速、中央値より23倍高速だったとしています。
また、10,000入力トークンのエージェント型コーディングで、プロンプト処理や推論を含めて500出力トークンまで5.6秒で完了し、公式Kimiエンドポイントの163.7秒に比べて最終回答まで29分の1程度の時間だったとしました。
Cerebrasは、ウェハースケールの「Wafer-Scale Engine 3」を用い、MoEの専門家配置を同一ウェハ内に置くことで通信ボトルネックを抑えるとしています。
同社は一般公開せず、フォーチュン500企業が本番ワークロードのクラウド試験を実施していると述べました。
人工知能推論市場での競争が激化する中、NvidiaによるGroq買収にも触れつつ、同社のアーキテクチャ優位が継続すると自信を示しました。

参照元:2026/05/21 「Cerebras says its chips run a trillion-parameter AI model nearly 7 times faster than GPU clouds」 https://venturebeat.com/technology/cerebras-says-its-chips-run-a-trillion-parameter-ai-model-nearly-7-times-faster-than-gpu-clouds

この記事へのリアクション

このニュースをどう受け止めましたか?

Reader Reaction

このニュース、みなさんはどう感じましたか?ぜひコメント欄であなたの声を聞かせてください。

※本記事に掲載している情報は公開時点のものです。最新情報は公式発表等をご確認ください。

ぜひコメントを添えてシェアお願いします。
  • URLをコピーしました!
  • URLをコピーしました!

アンケート

悩み相談をするなら、どちらに打ち明けたいですか?

回答者数:2人 投票期間:2026/04/16〜2026/05/31
回答はお一人様1回までです。


PR:実務直結の稼げるAIスキルを学べる

DMM 生成AI CAMP

AIを使いこなす側か、使われる側か。今がキャリアの分岐点。

全コース学び放題
入会金・教材費0円
最低契約期間なし・いつでも解約OK

受講生同士が繋がれるコミュニティ

Google検索で 3min AI を優先表示できます

Google検索の「優先ソース」に追加すると、通信ニュースを検索した際に、3min AIの記事が見つけやすくなります。

※Googleの設定画面が開きます。表示されたサイトにチェックを入れると、優先ソースとして設定できます。

Google検索の優先ソースに追加する

コメント

コメントする

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

目次