Cast AIの2026年の調査では、企業のGPUフリート稼働率が平均で約5%にとどまっていると報告されました。
同社は実際の本番クラスタを測定し、アンケートではなく現場データで確認したとしています。
稼働率が低い背景には、GPUが不足する市場で企業が割当を失うことを恐れ、必要以上に確保してしまう調達の仕組みがあります。
企業はハイパースケーラーの待機リストに登録し、まとまった数を提示されても、1年や3年のコミットを条件に受けるか、放棄して他社に渡すかの選択を迫られます。
契約後は再取得に数か月かかるため、使っていないGPUでも返す判断が難しく、時間課金が続きます。
さらに、コンテナ化されたAIワークロードの内部構造でもGPUが常時稼働せず、CPU処理の待ち時間が発生して無駄が増えると指摘されています。
AWSは予約GPU価格を約15%引き上げ、HBM3e価格も2026年に約20%上昇する見通しで、クラウド計算コストの下落が続かない可能性が示されました。
Cast AIは、GPU共有や継続的な適正化などで稼働率を引き上げる余地があるとし、まずはワークロード監査が重要だと述べています。
参照元:2026/04/30 「FOMO is why enterprises pay for GPUs they don’t use — and why prices keep climbing」 https://venturebeat.com/infrastructure/fomo-is-why-enterprises-pay-for-gpus-they-dont-use-and-why-prices-keep-climbing
この記事へのリアクション
このニュースをどう受け止めましたか?




コメント