Sakana AIと東大がブロック別学習で拡散モデル化、学習メモリをB分の1に

Sakana AIの研究チームと東京大学は、残差ネットワークをブロック単位で独立に学習できる枠組み「DiffusionBlocks」を提案しました。
同手法では、トランスフォーマー系ネットワークをB個のブロックに分割し、各ブロックを連続時間拡散モデル由来のスコアマッチング目的で学習します。
残差接続の更新則が逆拡散過程の確率フローODEをオイラー離散化したものに対応することを根拠に、各ブロックは局所目的のみで整合的に学習できるとしています。
学習時は各反復で1ブロックだけを計算するため、必要な学習メモリは概ね1/Bに低減します。
さらに拡散モデルでは生成時にも各ノイズ除去ステップで活性化するブロック数が減り、推論計算もB分の1程度になります。
実験ではViTやDiT、マスク拡散、自己回帰、recurrent-depthなど5系統で評価し、エンドツーエンド学習と同等以上の性能を報告しました。
特にCIFAR-10では、ノイズ区間を等確率に分割することでFIDが一様分割より改善したとしています。
一方で、入力と出力の次元が一致する必要があり、U-Net型には現時点で適用できないほか、微調整への検証は未実施としています。
論文と実装は公開されています。

参照元:2026/05/28 「Sakana AI Proposes DiffusionBlocks: a Block-wise Training Framework That Converts Residual Networks into Independently Trainable Denoising Modules」 https://www.marktechpost.com/2026/05/27/sakana-ai-proposes-diffusionblocks-a-block-wise-training-framework-that-converts-residual-networks-into-independently-trainable-denoising-modules/

この記事へのリアクション

このニュースをどう受け止めましたか?

Reader Reaction

このニュース、みなさんはどう感じましたか?ぜひコメント欄であなたの声を聞かせてください。

※本記事に掲載している情報は公開時点のものです。最新情報は公式発表等をご確認ください。

ぜひコメントを添えてシェアお願いします。
  • URLをコピーしました!
  • URLをコピーしました!

アンケート

AIはあなたの仕事を「奪う」存在?それとも「助ける」存在?

回答者数:2人 投票期間:2026/04/16〜2026/05/31
回答はお一人様1回までです。


PR:実務直結の稼げるAIスキルを学べる

DMM 生成AI CAMP

AIを使いこなす側か、使われる側か。今がキャリアの分岐点。

全コース学び放題
入会金・教材費0円
最低契約期間なし・いつでも解約OK

受講生同士が繋がれるコミュニティ

Google検索で 3min AI を優先表示できます

Google検索の「優先ソース」に追加すると、通信ニュースを検索した際に、3min AIの記事が見つけやすくなります。

※Googleの設定画面が開きます。表示されたサイトにチェックを入れると、優先ソースとして設定できます。

Google検索の優先ソースに追加する

コメント

コメントする

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

目次