MITなど複数大学の研究者が、企業向けLLMの知識更新を再学習なしで行える「MeMo(Memory as a Model)」を提案しました。研究チームは、メインの推論用LLMを固定したまま、小型のメモリモデルに新知識を符号化する二つの部品構成を採用しています。ユーザーの質問に対し、固定したEXECUTIVEモデルが複数の下位質問を作り、MEMORYモデルを外部オラクルのように参照して事実を集め、最終回答を合成します。新知識の追加は、既存MEMORYに対して新規文書で学習したモデル更新を数学的に統合する「model merging」で実施します。これにより、推論エンジンを入れ替えるだけで性能が上がり、Gemini 3 Flashに切り替えた場合、NarrativeQAで26.73%の向上が報告されました。さらに、ノイズを含む文書でも精度低下が小さく、RAGの文脈窓制約や誤取得の影響を回避しやすいとしています。課題として、各コーパスごとの反射QA生成に約240GPU時間、14Bメモリ学習に約180GPU時間を要するほか、出典の追跡が難しい点が挙げられています。
参照元:2026/05/30 「MIT’s MeMo lets teams swap in a better LLM without retraining — and performance jumps 26%」 https://venturebeat.com/orchestration/mits-memo-lets-teams-swap-in-a-better-llm-without-retraining-and-performance-jumps-26
この記事へのリアクション
このニュースをどう受け止めましたか?



コメント