PinterestのCTOマット・マドリガル氏とチームは、画像推薦でフロンティアモデルを常時呼び出す運用コストが約6億人規模の月間アクティブユーザーでは負担になるとして、Qwen3-VLの構成を見直しました。
同氏らはモデルの視覚(vision)層を「削り取る」形で改造し、自社開発のマルチモーダル埋め込み(embeddings)で再学習しました。
これにより、画像やピンに付随するメタデータを文脈として捉え、事前にオフライン計算して定期的に最新情報で再訓練できるようにしました。
埋め込みを持たない場合は、応答時に返ってきた各画像を1枚ずつエンコードする必要があり、推論の遅延が「20倍悪化」すると説明しています。
その結果、AIコストは90%減少し、精度も30%向上したとしています。
また、Pinterestは好みの変化を表す「テイストグラフ」を構築し、クリックだけでなくユーザーの嗜好を埋め込みとして更新してパーソナライズに活用しています。
同氏は、独自データを伴うオープンソースモデルのカスタマイズは、モデル規模よりもデータ品質が重要だと述べました。
参照元:2026/05/30 「Pinterest cut AI costs 90% by gutting a frontier model’s vision layer」 https://venturebeat.com/orchestration/pinterest-cut-ai-costs-90-by-gutting-a-frontier-models-vision-layer
この記事へのリアクション
このニュースをどう受け止めましたか?



コメント