ベクトル検索をRAGパイプラインに組み込む際、10百万件の埋め込みをfloat32で保持すると約31GBのRAMが必要になります。これを課題として、オープンソースのライブラリturbovecをRyanCodraiが公開しました。turbovecはRustで実装したベクトルインデックスで、Pythonバインディングを備えています。Google ResearchのTurboQuant量子化アルゴリズムを基にしており、コードブックの学習やデータ走査を不要にしたデータ非依存の量子化を特徴とします。10百万件のコーパスはturbovecで約4GBに収まるとされています。検索ではクエリを同一の回転空間に変換し、コードブック値に直接スコアリングします。SIMD命令を用い、ARMのNEONやx86のAVX-512BW、AVX2のフォールバックに対応します。ベンチマークではARM(Apple M3 Max)でFAISS IndexPQFastScanに対し12〜20%高速化したと報告されています。
参照元:2026/05/21 「Meet Turbovec: A Rust Vector Index with Python Bindings, and Built on Google’s TurboQuant Algorithm」 https://www.marktechpost.com/2026/05/20/meet-turbovec-a-rust-vector-index-with-python-bindings-and-built-on-googles-turboquant-algorithm/
この記事へのリアクション
このニュースをどう受け止めましたか?



コメント