Fastino Labsが安全モデレーション用の300MモデルGLiGuardをオープンソース化

2026年5月14日

Fastino Labsは、安全モデレーションを高速化するオープンソースモデル「GLiGuard」を公開しました。GLiGuardは約3億パラメータのエンコーダ型で、ユーザー入力とモデル応答の両方を対象に安全性を判定します。
同社によると、従来のガードレールはデコーダ型で逐次生成のため遅くなり、複数の安全観点を評価するほどレイテンシが積み上がっていました。
GLiGuardは安全判断をテキスト分類として再構成し、入力とラベル定義を同時にエンコードして1回のフォワードパスで複数タスクのスコアを並列に算出します。
具体的には、安全分類（安全/危険）、11種類のジャイルブレイク戦略検知、14カテゴリの害分類、拒否検知（コンプライ/拒否）を同時に実行します。
学習ではWildGuardTrainの人手アノテーション8万7000件に加え、GPT-4.1やPioneerで合成データを用いました。
評価では9つの安全ベンチマークで、プロンプト分類の平均F1が87.7、応答分類の平均F1が82.7でした。
またNVIDIA A100 1基での計測では、スループットは最大16.2倍、レイテンシは最大16.6倍低下し、シーケンス長64で26ミリ秒（従来426ミリ秒）を示したとしています。
モデルの重みはHugging FaceでApache 2.0ライセンスとして提供され、単一GPUでの導入を想定しています。

参照元：2026/05/14 「Fastino Labs Open-Sources GLiGuard: A 300M Parameter Safety Moderation Model That Matches or Exceeds Accuracy of Models 23–90x Its Size」 https://www.marktechpost.com/2026/05/13/fastino-labs-open-sources-gliguard-a-300m-parameter-safety-moderation-model-that-matches-or-exceeds-accuracy-of-models-23-90x-its-size/