DataHubがSQL履歴から文脈を生成しAIの誤結合を抑制

2026年5月29日

DataHubは、既存のSQLクエリ履歴を掘り起こしてAIエージェント向けの文脈（Context Intelligence）を構築する新たなレイヤーを提供すると発表しました。
同社は、MiroのデータチームがAIエージェントをSnowflake環境に直接向けたところ、誤った結果が65％超の頻度で発生した背景はモデルではなく文脈不足だと説明しています。
10,000件以上のテーブルがありセマンティック層がないため、エージェントがビジネス課題に対応するデータ資産を特定できなかったとしています。
Context Intelligenceは、データリネージ追跡に用いてきたクエリログ抽出・SQL解析基盤を活用し、検証済みの「ゴールデンクエリ」から意味的な索引を生成します。
生成したセマンティックアンカーをエージェントにMCPやLangChain、GoogleのAgent Development Kit、CrewAI経由で提示し、SQL生成前に参照させます。
さらに、ドメインの専門家がAI提案内容をレビューし、競合する定義の解消や変更影響のシミュレーションを行える仕組みも備えます。
Miroは、自然言語を直接Snowflakeへ送る方式ではルーティングが不安定だったため、DataHubの文脈層でメタデータやクエリ履歴などを統合し、データプロダクト単位で参照範囲を制約する構成に切り替えました。
DataHubは、この文脈提供によりエージェントが過去に人が検証した結合を参照でき、誤結合（hallucinated joins）を減らせるとしています。

参照元：2026/05/29 「SQL query logs hold the context AI agents need to stop hallucinating joins」 https://venturebeat.com/data/sql-query-logs-hold-the-context-ai-agents-need-to-stop-hallucinating-joins