AI IQのスタートアップは、言語モデルの推定知能を人間のIQに見立てて数値化し、50超のフロンティアモデルをサイト上で可視化しました。運営はエンジニア起業家のRyan Shea氏で、aiiq.orgでインタラクティブな図表を公開しています。
同サイトは12のベンチマークを抽象・数学・プログラム・学術の4次元に整理し、4次元スコアの単純平均から複合IQを算出すると説明しています。
さらに、EQ(感情知能)としてEQ-Bench 3のEloとArena Eloを基に推定EQを作り、IQとEQの散布図で順位が変わることも示しています。
一方で研究者や論評は、能力の「ぎざぎざ(jagged)」を単一スコアに圧縮すると精度の錯覚を生むとして批判しました。
手法の一部は較正曲線を提示するものの、原データや変換の詳細は公開されていない点も問題視されています。
また、上位モデルのIQ差が縮む一方、タスク別の有効コストでみると高性能でも割高な場合があるとして、企業向けにモデル選定の指標になり得るとされています。
AI IQの公開は、モデル比較を「1つの枠組み」で行う利便性と、単一指標の限界をめぐる論争を同時に広げています。
参照元:2026/05/14 「AI IQ is here: a new site scores frontier AI models on the human IQ scale. The results are already dividing tech.」 https://venturebeat.com/technology/ai-iq-is-here-a-new-site-scores-frontier-ai-models-on-the-human-iq-scale-the-results-are-already-dividing-tech
この記事へのリアクション
このニュースをどう受け止めましたか?



コメント