MITのCSAIL、KAUST、HUMAINの研究チームは、国際数学オリンピック(IMO)の公式ブックレットに収録された証明付き数学問題のデータセット「MathNet」を作成し、公開しました。
MathNetは30,000件超の専門家執筆の問題と解答を含み、47か国・17言語・143の大会にまたがる規模で、同種のデータセットとしては最大級とされています。
6大陸の多様な国から集め、米国や中国中心の既存データとは異なり、テキストだけでなく画像形式の問題や解答も収録しています。
作成には1,595本のPDFで合計25,000ページ超を追跡し、2006年からIMO関連資料を手作業で収集・スキャンしてきたNavid Safaeiの個人アーカイブが基盤になったとしています。
また、公式ブックレットの解答は専門家により作成され査読も行われており、複数の解法が詳細に示される点が特徴です。
研究チームは人手による採点グループを30人超で組織し、解答の検証を行ったとしています。
さらにMathNetを用いた評価では、最上位モデルでも正答率が伸びにくい領域があり、図を含む問題やモンゴル語などで性能が低下する結果が示されました。
MathNetは公開サイトで利用でき、ICLRで発表される予定です。
参照元:2026/04/25 「MIT scientists build the world’s largest collection of Olympiad-level math problems, and open it to everyone」 https://news.mit.edu/2026/mit-scientists-build-worlds-largest-collection-olympiad-level-math-problems-open-0424



コメント