论文链接:https://arxiv.org/pdf/2502.14739
数据集:https://huggingface.co/datasets/m-a-p/SuperGPQA
项目主页:https://supergpqa.github.io/
在人工智能快速发展的浪潮中,准确评估AI模型的能力已成为产业发展的关键课题。在探索AI能力边界的道路上,研究者们深刻认识到现有评测体系的局限性。这促使研究学者们与行业顶尖研究机构展开合作,共同突破AI评测的固有范式。在这样的背景下,具有里程碑意义的 SuperGPQA 项目应运而生。


最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



