豆包大模型团队开源基准测试集SuperGPQA

i黑马  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

据豆包大模型团队官微消息,近日,豆包大模型团队开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。据介绍,该数据集构建了覆盖285个研究生级学科、包含26529道专业问题的评估体系,不仅涵盖主流学科,更将轻工业、农业、服务科学等长尾学科纳入其中。

文章评价
豆包大模型团队开源基准测试集SuperGPQA 匿名用户
发布
发布

    随意打赏

    提交建议
    微信扫一扫,分享给好友吧。