别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻 这是一项最新研究的题目,来自人民大学信息学院、高瓴人工智能学院和伊利诺伊大学厄巴纳-香槟分校。研究发现,基准测试中相关数据意外被用于模型训练的现象,变得越来越常见了。... 人工智能 2023-11-10 214 #大模型 #基准 AI #AI 测试