大模型 - 小猪号

别让大模型被基准评估坑了！测试集乱入预训练，分数虚高，模型变傻

这是一项最新研究的题目，来自人民大学信息学院、高瓴人工智能学院和伊利诺伊大学厄巴纳-香槟分校。研究发现，基准测试中相关数据意外被用于模型训练的现象，变得越来越常见了。...

上海市日前发布关于印发《上海市推动人工智能大模型创新发展若干措施（2023-2025 年）》的通知，其中提到将实施大模型创新扶持计划，支持引进高水平创新企业，支持相关主体开展通用人工智能基础理论、科学...

应用介绍显示，通义千问是一款超大规模预训练模型，能够在创意文案、办公助理、学习助手、趣味生活等多个方面为用户提供全方位的协助。IT之家实测，安卓用户只需下载安装 App 并通过手机号注册，即可进行尝鲜...

昆仑万维「天工」Skywork-13B 系列目前包括 130 亿参数的两大模型：Skywork-13B-Base 模型、Skywork-13B-Math 模型。...

百川智能表示，Baichuan2-192K 是目前支持长上下文窗口最优秀大模型 Claude2（100K 上下文窗口，实测约 8 万字）的 4.4 倍，是 GPT-4（支持 32K 上下文窗口，实测约...

在由思佰诚科技举办的首届人工智能生成内容国际会议（AIGC 2023）上，邱锡鹏教授坦言，虽然大家都说大模型更偏工程化，但实际还有诸多科学挑战仍待解决，比如训练目标的设计、内存优化、自动化评测、大模型...

Yandex搜索和广告技术业务部主管Dmitry Masyuk表示，YandexGPT在生成俄语内容时的表现已经能够“稳步超越”ChatGPT 3.5版本，甚至在许多情况下提供了优于ChatGPT 4...

阿里云今日宣布，日前，为积极响应 2023 智博会“智汇八方，博采众长”号召，加快推进数字经济和智能产业高质量发展，重庆市大数据应用发展管理局、重庆市南岸区与数字重庆大数据应用发展有限公司、阿里云计算...

第二届外滩大会今日在上海开幕。在外滩大会主论坛“科技、金融、产业，融合发展新未来”圆桌对话上，蚂蚁集团董事长兼 CEO 井贤栋透露了其 AI 大模型的消息。...

据百川智能官方介绍，Baichuan2-7B-Base 和 Baichuan2-13B-Base，均基于 2.6 万亿高质量多语言数据进行训练，两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显...