别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻 这是一项最新研究的题目,来自人民大学信息学院、高瓴人工智能学院和伊利诺伊大学厄巴纳-香槟分校。研究发现,基准测试中相关数据意外被用于模型训练的现象,变得越来越常见了。... 人工智能 2023-11-10 280 #大模型 #基准 AI #AI 测试
上海发布 11 条措施推动 AI 大模型发展,支持相关人才落户 上海市日前发布关于印发《上海市推动人工智能大模型创新发展若干措施(2023-2025 年)》的通知,其中提到将实施大模型创新扶持计划,支持引进高水平创新企业,支持相关主体开展通用人工智能基础理论、科学... 人工智能 2023-11-10 362 #人工智能 #大模型 #上海
阿里通义千问大模型 App 上线:支持 AI 问答、创意文案等功能 应用介绍显示,通义千问是一款超大规模预训练模型,能够在创意文案、办公助理、学习助手、趣味生活等多个方面为用户提供全方位的协助。IT之家实测,安卓用户只需下载安装 App 并通过手机号注册,即可进行尝鲜... 人工智能 2023-10-31 408 #通义千问 #阿里巴巴 #大模型
昆仑万维宣布开源“天工”Skywork-13B 系列大模型,0 门槛商用 昆仑万维「天工」Skywork-13B 系列目前包括 130 亿参数的两大模型:Skywork-13B-Base 模型、Skywork-13B-Math 模型。... 人工智能 2023-10-31 306 #昆仑万维 #大模型 #天工 模型
百川智能推出 Baichuan2-192K 大模型,上下文窗口长超 GPT-4 约 14 倍 百川智能表示,Baichuan2-192K 是目前支持长上下文窗口最优秀大模型 Claude2(100K 上下文窗口,实测约 8 万字)的 4.4 倍,是 GPT-4(支持 32K 上下文窗口,实测约... 人工智能 2023-10-31 315 #百川智能 #Baichuan #大模型
十问复旦邱锡鹏:大模型进入安卓时代,希望有国产模型能代替 LIama 在由思佰诚科技举办的首届人工智能生成内容国际会议(AIGC 2023)上,邱锡鹏教授坦言,虽然大家都说大模型更偏工程化,但实际还有诸多科学挑战仍待解决,比如训练目标的设计、内存优化、自动化评测、大模型... 人工智能 2023-09-14 314 #邱锡鹏 #复旦 AI #大模型 #LIama
俄罗斯科技巨头 Yandex 开发 GPT 大模型,号称与 ChatGPT 抗衡“只是时间问题” Yandex搜索和广告技术业务部主管Dmitry Masyuk表示,YandexGPT在生成俄语内容时的表现已经能够“稳步超越”ChatGPT 3.5版本,甚至在许多情况下提供了优于ChatGPT 4... 人工智能 2023-09-14 309 #yandex #大模型 #生成式AI #YandexGPT #ChatGPT
重庆首发城市运行和治理大模型,基于阿里云通义技术 阿里云今日宣布,日前,为积极响应 2023 智博会“智汇八方,博采众长”号召,加快推进数字经济和智能产业高质量发展,重庆市大数据应用发展管理局、重庆市南岸区与数字重庆大数据应用发展有限公司、阿里云计算... 人工智能 2023-09-08 410 #大模型 #阿里云 #通义 #重庆
蚂蚁集团明日发布全栈布局、纯自研的 AI 大模型 第二届外滩大会今日在上海开幕。在外滩大会主论坛“科技、金融、产业,融合发展新未来”圆桌对话上,蚂蚁集团董事长兼 CEO 井贤栋透露了其 AI 大模型的消息。... 人工智能 2023-09-08 323 #井贤栋 #蚂蚁集团 #大模型 #蚂蚁 AI
百川智能发布 Baichuan 2 开源大模型,号称“文理兼备全面领先 LLaMA 2” 据百川智能官方介绍,Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6 万亿高质量多语言数据进行训练,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显... 人工智能 2023-09-08 330 #百川智能 #Baichuan #大模型 #LLaMA