为什么中国没有出现 ChatGPT?我们的差距在哪里?要投入多少资金才能与之抗衡?
“本质是专注和决心,是有没有做到 AI First。”小冰 CEO 李笛直言,从技术层面来讲,大模型的技术没有太多的秘密,中国人的技术不亚于欧美。在本土化实践技术、中文大模型等方面,中国甚至某些方面领先。
“AIGC(指利用人工智能技术来生成内容)背后的大模型是大资本的游戏,长期持续投入真的很贵。”资深人工智能研究专家田涛源告诉《后厂村 7 号》,在 ChatGPT 出现之前,较多企业不会选择把钱烧在一个未知的机会上。“GPT3.5 训练一次需要花费 300-460 万美金,还只是算力的成本,没算人才的成本,Open AI 一共 375 人左右,一年工资开支就要 2 亿美金,AI 算力开支 5 亿美元,需要雄厚的资本支撑。”
但 ChatGPT 的惊艳四座,AIGC 的技术质变,投射到广阔的中国互联网上,引燃了 AI 从业者的光荣与梦想、激情与野望,在喷薄、在跃动。
AI 创业者陈东记得,临近过年的寒夜,在北京的朋友家里,他们吃着开心果、瓜子,彻夜交流,一晚上的话题几乎都与 AIGC 和 ChatGPT 有关,虽然不少人对此还是半懂不懂,却富有热情。
一位投资人告诉记者,去年受大环境影响,大多 AI 创业团队生存堪忧,年底负责 AI 赛道的投资小组还在为如何向 LP 汇报苦恼。三个月而已,AIGC 已成为 2023 年最火爆的投资赛道,没有之一。当下这份带有传染性的热闹气氛,让他一扫 2022 年的垂头丧气。
在被 ChatGPT 惊艳的同时,国内业界也在思考:AIGC 的商业模式是什么?哪些方向存在更多机会?中国版 ChatGPT 的危与机?
最重要的是,哪些企业凭着自己的敏锐嗅觉和拼闯劲头,抓住这波技术红利,寻求命运的蜕变,能够脱颖而出引领下一个时代?
(图为张颀 AI 绘画作品,由受访者供图)中国 AIGC 生态初现:大厂搞基建,小厂做创新
当下,全世界互联网都刮起了一阵 ChatGPT 风。这款由 OpenAI 推出的全新聊天机器人模型,不仅可以回答人类的提问,承认自己的错误,还能作诗、编程甚至帮助大学生完成论文。它让马斯克感叹“好得吓人”,也代表 AIGC 向全世界喊出了“芝麻开门”。
在中国,围绕 AIGC 生长出的市场生态,已崭露头角。
“AIGC 并不是一个多么新鲜的概念。”陈东谈到,大厂很多 2C 应用里,已经有不少内容是 AI 生成的,甚至出现过广告对外宣传已经在大规模使用 AIGC 技术,至少两年前就有这个方向的创业团队出现,并得到了一线美元基金的青睐和投资。
在他看来,AIGC 不只是大厂的机会,也将新起很多创业公司。一类公司偏底层,在新场景中孕育大模型的突破,产研类似 DALL・E、GPT 等产生很多新模型;另外是在应用层中,也会出现很多新公司,包括生成文字、图像、视频、数字人等等。
在赶超 ChatGPT 的巨大诱惑下,大厂率先打响了追平基础大模型差距的“攻坚战”。
2 月 7 日,经百度确认,百度类 ChatGPT 项目名字确定为“文心一言”,英文名 ERNIE Bot,预计 3 月份完成内测,面向公众开放。除百度外,还有腾讯、阿里巴巴、快手、字节跳动、京东、网易、360、商汤、美图等大厂都在 AIGC 领域有所投入,加入到这场全球新一轮 AIGC 技术竞赛。
“好的人工智能大模型是非常费钱的。”在资深人工智能研究专家田涛源看来,这股预训练大模型的风潮之下,其实是一场拼数据、拼算力、拼财力的军备竞赛长跑。
他介绍,基础模型 GPT3.5 训练一次需要花费 300-460 万美金,还只是算力的成本,没算人才的成本,Open AI 一共 375 人左右,一年工资开支就要 2 亿美金,算力开支 5 亿美元。“这真是很贵,而且前面那么多年是没商业回报的,基础模型的参数又是持续优化的过程,随着商业化进展加速要不断进行训练,需要雄厚的资本支撑,确实是小公司用不起来。”
但对于基础大模型、应用大模型未来的商业价值,行业从业者都有共识、有期待。
“AIGC 生态最值得关注的就是大模型的建设能力,这将成为 AIGC 长期价值的重要增长点。”AI 创业者“web3 天空之城城主”激动地说,“这是用短期的投入换 10 年后千倍收益的事情。”
另一面,在细分行业中,AIGC 的造富速度同样让人们睁大眼睛。
去年 10 月 19 日,以文字生成为主的 AIGC 项目 Jasper.Ai 完成了 1.25 亿美元的 A 轮融资。完成融资后,凭借 15 亿美元的估值跻身 AIGC 赛道独角兽俱乐部。就在 Jasper.Ai 宣布融资的前一天,Stability AI 成功融得资金 1.01 亿美元,投后估值达 10 亿美元。
在 AIGC 的垂直技术场景中,按照模态区分,可以分为音频生成、文本生成、图像生成、视频生成等细分领域,均已出现中国企业的探索身影。
文字生成:小冰、Glow、清华九歌、彩云小梦、写作猫、澜舟科技、元语智能等。
图像生成:百度文心一格、盗梦师、TIAMAT、达利 AI、6pen、图宇宙、Artflow 等。
视频生成:抖音的剪映、快手的云剪、影谱科技、蓝标分身、商汤智影、诗云科技的 Movio 等。
音频生成:网易天音、StarX MusicX Lab、DeepMusic 等。
Game AI:rct.Ai、网易伏羲等。
数字人:启元世界、倒映有声等。
(网易科技梳理)
2023 年 1 月,启元世界战略总监王思捷接到了数通来自投资圈和产业圈朋友的电话。两年前,他所在的公司开始大力投入数字人和 game AI 的产研,朋友们大多在问,行业环境怎么样,变现能力如何。挂断后,王思捷意识到有人大概会有下一步动作,“感觉已经动心了。”
从独角兽到大厂,从使用者到投资人,从业界到学术界,AIGC 在应用层的创新引发了广泛的关注。
有数据显示,在用户增长数据方面,TIAMAT 内测的用户为 2 万人,盗梦师日增 5 万,上线两个月已积累 50 万用户。诗云科技合伙人梁望也向记者透露,旗下视频生成产品 Movio 上线不到一年时间,已在海外市场获得了不错的用户增长数字。
资本涌入、互联网巨头纷纷布局的背后是 AIGC 巨大的经济价值和市场规模。
Gartner 预测称,到 2026 年,全球 30% 的企业机构将拥有用于数字人和元宇宙的产品与服务。麦肯锡则预测,到 2030 年全球元宇宙相关支出或达 5 万亿美元。更值得期待是,AIGC 正在逐步探索性地进入真实工业生产链条,应用到营销、游戏、代码、生命科学等多个领域。
尤其是一级市场,投资人的脉搏正在变快。
明势资本合伙人夏令直言,2021 年年底他就和同事在梳理 AIGC 领域的机会,并且做了投资布局。AIGC 让他感到兴奋的有三点:一是,用户在环、端到端数据驱动模型的上限极高,模型迭代 + 高质量反馈能带来持续效果提升;二是,以抖音、小红书为代表的内容制作再分发的逻辑有可能变为用户与 AI 系统共同创造个性化内容的逻辑;三是,新一代的 AI 技术范式将有机会让人类脑力劳动真正商品化。
“下一个时代已经开始。”
去年底,知春资本董事总经理谢梦晖就观察到了这波创业的列车再一次提速。一个侧面反映,“我们之前投资的相关领域被投企业,尤其是基于 ChatGPT 模型进行商业化衍生的公司,开始频繁受邀参加各种技术和投资论坛。”
令他感到惊喜的是,这轮技术的迭代将推动创造商业的新增量。“在新的生产力基础上,现有的生产关系必然重构,对应的经济体系、组织模式必然会发生变革,创造力的估值将会呈指数级提升。”
AIGC 的商业模式是什么?
生于 1988 年的创业者陈东意识到自己正身处历史之中,连续许多天大厂宣布入局 chatGPT 的消息席卷着他的注意力,创业者的朋友圈就像创投世界的温度计,“之前搞元宇宙、web3 甚至 NFT 的都要搞 AIGC”。他和朋友们感叹太疯狂了,“像王慧文这种大佬,在朋友圈发布人工智能入局宣言,说 5000 万美元,带资入组,不在意岗位、薪资和 title,求组队。”
虽然陈东目前还没找到明确的方向,但已经和投资人喝上了咖啡,“他们其实也想更了解这个行业,尤其是如何商业化。”
自 AI 绘画工具 StableDiffusion 开源以来,国内大量主打 AI 绘画的网站和 App 如雨后春笋般涌来。AI 画师张颀作为 AI 绘画工具重度使用者,一些平台内测阶段就会主动找上门,让他提看法,找 Bug。“有的甚至前端的开发人员直接过来问,要如何调整才能提升大家的付费意愿?”
(图为张颀 AI 绘画作品,由受访者供图)产业圈和投资圈对于 AIGC,仍有一串真正严肃、令人如鲠在喉的问题:AIGC 的商业模式是什么?在中国像 open AI 这样的公司在哪里?如何做成一个产品,既要普惠化,又要足够深,足够广?
借鉴美国的商业化经验,夏令大致将 AIGC 领域分为三类商业模式:一类是 OpenAI 这种专注于做大模型的公司,提供 API,做细分场景应用的公司需要去调用它的 API,按 API 去付费;第二类公司是既做大模型,又直接做垂直一体化应用的公司,比如在 AI 生成图像很火的公司 Midjourney,第三类公司是调用第一类公司的大模型 API,基于对细分场景的深刻理解,重点开发具体场景的 AI 应用,比如 Jasper 这样的公司。
但对于像 OpenAI 这种提供 API 的商业模式,在中国能否真正 work,还是个问号。
田涛源讲,这个方向不仅在研发阶段要承担巨大的人力成本、算力开支压力,即便真的推出效果类似 ChatGPT 的大模型,数据成本、算法调优、AI 伦理优化依然居高不下。“目前 ChatGPT 每回答一个问题,成本至少要一美分,以这样的方式去做商业变现,面临着高昂的成本、海量的行业优化需求、多条科技战略路径决策选择。”
同时,ChatGPT 类似第一代 iPhone,上面尚没有成功的爆款 App(例如愤怒的小鸟),它离稳定性的商业服务还存在距离,没有跨过工业红线。在他看来,当下还处于从实验室基础技术转向产业界爆款应用服务的过程中,处于很早期。“但至少让大家看到了基础模型巨大的跨领域服务能力,找到了通用人工智能的一条可能成功的路。”
与此同时,在国内真正能做 AI 大模型的公司其实是极少的。
夏令观察,但凡能做底层的模型,不管是去做语言大模型的,还是去做强化学习的,只要以技术见长,以工程化产品化的思维做底层模型的公司,融资都非常不错,过去一两年 VC 都要抢着投进去。“可能资本的溢价没有像美国那么夸张,但一两年时间做到 10 亿美金估值的公司还是有一些的。”
有投资人向记者证实,目前很多创业者正在入局垂直场景,解决细分的需求,尤其是游戏 AI 和数字人生成这两条综合性的 AIGC 场景,已经出现趋于成熟的商业化范式。
王思捷和启元世界团队此刻正在经历创业以来最繁忙的日子:由于入局较早,从算法到工程整个一套的体系积累下来的能力,已经自建出百亿参数的 game AI 和数字人 AI 垂类大模型。风口降临后,有顶级游戏制作人已经主动上门寻求合作。
他引以为傲的是,这套垂类模型的训练和推理成本可以做到比 Open AI 同参数规模的模型低一个量级。在王思捷看来,先构建更小的垂类模型(比如百亿参数、十亿参数),让数据飞轮和模型训练能够很好结合,垂类模型在某些领域可能比 open AI 的效果更好成本更低。“这种想象能力是在中国更能跑通的。”
小冰 CEO 李笛则直言 AIGC 商业回报赛道最大的是数字人,“它的客单价明显会更高,我们做过终端内容的生成,感觉这是个菜市场般的内容市场,单价非常低,直到我们将 AI 生成能力捆绑到数字人身上,平均客单价迅速从 20 万提高到了 300 万,当然你的成品质量要足够高。”
但对于只懂用 API 调用生成内容的创业团队,参与本次采访的受访者大多表示,“价值有限。”
李笛试图放出一个警惕信号,奉劝想要进入 AIGC 赛道的创业者,要谨慎使用大厂提供的可调用接口,尽可能自建垂类模型。
“API 调用的商业模式挣不到钱,所以即便是为了发展,大厂也一定会跳进去,去做生态链上面其他生态类企业的事情,首当其冲就是直截了当应用他们的技术来提供服务的人。”他判断最终的结果,“你要做起来一定会被吃掉,骨头都不剩。”
中美差距:不在技术,在专注
在被 ChatGPT 惊艳的同时,国内业界也在反思:为什么中国没有出现 ChatGPT?
事实上,此前不乏有国内公司雄心勃勃想登上中文版 ChatGPT 的“王座”。但在可能的未来和确凿的现实面前,在巨额投入和业绩报表的冲突面前,选择了犹豫不前。
“大模型的技术没有太多的秘密。”李笛直言,在 ChatGPT 出现前,小冰从 2017 年就开始做 AIGC 相关的东西,从技术层面来讲,中国人的技术不亚于欧美。在本土化实践技术、中文大模型等方面,中国甚至某些方面领先。
文心一格相关负责人也告诉记者,和海外的同类型产品相比,在跨模态生成能力、中文知识与理解,以及绘图效率等方面,其实公司在技术层面均存在着优势。他举例,“中文知识与理解方面,文心一格对中文文本、文化和风格就能有更好的理解与刻画能力。”
事实上,国内,一群最勇敢、怀抱最狂野梦想的年轻创业者,已经带着自己的 AI 生成产品挑战海外市场,与世界一流的上市公司对标产品能力。
“我们现在主要的产品叫 Movio,是一款 AI 视频创作工具,主要面向全球市场,从欧美出发。”诗云科技合伙人梁望向记者介绍选择出海的原因,“一是欧美地区对于 SaaS 的接受度、付费意愿和市场体量高很多,二是他们的期待和标准也会高很多,就像参与 SaaS 领域世界上最顶级的赛事,我们有意选择最高标准的市场,接受最严格的用户的眼光,以此证明中国团队也能做出全球领先的 SaaS 产品。”
“AIGC 这件事要真正落地,门槛不仅仅是技术水平,更重要的是从 AI 到用户到数据,再到产品体验能够循环起来的一个飞轮。”从目前拿到手的海外用户反馈,他判断,“在这个方向上,我们现在技术和产品体验上,都是比较领先的。
对比海内外的团队,梁望最大的感受是大家对于创新的理解和投入度存在差异。例如,面对那些可能短期甚至中期内都看不到回报的创新,团队是否仍然拥有无论如何都要去做出来的精神和决心。
作为企业的一把手,李笛也深刻认知到中国和北美的商业和科技环境的不一样,国内大多企业没有那么多的钱会烧在一个未知的预测上。“要花很多的钱,要花很多时间,短期内难有商业价值,谁也不知道这个是不是可行。”
“本质是专注和决心,是有没有做到 AI First。”李笛直言,好几年前看到 Open AI,他们做到了全情投入,这也是唯一的不同,Open AI 花了足够的时间和精力在赌,敢于相信一个暴力出奇迹的大模型,但他们那个赌小冰确实不敢赌,“创业生死一线间,某种意义上,如果 Open AI 不推出 Chat GPT,他们今天可能很堪忧了。”
田涛源看来,这件事给大家一个启发:我们对人工智能硬件(例如芯片)非常重视,但是人工智能的基础软件(例如大模型、训练框架、大数据工具链),是不是长期投入不足、没有足够重视?有没有决心进行长期的基础研发投入?
中国投资与产业界更在乎短期商业回报上的表现,即快钱。“在中国是大家看到哪个技术到了商业价值转化的临界点,所有人一拥而上,对许多大型科技或实体行业龙头企业来说,AI 基础科研重视程度不足,缺乏大模型自研能力和战略定力,大家以快速产出的应用为导向,而技术算法的研发必须要很长时间的积累。”田涛源讲。
但一些极擅长工程化的中国 AI 公司入场,也必将搅动全球 AIGC 市场。
夏令讲中国优秀的 AI 初创公司拥有非常明确的一点优势,就是具备很强的工程化能力,搭建一个相比 openAI 成本更低、迭代效率更高、更满足明确优化目标要求的模型是可以实现的。
同时,中国整个应用场景具备足够的丰富性。“我们这么大的人口基数,产业数字化基础也已经初步具备,中国在高质量反馈数量上有优势,而这对新一代 AI 模型格外重要。我们看重的 AIGC 公司要有比较好的工程化能力,对中国实际的商业场景有自己独到认知,我们认为只有这样的公司最有机会能够跑出来。”夏令讲。
中国版 ChatGPT 的危与机
随着 ChatGPT 爆火,这一旧金山诞生的技术引爆了全球人工智能产业,AI 公司近乎全面入局,经济链条的最上游资本市场也出现了震荡,预示变革的信号弹一枚接一枚地炸响。
(图为张颀 AI 绘画作品,由受访者供图)“中国一定要有自己的 GPT-4,即基础模型(大模型)。”
田涛源强调,“中国的科技创业团队应有危机感。”ChatGPT 也好,基础模型也好,越多的开发者、越多样化的高质量数据、使用场景,对基础模型的反馈和优化就是越有价值。“谁先去做强化学习,谁就具备先发优势,这对于我们是一个很大动力和压力。”
蓝驰创投肯定地告诉记者,内容本身是非常区域化、地缘化的,也和用户数据息息相关,所以更高规格的 AIGC,应该要对当地的文化有深度理解,本身中国市场足够大,相信针对中国市场通过 AI 生产内容,将有巨大的机会。
而在机会的另一面,是所有 ChatGPT 面临的最大门槛 ——“安全和合规”。
2016 年,微软就做出了聊天机器人,可以实时地通过用户反馈,并修改自己的回答,但一经发布后,24 小时就被教成了种族主义者,很快就被下架了。“我们的实验室也有自己的对话机器人,过去这个是不敢放出来的。”一位头部 AI 公司创始人告诉《后厂村 7 号》栏目。
谈到具体落地,资深人工智能研究者田涛源提出:“OpenAI 官方在 2020 年 7 月发布的《Language Models are Few-Shot Learners》报告中对提出了 ChatGPT 背后语言大模型的能力边界与挑战提醒:
1、表达问题:语义重复,长篇幅段落中失去连贯性、自相矛盾,偶尔不符合逻辑
2、缺少物理常识:GPT-3 很难回答“如果我把奶酪放进冰箱,它会融化吗?”
3、训练效率差与世界模型:GPT-3 与人类语言训练效率存在显著差距,但 GPT-3 在预训练期间学习的文本规模远大于人类一生中看到的文本,以物理世界中额外信息为基础、算法改进都可能提升效率。
4、不确定性:GPT-3 的少样本学习存在不确定性、模糊性,未来在准确理解少样本学习原理的基础上,能在模型推理时“真正从头开始”学习新任务。(不清楚人类“从零学习”是否会受以往知识的影响)
5、大模型适用性不好:不方便进行推理,实用性不好,大模型蒸馏到可管理的大小,GPT-3 等大模型包含广泛的技能,但在特定任务中并不需要,原则上激进的蒸馏“瘦身”是可能的方法,但在对千亿参数的大模型上还没有过尝试,可能会遇到“决策不易解释”、 “输入的预测不易校准”、 “训练数据的偏差”(数据偏见带来模型偏见,社会伦理影响)。”
“我看到像 Open AI 的负责人现在也跳出来,主动地说希望被监管。”
在上述 AI 头部企业创始人看来,这种大模型的最终落地,必然要接受非常严格监管。“如果放任发展,过十年它能让美国那一代学生的教育水平大幅度下滑。”
在他看来,ChatGPT 真正在 C 端出圈,离不开想要借此抄作业的学生,背后涉及的是 AI 伦理问题。“在美国,10 个学生有 9 个过去几个月迅速知道了 ChatGPT,并通过它写作业上交,这是它会火爆的一个重要的推手,它解决了实际问题,但是这个解决问题的方法是不正确的。”
他对资本市场所谓的天气预报不感兴趣。这段时间,不乏有投资人找过来,提议去做 ChatGPT 类似的大模型,但他没有接受这根橄榄枝。“不是特别爱抢这种风头,我是不会推出一个让学生抄作业的东西,不管赚再多的钱。”
他希望,选择去做 ChatGPT 类似应用的同行,能够更多考虑 AI 伦理的自律问题,提前预估学生拿到它会做什么?被迅速铺开怎么办?“尽力做好安全和合规吧,让它 last for long,能够持续的存在。”
谈到安全和合规问题,百度文心一格相关负责人向记者表示,希望可以厘清各方合规权责,兼顾内容安全和业务创新发展,建议基于不同的细分应用场景和产品模式特点,分类分级制定可落地规则,未来可以鼓励行业领先企业主动分享创新合规实践经验,推动形成行业标准,打造可借鉴的产业合规实践方案。
业内有共识,对于 ChatGPT 的讨论,未来几年都不会停歇。
但明确的是,ChatGPT 以及其对应的大模型发展,就是未来的一个技术革命,可能还没有到达大家想象的那种令人恐慌的程度,但确实会让未来几年的创新得以释放。
在田涛源看来,大家现在执着于去搞 ChatGPT,放眼整个人工智能未来,只是其向前迈进的一块垫脚石。“再往上走,还有更多巨大的机会。”
在他的想像中,AI 可以推动人类对航天的探索、对新能源的探索、对新材料的重大发现,随着它对物理规律认识的越透彻,对人、对环境、对生命体的认知越来越深刻,能够逼近一些人类认知范围以外的未知知识,甚至具备新知的可能性。
在这场或许比移动互联网更加颠覆的大变革里,对于中国 AI 企业,距离终点仍有漫长的道路要寻找、摸索、攀登。
(应受访者要求 AI 创业者陈东为化名)