国产大模型的2025年,谁会掉队?
作者 赵卫卫
发表于 2025年1月
2024年7月,上海,2024WAIC世界人工智能大会登陆世博园区    图/视觉中国

ChatGPT上线两年了,大模型依然在你追我赶。

继上次挑起价格战之后,字节跳动旗下的火山引擎再次延续策略,发布了豆包视觉理解模型,主打在教育、旅游和电商三个主要场景的落地,价格上把每千tokens输入的价格打到了0.003元,比行业平均水平降低了85%,号称视觉AI进入了“厘时代”。

大洋彼岸,几天前OpenAI正式开放视频大模型Sora,但很快过高的需求就导致ChatGPT遭遇全球范围内的宕机,而苹果新版本落地,Siri也开始真正调用ChatGPT。作为有力的竞争对手,谷歌也发布了最新AI模型Gemini 2.0,多模态能力进一步升级,智能助手Astra可调用谷歌搜索和识图等应用来完成任务。

2024年年末,ChatGPT的周活跃用户突破了3亿人次,10亿是未来的目标,但成本的压力已经显现,因此它们推出了不同版本的付费模式。

而对中国市场的竞争来说,2024年的竞争分化已经非常明显。首先是大模型人才上的争夺,这一点从字节与阿里等大厂身上已经可以非常明显地感受到;其次是追赶速度加快,不论是通用模型和多模态大模型,技术路线有区别,但落地场景一个都不能少;最后则是大模型创业公司,它们要跟大厂同台竞技,就必须走上差异化的道路,而且已不断在做减法。

2025年,大模型市场依然背负着巨大的期望,不论快与慢,它们都要回答来自外界的关切:如何让用户发现我物有所值?

字节VS阿里:加速度之争

2023年,阿里与字节在大模型竞争策略上最明显的不同,就是投资覆盖的面积。阿里选择的是海投,投资了5家最有代表性的大模型创业公司,包括月之暗面、智谱AI、MiniMax、零一万物和百川智能;虽然字节一个都没有投,但亲自下场,布局从模型到应用的市场。

2024世界人工智能大会上的企业展台    图/视觉中国

到了2024年,在人才争夺上,字节和阿里打起了对垒。2024年年中,阿里通义千问大模型技术负责人周畅离职创业,到年末才爆出,周畅实际早已经加入字节跳动,负责AI大模型相关工作,而阿里方面也以违反竞业协议为由起诉周畅,进行索赔。

抢人才,只是字节跳动在大模型竞争最明显的动作之一。根据2024年9月发布的《2024大模型人才报告》,AI大模型领域人才竞争激烈,字节跳动成为新发大模型岗位量最多的企业;其次是小红书,超过了阿里、美团等互联网大厂。

除了加入字节大模型团队的周畅,原零一万物核心成员黄文灏、面壁智能核心成员秦禹嘉、谷歌原videopoet项目负责人蒋路等人都被字节跳动大模型团队招入麾下,向负责人朱文佳汇报工作。

阿里并非不注意人才密度的问题。2024年10月,阿里云创始人王坚在媒体采访中也提到了人才的问题,他举出的一个最明显的例子,就是对比谷歌和OpenAI。OpenAI有600多人,谷歌有几千人,而最后决定创新成败的还是人才的密度。因为OpenAI人才密度高,但谷歌人虽多却各自为战。

“人才密度加上科研的强度,创新加速度就出来了”,王坚当时认为,这个加速度才是科技创新最重要的东西,有加速度即使落后也能赶上,没有加速度即使原来领先,时间一长也会变得落后。

本文刊登于《财富生活》2025年1期
龙源期刊网正版版权
更多文章来自
订阅