
“大模型的投资其实在ChatGPT发布前就已经结束了。”云启资本合伙人陈昱在见完公司一位出资者(LP)后对《第一财经》杂志说。
说这句话的时候,陈昱显得轻松,他所在的机构就是那个精准踩中游戏节奏的幸运儿。2021年,云启资本参与了MiniMax的天使轮融资,后者现在估值约12亿美元,为目前中国估值最高的生成式AI独角兽,由来自商汤的通用智能技术前负责人闫俊杰创立。估值紧随MiniMax的是智谱AI、百川智能和零一万物,目前资本市场对这3家初创公司的估值都是10亿美元,3家公司的创始团队分别来自清华大学、搜狗和创新工场。
不是所有投资人都像陈昱这么幸运,在生成式AI浪潮兴起前夜,不早也不晚,遇到了从商汤出来的创业者。线性资本也曾在ChatGPT发布后寻找过模型层的投资标的,最终都因价格过高而放弃。这家投资机构目前把主要投资放到了应用层。
模型层和应用层是生成式AI领域逐渐形成的上下游。这个概念最初由OpenAI在2022年年底提出,当时,这家公司发布了著名的聊天机器人ChatGPT,让用户可以像微信聊天一样与AI对话,向AI请教问题或者干脆将它当作倾诉对象。不过,OpenAI真正想向市场推销的并不是这个聊天机器人,而是它背后的模型—最初是GPT-3.5,2023年3月进化到GPT-4。在OpenAI构想的商业模式里,OpenAI提供智力(即模型),其他公司基于这个智力平台创造上层应用,从而将模型本身变成一个基座、一个平台,以及一个超级AI。最终,应用层公司从它们俘获的用户那里收取使用费或获得广告费,而OpenAI这样的模型公司通过向应用层公司收取使用模型的订阅费。
这种分工很容易理解,但在ChatGPT发布后的那半年(也就是2023年上半年),它并不怎么被创业者接受,因为他们发现:这跟互联网和移动互联网时代的创业不同,互联网作为一种底层技术不会冲到前台把应用层的活也干了,它只是一种通信技术;生成式AI就不同了,随着模型越来越强大,这个智力怪兽会不断吃掉原本属于应用层的创业项目,就像模型周边有一个“杀伤区”,当模型的能力变强,杀伤区就会变大。
Jasper就是前车之鉴,这家公司是2022年的明星AI公司,它基于OpenAI的GPT-3模型构建了一个AI文本生成工具,主要向传媒营销从业者提供创意内容生成服务。发现这个需求旺盛的细分市场后,Jasper2022年的年度经常性收入(ARR)相比2021年翻了一番,达到8000万美元,并且公司成立18个月后就获得了15亿美元估值。然而这个增长神话随着ChatGPT的推出戛然而止。2023年9月有媒体爆出,Jasper已经降低收入预期并开始裁员,两位创始人也相继辞职。
然而经过2023年的博弈,到了ChatGPT发布一周年这个节点,这种模型层和应用层的分工又转而被市场接受—推动这种转变的不是技术本身,而是投资技术的人。
模型层:资本游戏残酷,时机更残酷
陈昱眼中,在中国,除了MiniMax与智谱,其他在大模型层面的创业公司几乎已经被判了“死刑”,尤其是那些ChatGPT爆红之后才匆忙组建的公司,例如王小川的百川智能、岂凡超的深言科技,以及王慧文的光年之外。
他给出的理由很简单,大模型是极度烧钱的生意,技术巨头可以靠其他业务输血坚持,创业公司则必须融到足够多的钱才有可能活下来,而每个市场上的钱能养活的大模型创业公司,很难超过两个。
事实的确如此。从成本看,训练一个大模型需要支付高昂的研发人员工资(平均年薪接近百万美元),购买并清洗训练所需的数据(越来越稀缺),承担每天数十万美元的电费以及更为昂贵的算力费用。以OpenAI训练GPT-4为例,上述开销算下来大约是6700万美元—这还仅仅是训练的费用。当GPT-4这样的大模型训练完毕,如果想让用户使用它,例如让ChatGPT为程序员生成代码,专业的表述就是用GPT-4做推理,OpenAI还需要支付算力成本,据估算这项成本超过100万美元/天。“想要做大模型创业,没有上亿美元根本上不了牌桌。”陈昱说。
此外,风险投资(VC)机构也不愿意在一个细分市场中押注两个以上的项目,因为“再多的话,资本就无法退出”。团购市场中的点评与美团、外卖市场中的美团与饿了么、打车市场中的滴滴和快的……这些行业都经历过“百团大战”,最后能让资本安全退出的只有“两家公司”模式,市场已一再验证过这一点。
硅谷AI投资地图(模型篇)

硅谷AI投资地图(应用篇)

百川智能的投资者名单似乎也在说明资本市场的态度,其中只出现了阿里巴巴、腾讯、小米等大公司型的投资者,而没有一家VC机构在列。
市场之所以“选中”MiniMax和智谱,原因之一是这两家公司都创立得够早,但也不是过早。它们都是在ChatGPT发布前一两年创立的,其中MiniMax创立于2021年年底,智谱再早一点,创立于2019年。根据智谱CEO张鹏和投资了MiniMax的陈昱对《第一财经》杂志的说法,智谱和MiniMax都是在看到了OpenAI发布的GPT-3后认识到市场机遇的,那时是2020年,比ChatGPT的发布早两年。
时机对于投资者来说同样残酷。“投资的窗口期很短,最多6个月,像是智谱、MiniMax这些公司早在大家还没发现之前就已经被投掉了。

