
2022年下半年,生成式AI爆火的同时,硅谷著名风险资本a16z走访了数十家AI创业公司和大科技公司。其发现,创业公司转手就把80%-90%的早期融资款送给了云计算平台,以训练自己的模型。其估算,即便这些公司的产品成熟了,每年也得把10%-20%的营收送给云计算公司,相当于一笔“AI税”。
这带来了在云上提供模型能力和训练服务,把算力租给其他客户和创业公司的大市场。仅在国内,现在就至少有数十家创业公司和中小公司在自制复杂大语言模型,它们都得从云计算平台租GPU(Graphics Processing Unit,图形处理器)。据a16z测算,一个公司一年的AI运算开支只有超过5000万美元,才有足够的规模效应支撑自己批量采购GPU。
据了解,今年春节后,拥有云计算业务的中国各互联网大公司都向英伟达下了大单。字节今年向英伟达订购了超过10亿美元的GPU,另一家大公司的订单也至少超过10亿元人民币。
仅字节一家公司今年的订单可能已接近英伟达去年在中国销售的商用GPU总和。去年9月,美国政府发布对A100、H100(英伟达最新两代数据中心商用GPU)的出口限制时,英伟达曾回应称这可能影响去年四季度其在中国市场的4亿美元(约合28亿元人民币)潜在销售。以此推算,2022年全年英伟达数据中心GPU在中国的销售额约为100亿元人民币。
相比海外巨头,中国大科技公司采购GPU更为急迫。过去两年的降本增效中,一些云计算平台减少了GPU采购,储备不足。此外,谁也不敢保证,今天能买的高性能GPU,明天会不会就受到新的限制。
从砍单到加购,同时内部腾挪
今年初之前,中国大型科技公司对GPU的需求还不温不火。
GPU在中国大型互联网科技公司中主要有两个用途:一是对内支持业务和做一些前沿AI研究,二是把GPU放到云计算平台上对外售卖。
一名字节人士告诉《财经》记者,2020年6月OpenAI发布GPT-3后,字节就曾训练了一个数十亿参数的生成式语言大模型,当时主要使用的GPU是A100前代产品V100。由于参数规模有限,这个模型生成能力一般,字节当时看不到它的商业化可能性,“ROI(投资回报率)算不过来”,这次尝試不了了之。
阿里也曾在2018年-2019年积极采购GPU。一位阿里云人士称,当时阿里的采购量至少达到上万块规模,购买的型号主要是V100和英伟达更早前发布的T4。不过这批GPU中只有约十分之一给到了达摩院用作AI技术研发。2021年发布万亿参数大模型M6后,达摩院曾披露训练M6使用了480块V100。
阿里当时购买的GPU,更多给到了阿里云用于对外租赁。但包括阿里云在内,一批中国云计算公司都高估了中国市场的AI需求。一位科技投资人称,大模型热潮之前,国内主要云厂商上的GPU算力不是紧缺,而是愁卖,云厂商甚至得降价卖资源。去年阿里云先后降价六次,GPU租用价下降超两成。
在降本增效,追求“有质量的增长”与利润的背景下,据了解,阿里在2020年之后收缩了GPU采购规模,腾讯也在去年底砍单一批英伟达GPU。
然而没过多久后的2022年初,ChatGPT改变了所有人的看法,共识很快达成:大模型是不容错过的大机会。
各公司创始人亲自关注大模型进展:字节跳动创始人张一鸣开始看人工智能论文;阿里巴巴董事局主席张勇接手阿里云,在阿里云峰会发布阿里大模型进展时称,“所有行业、应用、软件、服务,都值得基于大模型能力重做一遍”。
一名字节人士称,过去在字节内部申请采购GPU时,要说明投入产出比、业务优先级和重要性。而现在大模型业务是公司战略级别新业务,暂时算不清ROI也必须投入。
研发自己的通用大模型只是第一步,各公司的更大目标是推出提供大模型能力的云服务,这是真正可以匹配投入的大市场。
微软的云服务Azure在中国云计算市场本没有太强存在感,入华十年来主要服务跨国公司的中国业务。但现在客户得排队等待,因为它是OpenAI商业化的唯一云代理商。
阿里在4月的云峰会上再次强调MaaS(模型即服务)是未来云计算趋势,在开放自研的通用基础模型“通义千问”测试之外,还发布了一系列帮助客户在云上训练、使用大模型的工具。不久后腾讯和字节火山引擎也先后发布自己的新版训练集群服务。腾讯称用新一代集群训练万亿参数的混元大模型,时间可被压缩到四天;字节称它们的新集群支持万卡级大模型训练,国内数十家做大模型的企业,多数已在使用火山引擎。
所有这些平台使用的要么是英伟达A100、H100GPU,要么是去年禁令后英伟达专门推出的减配版A800、H800,这两款处理器带宽分别是原版的约四分之三和约一半,避开了高性能GPU的限制标准。
围绕H800和A800,中国科技大公司开始了新一轮下单竞争。
一名云厂商人士称,字节、阿里等大公司主要是和英伟达原厂直接谈采购,代理商和二手市场难以满足它们的庞大需求。
英伟达会按目录价,根据采购规模谈一个折扣。据英伟达官网,A100售价为1万美元/块(约7.1万元人民币),H100售价为3.6万美元/块(约25.7万元人民币);据了解,A800和H800售价略低于原版。
中国公司能否抢到卡,更多是看商业关系,比如以往是不是英伟达的大客户。“你是和中国英伟达谈,还是去美国找老黄(黄仁勋,英伟达创始人、CEO)直接谈,都有差别。




