挑战垄断者,摆脱英伟达
作者 朱秋雨
发表于 2023年11月
2023年5月29日,中国台北,英伟达总裁兼首席执行官黄仁勋在展会上发表演讲

“这一定是很痛苦的……却是不得不做的事。”在2023中国计算机大会上,谈及国产AI算力是否应摆脱对国际的依赖,中科院计算所研究员崔慧敏说道。

在场的专家都点了头。

那是在10月末的秋日沈阳。就在10天前,美国商务部工业和安全局(BIS)宣布重磅规定—对中国升级芯片出口管制。

规则制定者之一,美国商务部负责出口管理的助理部长西亚·肯德勒曾明确放话:“中国已投入大量资源开发超级计算的能力,力争到2030年成为世界人工智能的领先者。”“我们的行动将保护美国的国家安全和外交政策利益,同时发出明确的信息,美国的技术领先地位关乎价值观和创新。”

于是,10月17日,BIS的禁售令,将上述信号再度传递给中国。这则最严芯片出口令将于30天后生效,涵括三大方面:

一是将向中国禁售高性能芯片的标准改为“性能密度”。这一标准将更多AI芯片列入禁止出口名单中,英伟达、AMD、英特尔的产品均在列。

二是扩大了另外40多个国家出口的许可要求,以规避高性能AI芯片从海外其他地区辗转到中国。

最后是将13家中国公司添加到“实体清单”。其中有两家国产GPU企业,壁仞科技、摩尔线程。进入实体清单的公司,未来不得在台积电等先进工厂生产芯片。

一纸新规让如火如荼的AI大模型元年气氛愈发紧张。AI芯片领域,全球格局已经是“一家独大”。花旗研究分析师在今年7月预计,英伟达占据了AI 芯片市场“至少 90%”的份额。

“脱钩”风云中,被“卡脖子”的国产芯片尽早突破英伟达,是现今中国业界的共识。用国家超算计天津中心首席科学家孟祥飞在上述大会的话说:“这不是一个可选项,而是一个必选项。”

问题是,有路吗?怎么走?

被禁以后

无论从什么角度来说,英伟达高端芯片被禁,对多数中国AI创业者而言,都像被浇了一盆冷水。

“现在拿到卡了就是大爷。”10月,一位不愿具名的清华大学计算机教授在私下交流时说道。

一切源于OpenAI率先开启的“暴力美学”—大模型需要至少千亿级参数历练才能涌现智能。成本、计算速度和节能等因素,都催促着慢人一步的中国AI公司,使用最先进的AI芯片。

如果按照部署位置分类,基于深度学习的AI芯片大致有两类:一是部署在边缘侧的芯片。也就是位于产品终端,比如,在一辆自动驾驶汽车里。

这些终端芯片基于训练好的模型进行实时推理、决策,强调实时性。腾讯、Meta推出的自研芯片,都是推理类型。

但當下更稀缺的,是技术门槛更高、部署在云端的芯片。它们的作用更基础—训练大模型,以期AI涌现出类似大学生的智能。

上海通信技术中心前CEO、著有《AI芯片:前沿技术与创新未来》的张臣雄告诉南风窗,自2014年深度学习算法在全球人工智能越加火热以后,美国厂商英伟达推出的GPU获得了巨大市场空间。

一切都是来自技术上的恰好契合:尽管深度学习算法拥有复杂的结构,但这些结构大部分的运算和处理都与一个东西有关—矩阵乘法。

恰好,英伟达此前用于渲染图像、游戏的GPU,尤其擅长矩阵和矩阵的乘法。张臣雄介绍,正是因为发现了GPU的这个特性,从此英伟达逐渐迭代产品,开发出多款适用于AI训练的芯片。

更重要的是,相比于通用型的芯片CPU(中央处理器),英伟达的GPU还完美契合了深度神经网络(DNN)并行计算的特性。不同于CPU按顺序进行计算,GPU有着大量并行架构的设计。这与DNN在训练和推理过程要进行大量独立的、同时进行的矩阵乘法的操作不谋而合。

据南风窗统计,截至2023年11月,明确对外称有训练AI大模型能力的中国芯片公司在个位数。

也因此,基于深度神经网络的大模型,中国公司对GPU的需求达到了顶峰。上海某信息科技公司生态合作副总监张迎告诉南风窗,从2023年上半年开始,英伟达高性能GPU已经在市面上极度短缺。他的公司早在6月订购了十几台英伟达H800。

“稀缺啊,半年了到现在还没拿到货。

本文刊登于《南风窗》2023年24期
龙源期刊网正版版权
更多文章来自
订阅