“擂响战鼓”的中国AI大模型
作者 孙冰
发表于 2023年6月

谁是当下中国乃至全球的“科技顶流”?AI大模型几乎毫无争议。

5月28日,科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,中国研发的大模型数量排名全球第二,仅次于美国,目前中国10亿参数规模以上的大模型已发布79个。而从大模型区域分布来看,中国已有14个地区在开展大模型研发,其中,北京、广东、浙江、上海处于第一梯队,数量最多的北京有38个大模型,第二位的廣东有20个。

在全球大模型竞赛中,中国科学院院士、中国计算机学会开源发展委员会主任王怀民表示,过去5年世界上参数量超过百亿的大模型大约有45个,其中有32个出现在美国,9个出现在中国,4个出现在欧洲。

但是,发展迅猛、一路“狂飙”的中国AI大模型们,仍然需要一些冷静的思考。

大模型“智能涌现”令人兴奋,AI能力开始不可预测

人工智能技术已经发展了很多年,为什么大模型出现后,学界、产业界乃至社会大众会如此兴奋甚至害怕呢?北京智源人工智能研究院院长黄铁军教授告诉《中国经济周刊》记者,AI之前更像是人类的助手,根据人类的指令做着人类能够确定结果的工作,比如你设计AI打开电灯,AI就只会打开电灯。

“但是,大模型之所以现在如此受关注,是因为当人工智能的参数量达到了百亿级别之后,出现了拐点或者说突变,人工智能的能力开始不可预测了,就是所谓的‘智能涌现’现象,人工智能一些没有被预期到的能力开始出现,这种不可预知让大家都很兴奋。”黄铁军说。

黄铁军介绍,这一波人工智能浪潮的核心任务就是训练模型,所谓模型,在人工智能领域的意思很明确,就是一个神经网络,而神经网络并没有什么特别的地方,我们人脑就是个神经网络。

“但人脑是一个很庞大的神经网络,大约有800多亿个神经元通过100万亿个神经突触进行连接,所以人脑的能力非常强。对比一下,最接近人类的猩猩,其脑部神经元的数量和连接的数量差不多是人脑的1/3,猴子是人类的1/10,而一条虫子大概有300多个神经元,但其实也可以有很多生命活动了。”黄铁军解释说。

当然,目前人工智能模型的神经网络比人脑要简单很多。但是,随着数据规模的增长和算力的增加,模型的参数量也在不断增加,能力也就不断随之提高,于是就有了“大模型”,即参数量巨大的神经网络,当然其智能程度就更高。

大模型是有史以来最大平台革命,将10倍于移动互联网

“AI大模型是绝对不能错过的历史机遇。因为这将是有史以来最大的平台革命,它将比Windows、安卓要大10倍甚至更多,它会让每个应用改写,会重构人类的工作,会让有创意的那些人的聪明才智被放大10倍或者更多。”创新工场董事长兼CEO李开复说。

李开复还表示,他非常认同美国著名VC机构投资人安德里森·霍罗维兹(Andreessen Horowitz)的观点:大模型的市场未来到底多大很难把握,它最小将是所有软件,最大可能将代表着人类所有的努力。

“人类历史上可能也就只有三四次这样的机会。大模型赛道是未来的兵家必争之地,因此,自主创新将是中国企业的必经之路和重大责任。”李开复告诉《中国经济周刊》记者。

李开复已经投身人工智能超过40年,他戏称自己是“投资人中最懂AI的,AI科学家中最懂投资的”。他从投资和产业发展的角度认为,随着大模型的崛起,人工智能的发展已经从AI 1.0时代进入AI 2.0时代。

李开复认为,在AI 1.0时代,单领域的数据集、数据集和模型各成孤岛,且数据标记工作量和成本非常可观;但AI 2.0时代大模型的出现可以解决这些瓶颈障碍,人们用超级巨量数据训练具有跨领域知识的单一大模型,微调后就可以执行五花八门的任务。

本文刊登于《中国经济周刊》2023年11期
龙源期刊网正版版权
更多文章来自
订阅