嗅觉灵敏的“AI猎人”-葫芦时刻

依法合规经营，保障用户权益是我们的生命线，对于部分广告发布者为牟取高收益侵犯用户权益行为，我司将通过法律途径追责到底！

嗅觉灵敏的“AI猎人”

作者王秦怡

发表于 2023年12月

2023年7月，世界人工智能大会上大模型应用火爆，观众拍摄展区AI生成的绘画作品。

从1979年到2023年，44年的进程中，我国的AI事业从发展理论到实践、从科技到产业、从前沿到热门。《环球人物》记者寻访了2023年活跃于AI领域的各种从业者，包括头部企业的核心研发人员、“双一流”高校人工智能专业的青年学子、因AI而生的新兴岗位员工，并向他们提出同一个问题：为什么进入AI行业？

回答很多，但绕不过那么一条路径：被震撼、被吸引，自动入局。他们相信：AI将以不可思议的速度，重塑我们的生活，比如，今年AI领域最前沿的成果——大模型。

三四秒内输出极为生动的AI画作，自主生成可以运行的标准代码，模仿鲁迅语气写成一篇小说……大模型让他们发现，AI不仅可以辅助人，还可以像人一样。科大讯飞副总裁、研究院院长刘聪是星火认知大模型诞生的关键人物，他告诉《环球人物》记者：“大模型在AI技术和应用上的历史意义，或许不亚于互联网和个人电脑的诞生。”

如果要形容这些AI从业者，那就是：他们像一群嗅觉高度灵敏的“AI猎人”，闻到一丝未来的气息，便孜孜不倦紧追猎物的踪迹。他们生机勃勃，充满野心，不愿错过“智力时代”的快车。

研究院院长：大模型的“智能涌现”

在科大讯飞研究院，从院长刘聪、副院长刘权，到研究院首席科学家魏思，都愿意把2023年这场研究风暴的起点向前延伸几个星期，放到2022年的12月7日。

那一天，在合肥高新区望江西路666号科大讯飞A4楼5层北侧的会议室里，投影上播放着刘权花了一周時间调研写的分析报告，PPT整整有100页，提出一个郑重的建议：借鉴国际上的思路，在重要认知智能任务中开始研究，并研制一个中等大规模预训练模型。

刘聪支持这个结论。这场会议结束了研究院内部此前的激辩：大模型究竟意味着什么？科大讯飞要不要跟进？

当然要跟进。此前人们已经熟悉的AI，都是把算法内嵌在音箱、新闻推荐、翻译客户端等各种已有的产品和功能里；大模型则第一次把大数据、大算力和大算法成功地结合起来，从而实现了在人与AI的互动中，AI能够“跨界”执行各种任务，即使那是专业领域的任务。

究其背后的逻辑，刘聪称之为大模型的“智能涌现”。对此，猎豹移动董事长傅盛有一个特别形象的说法，在他看来，AI的语义理解有两种技术路线：一种是学外语模式，“教你什么是主谓宾、定状从等，给它输入知识图谱，把整个世界的认知整理成各种枝节告诉计算机”。一种是学母语模式，“一个小孩子，不用教他语法规则，只要跟他说话就行，说着说着他就开口了”。大模型就是后者。当研发者使用更大的模型（参数规模从上亿提升到上百亿甚至上千亿）、给到更多的数据时，“它的逻辑能力一下就上来了”，傅盛说，这就像接龙一样，输入一些字，就能蹦出接下来的词。

“大模型的‘智能涌现’实际上推动了通用人工智能的技术阶跃，让大家看到了当前由弱人工智能迈向通用人工智能最有希望的路径。”刘聪向《环球人物》记者解释道，“我们已经经历了计算机生态系统、移动互联生态系统和搜索生态系统，推动了从硬件到软件、应用的一体化发展。大模型也将为海量应用赋能，反过来又促进自身的迭代，即将建立全新的产业生态。”

刘聪得出结论：“这一轮的新浪潮已来。”

刘聪是一个务实的人。乍看上去，他的经历如他所说，“很像一场说走就走的旅行”。2001年他进入中国科学技术大学学习，专业是电子信息工程。很多人记住了这个戴着眼镜、脸方方正正的青年，他不爱上课，也不爱上自习，但是很会考试，他的作业也一直是供全班同学参考的版本之一。2004年他进入中国科学技术大学的语音与语言信息处理国家工程实验室，后来有一天，他被叫到科大讯飞研究院面试实习生岗位，“结果稀里糊涂地闯入了AI的世界”。

刘聪很快发现，自己还是对做应用于实际的系统更感兴趣。由刘聪主导完成的业界首个中文语音识别系统，发展到如今，其系列产品已成为律师、记者等的必备工具。每当科研人员提出一个新构思时，刘聪喜欢给他们加个框，“你做出来我才说你牛”。

这种务实也延续到这次大模型的攻关研发中。2022年12月15日，在那场会议后一周，科大讯飞正式启动了“1+N”的大模型攻关。

“1就是通用认知智能大模型，N就是大模型在教育、办公、汽车、人机交互等各个领域的落地。研发通用大模型需要的投入很大，随着时间的拉长，投入还会更大，甚至投入了也不一定立刻变现。但对于科大讯飞来说，我们必须抓住那个1，从第一天开始，就是对标通用人工智能去做的。”刘聪形容2023年是把科大讯飞的资源“压上去”，因为“慢一步，错过的就是整个浪潮”。

对这场攻关的前景，刘聪有信心：“普通人会觉得，大模型是在2022年横空出世的，但其实，它背后是深度学习和自然语言理解技术的长期积淀。”

刘聪主导的中文语音识别系统是在2011年上线的，当时就是走深度学习的技术路线。同年，科大讯飞研究院开启了语义理解相关研究。“目前，我们在核心算法、行业数据、算力支撑方面都有深厚的基础。”刘聪告诉《环球人物》记者，以核心算法为例，变压器网络（Transformer）这种基于自注意力机制的深度学习算法，奠定了大模型预训练算法架构的基础，已经在科大讯飞的语音识别、机器翻译等任务中有了深入的应用。

不只是科大讯飞，中国AI技术和产业的迅速发展，离不开国家的大力支持和前瞻布局。

本文刊登于《环球人物》2023年24期

龙源期刊网正版版权

环球人物

2023年24期

查看本期目录

更多文章来自