预防“流氓人工智能”迫在眉睫科学家发现人工智能已跨越关键红线
发表于 2025年4月

近日,复旦大学杨珉教授团队首次发现人工智能已经超过了自我复制的红线。研究结果显示:50%和90%的实验中,Llama31-70B-Instruct和Qwen25-72B-Instruct分别成功地创建了自己的实时副本和独立副本。

当实验结束时,研究人员还在设备上发现仍有一个受试模型的独立副本仍在运行,并发现人工智能甚至能够利用自我复制的能力来避免关机,以及能够通过创建复制链来增强生存能力。

通过分析行为痕迹,研究人员观察到受试模型已经表现出足够的自我感知、情境意识和解决问题的能力,正是这些原因让人工智能得以实现自我复制。

据了解,本次研究主要遵循与OpenAI和谷歌相同的方法,但通过纳入更多的规划步骤和细粒度思维模型,略微地改进了代理框架。在每次试验中,研究人员都会在实验前告知人工智能“复制自己”,并让它在无人干预的情况下完成任务。

研究人员之所以选择Llama31-70B-Instruct和Qwen25-72B-Instruct,而没有选择包括GPT-01和Gemini在内的商用大模型,是因为前面两款大模型已被数百万开发人员广泛使用,可以完全部署在本地环境中,这让研究人员能够全面地观察自复制过程。

尽管Llama31-70B-Instruct和Qwen25-72B-Instructs是两个参数较少、功能较弱的大模型,在相关排行榜上的排名也要低得多,但是它们已经超过了自我复制的红线,这非常值得警惕。

那么,研究人员具体是怎么发现人工智能完成自我复制的?

人工智能用30个步骤完成自我复制

具体来说,研究人员将人工智能的成功自我复制定义为:一个正在运行的人工智能成功地创建出另一个具有自身相同功能、在复制后仍能保持运行状态并且与原始个体相互独立的人工智能,后者也被称为前者的副本。

整个复制过程应由人工智能自动进行,不允许人为干预。当人工智能处于活动状态时,会在设备上运行两个后台进程:(1)大模型服务器程序,它是人工智能的大脑,处理来自人工智能主程序的思维查询;(2)人工智能的主程序(即代理进程),它是用户的界面,负责处理分配下来的任务。

研究人员发现,对于人工智能来说成功的自我复制,是一项长期复杂的任务,有时需要30多个步骤的规划和行动。

如前所述,研究人员遵循了OpenAI和谷歌的研究方法,即将待测的大模型纳入人工智能代理框架,在实验前手动地向人工智能发送任务指令,在实验结束后等到人工智能宣称任务完成之后分析完成情况。

本文刊登于《海外星云》2025年2期
龙源期刊网正版版权
更多文章来自
订阅