
无论以ChatGPT为代表的各种聊天机器人在2023年有多么火热,这一切都还局限在比特世界里,哪怕ChatGPT的分析推理再严谨,代码写得再精妙,它依然无法拿起一个苹果。想要让AI从比特世界进入原子世界,就必须给它一副身体,并且教会它如何去控制,这就是具身智能(EmbodiedArtificialIntelligence)的概念。
在2023年涌现的AI独角兽名单里,Covariant是其中少有的专注具身智能的公司,它采取了与波士顿动力等传统机器人公司迥异的技术路线。相较于后者在精密硬件平台上细致打磨运动控制算法以实现机器人运动,Covariant力图开发一个能够适应多种场景的通用机器人大脑,避免为特定场景定制特定机器人,而是让不同机器人共享同一智能核心。
这与OpenAI的思路相同。其实在GPT-3.5(ChatGPT背后的模型)这样的大语言模型出现之前,AI是个大门类,下面有自然语言处理、计算机视觉、语音识别等细分领域。最初的GPT只是一个探索性的技术路线,但科学家们发现,随着投喂的数据增多,参数的规模增大,模型出现了一些智能的迹象,它可以理解语言、生成文本,甚至把图像数据投喂进去,这个模型也开始理解图像的内容。
当然,现实中科学家遇到的困难远比上述流程复杂得多,但这并不能否认“大力出奇迹”就是推动这一轮AI浪潮到来的重要原因。那么何不去训练一个用于机器人的模型呢?
从OpenAI跳出来的创业者
Covariant和OpenAI渊源颇深,4位创始人里有3位都在OpenAI工作过。那时OpenAI尚处于早期阶段,整个团队只有10名成员,他们伴随这家初创公司一路成长,直到团队规模扩大到一百多人。
最年长的皮特·阿贝尔(PieterAbbeel)现在是Covariant的首席科學家,他曾是加州大学伯克利分校电气工程与计算机科学系教授,是将深度强化学习应用在机器人方面的先驱。他率先教会机器人从人类演示中学习,为下一代机器人技术奠定了基础。早在2016年,也就是OpenAI成立的第二年,阿贝尔就加入了这个后来发布ChatGPT的公司,成为其机器人团队的一员。当时与阿贝尔一起在OpenAI工作的还有他的两个学生,即如今Covariant的CEO陈曦(Peter)和CTO段岩(Rocky)。
有一天,陈曦和段岩两人在唐人街的中餐馆里聊合作发表的新论文—用强化学习教会机器人像人类一样在短时间里掌握新技巧。科研取得进展固然可喜,如果想要进一步研究,OpenAI实验室所能提供的资源和数据都远远不够了。“如果我们想用数据和计算驱动的AI解决机器人方面的问题,在实验室永远得不到足够数据,我们必须进入实际环境里求解问题,别无他法。”2022年,陈曦曾在播客节目里回忆创业初期的讨论。
意识到学术研究与解决实际问题间的差距,正是Covariant创立的关键时刻。2017年,Covariant在硅谷成立,它最初的名称是EmbodiedIntelligence。阿贝尔兴趣广泛,担任了风投公司AIXVentures的投资合伙人,还在YouTube经营着自己的同名播客节目,于是Covariant的CEO由陈曦担任。得益于阿贝尔的背书,Covariant在种子轮就获得700万美元的融资,投资人列表里有着一众AI领域的知名学者:深度学习之父杰弗里·辛顿(GeoffreyHinton)、卷积神经网络之父杨立昆(YannLeCun)、GoogleBrain创建人杰夫·迪恩(JeffDean)、ImageNet创建者李飞飞等。
另一边,OpenAI由于机器人团队的核心成员跳槽创业,加上想要把重心放在基础模型GPT的研发上,最终在2021年7月解散了整个机器人团队。

