具身智能,AI 下一个风口浮现
作者 郭勇
发表于 2023年6月

特斯拉与英伟达站台,“具身智能”爆火

两大科技巨头齐齐站台,“ 具身智能” 成为继ChatGPT 后最火爆的存在。日前,Optimus 和NVIDIAVIMA 掀起 “人形机器人”浪潮。

5 月16 日,特斯拉2023 股东大会展示了Optimus人形机器人最新进展,包括捡起物品、环境发现和记忆,基于AI 模仿人类动作,能完成分类物品的复杂任务。从视频中能够看到,特斯拉机器人取得全方位进展,运动控制能力持续进化,AI 能力大幅提升。

5 月17 日,NVIDIA 创始人黄仁勋在ITF2023年半导体大会上向观众介绍了多模态人工智能技术NVIDIAVIMA,VIMA 能根据视觉、文本提示执行任务。除此之外,其他海外科技巨头也加快布局人形机器人,谷歌PaLM-E 作为多模态具身视觉语言模型,不仅能够理解图像,还能理解、生成语言,执行各种机器人指令而无需重新训练;微软持续探索将ChatGPT 扩展到机器人领域,从而运用语言直观控制机械臂、无人机等,而早在3 月28 日,Ope-nAI 领投挪威机器人制造商1XTechnolo-giesA2 轮投资,以创造具有实际应用价值的机器人。

NVIDIA 创始人黄仁勋

NVIDIA 创始人黄仁勋认为,下一波人工智能浪潮是“具身人工智能”,即能够理解、推理并与物理世界互动的智能系统;不同于传统机器人仅具有“物理”执行力,大模型可通过将图像、文字、具身数据联合训练,引入多模态输入,进而提升大模型和环境的交互能力和学习能力,为机器人注入了“灵魂”。

“具身智能”赋予机器人灵魂

具身智能指的是智能体与环境产生交互后,通过自身的学习,产生对于客观世界的理解和改造能力。

本文刊登于《电脑报》2023年22期
龙源期刊网正版版权
更多文章来自
订阅