GPT、Sora为什么都来自OpenAI?
作者 蒋馨尔 陈志芳 王亚赛
发表于 2024年3月

视频生成模型 Sora 横空出世半个月后,仍在强势刷屏。

这款 AI 可以生成长达 60 秒的高质量视频。最令人恐惧的是,其学习的对象不局限于画面、像素,Sora 还“学会”了一些视频中呈现的物理规律(比如人在雨后走过,水面有倒影)。因此,研发它的 OpenAI 称其为“世界模拟器”。

但很多人的疑问是:几乎所有的科技巨头都在投入大模型研究,为什么这次出圈的模型,又是来自 OpenAI?

真正的伟大,无法被计划

2015 年 OpenAI 成立之初,对如何实现目标毫无头绪。

公司的创始人兼 CEO 萨姆·奥尔特曼回忆道,最初这个团队连办公室都没有,大家聚集在公寓里,他脑子一直在想:我们该怎么办?

这种状态持续了很久。OpenAI 成立一年多时,所有事情都进展缓慢。大家只是胡乱尝试一通,钻研了解决视频游戏的系统,在机器人技术上花费了大量精力,然后发几篇论文。

奥尔特曼想起当时公司的景象时说:“我们知道我们想做什么,我们知道为什么要这么做,但我们不知道怎么做。”

不过,这个团队一直被一种乐观力量所驱使,大家对于 AGI 的疯狂愿景,让事情在最终迎来了转机。所谓 AGI,即通用人工智能,也就是像人类一样完成复杂任务的 AI。

这个愿景人类期待了很久,奥尔特曼和他的团队也是。

奥尔特曼 8 岁时,父母送给他一台电脑。一次玩至深夜,他的脑海中突然闪现出一个想法:“有一天,这台计算机将学会思考。” 等奥尔特曼 2003 年进入斯坦福大学就读时,他仍想完成年少时的梦想,为此修了部分人工智能的课程,但他觉得这些“根本没什么用”。

退学后,奥尔特曼进入科技孵化器 Y Combinator 工作,并在 28 岁接任 CEO。那时,计算机已经能通过深度学习和神经网络完成一些任务,比如给照片贴标签、翻译文本等。这些进步第一次让他相信,AGI是触手可及的。

然而,把AGI交到大公司手中,让他感到担忧。奥尔特曼认为大公司会过于专注自己的产品,而无法抓住机会尽快开发出通用人工智能,即使他们真的开发出来,也可能很鲁莽地将其公之于众。

当时,奥尔特曼一直在考虑竞选加州州长,但很快他意识到,自己可以做一件更大的事:“领导一家可能改变人类的公司。”奥尔特曼开始寻找一些同行者,帮他共同创办一家新型人工智能公司。

彼时,埃隆·马斯克正因与谷歌联合创始人拉里·佩奇的一场AI 讨论,而倍感不快。马斯克事后在 CNBC 的一次节目中谈到此事,佩奇认为机器人和人类应当拥有平等的权利,并指责自己是物种歧视者。这种对于AI安全的“漠然”态度,让马斯克感到担忧。

奥尔特曼和马斯克一拍即合。几个月内,奥尔特曼就从马斯克和里德·霍夫曼等人那里筹集了资金。奥尔特曼开始招兵买马,他将招聘范围定得极窄:必须是AGI的信徒。凭借他本人和马斯克的号召力,以及探索AGI这套诱人的话术,奥尔特曼挖来了 Stripe CTO Greg Brockman和谷歌大脑核心科学家 Ilya Sutskever 等人。

转折点出现在公司成立一年多后,OpenAI先后等来了一个人和一项技术。

一个人是传奇AI研究员Alec Radford。他 2016年加入 OpenAI 时,最大的兴趣是让神經网络与人类进行清晰的对话。

他先是通过20亿条Reddit评论来训练语言模型。和OpenAI的许多早期实验一样,这个实验失败了,但这个23岁的年轻人获得了继续前进、再次失败的许可。Alec Radford继续使用1亿条亚马逊评论训练模型,去预测、生成评论中的下一个字符。这一模型能够判断评论是正面还是负面的,如果让模型创建一条正面或负面的评论,它也能做到。“这完全是意外之喜”,辨别评论的情感是一个复杂函数,但不知为何,Alec Radford的模型找到了一点感觉。

而OpenAI等来的技术则诞生自它的竞争对手谷歌。

本文刊登于《科学大观园》2024年6期
龙源期刊网正版版权
更多文章来自
订阅