GPT、Sora为什么都来自OpenAI？-葫芦时刻

GPT、Sora为什么都来自OpenAI？

作者蒋馨尔　陈志芳　王亚赛

发表于 2024年3月

视频生成模型 Sora 横空出世半个月后，仍在强势刷屏。

这款 AI 可以生成长达 60 秒的高质量视频。最令人恐惧的是，其学习的对象不局限于画面、像素，Sora 还“学会”了一些视频中呈现的物理规律（比如人在雨后走过，水面有倒影）。因此，研发它的 OpenAI 称其为“世界模拟器”。

但很多人的疑问是：几乎所有的科技巨头都在投入大模型研究，为什么这次出圈的模型，又是来自 OpenAI？

真正的伟大，无法被计划

2015 年 OpenAI 成立之初，对如何实现目标毫无头绪。

公司的创始人兼 CEO 萨姆·奥尔特曼回忆道，最初这个团队连办公室都没有，大家聚集在公寓里，他脑子一直在想：我们该怎么办？

这种状态持续了很久。OpenAI 成立一年多时，所有事情都进展缓慢。大家只是胡乱尝试一通，钻研了解决视频游戏的系统，在机器人技术上花费了大量精力，然后发几篇论文。

奥尔特曼想起当时公司的景象时说：“我们知道我们想做什么，我们知道为什么要这么做，但我们不知道怎么做。”

不过，这个团队一直被一种乐观力量所驱使，大家对于 AGI 的疯狂愿景，让事情在最终迎来了转机。所谓 AGI，即通用人工智能，也就是像人类一样完成复杂任务的 AI。

这个愿景人类期待了很久，奥尔特曼和他的团队也是。

奥尔特曼 8 岁时，父母送给他一台电脑。一次玩至深夜，他的脑海中突然闪现出一个想法：“有一天，这台计算机将学会思考。” 等奥尔特曼 2003 年进入斯坦福大学就读时，他仍想完成年少时的梦想，为此修了部分人工智能的课程，但他觉得这些“根本没什么用”。

退学后，奥尔特曼进入科技孵化器 Y Combinator 工作，并在 28 岁接任 CEO。那时，计算机已经能通过深度学习和神经网络完成一些任务，比如给照片贴标签、翻译文本等。这些进步第一次让他相信，AGI是触手可及的。

然而，把AGI交到大公司手中，让他感到担忧。奥尔特曼认为大公司会过于专注自己的产品，而无法抓住机会尽快开发出通用人工智能，即使他们真的开发出来，也可能很鲁莽地将其公之于众。

当时，奥尔特曼一直在考虑竞选加州州长，但很快他意识到，自己可以做一件更大的事：“领导一家可能改变人类的公司。”奥尔特曼开始寻找一些同行者，帮他共同创办一家新型人工智能公司。

彼时，埃隆·马斯克正因与谷歌联合创始人拉里·佩奇的一场AI 讨论，而倍感不快。马斯克事后在 CNBC 的一次节目中谈到此事，佩奇认为机器人和人类应当拥有平等的权利，并指责自己是物种歧视者。这种对于AI安全的“漠然”态度，让马斯克感到担忧。

奥尔特曼和马斯克一拍即合。几个月内，奥尔特曼就从马斯克和里德·霍夫曼等人那里筹集了资金。奥尔特曼开始招兵买马，他将招聘范围定得极窄：必须是AGI的信徒。凭借他本人和马斯克的号召力，以及探索AGI这套诱人的话术，奥尔特曼挖来了 Stripe CTO Greg Brockman和谷歌大脑核心科学家 Ilya Sutskever 等人。

转折点出现在公司成立一年多后，OpenAI先后等来了一个人和一项技术。

一个人是传奇AI研究员Alec Radford。他 2016年加入 OpenAI 时，最大的兴趣是让神經网络与人类进行清晰的对话。

他先是通过20亿条Reddit评论来训练语言模型。和OpenAI的许多早期实验一样，这个实验失败了，但这个23岁的年轻人获得了继续前进、再次失败的许可。Alec Radford继续使用1亿条亚马逊评论训练模型，去预测、生成评论中的下一个字符。这一模型能够判断评论是正面还是负面的，如果让模型创建一条正面或负面的评论，它也能做到。“这完全是意外之喜”，辨别评论的情感是一个复杂函数，但不知为何，Alec Radford的模型找到了一点感觉。

而OpenAI等来的技术则诞生自它的竞争对手谷歌。

本文刊登于《科学大观园》2024年6期

龙源期刊网正版版权

科学大观园

2024年6期

查看本期目录

更多文章来自