越过技术拐点的视频模型或许是个更有前景的生意
本月的语言模型领域格外平淡,除了OpenAI最大的竞争对手Anthropic推出了最新模型Claude 3.5 Sonnet,几乎没有其他新模型、新技术的重磅消息,Claude的这次半代升级目标也只不过是追赶GPT-4o。可以说,2024年虽然已经过半,语言模型的智力依旧停留在2023年的水平,并没有太大长进。
这种“原地踏步”的状态或许会比预想中持续更久。OpenAI首席技术官朱拉·穆拉蒂(Mira Murati)6月20日在母校达特茅斯工程学院的访谈透露的信息暗示了这种可能。她在访谈中先将GPT-3的智力水平比作幼儿,再将GPT-4的智力水平比作高中生,而对于博士级别的智能系统,在主持人的追问下,她表示从现在起还要差不多一年半的时间才会面世。
从悲观的角度理解,OpenAI的下一代模型,也就是GPT-5的推出时间,可能要等到明年甚至后年,而非大部分人期待的今年夏天。更悲观一点,这可能意味着在过去一两年中OpenAI的大杀器——“规模定律”(Scaling Law)可能碰壁了,换句话说,哪怕堆更多数据、用更强算力训练出参数规模更大的模型,其智力水平的增长也非常有限。
没有能力更强的模型就没有更多用户,产生不了足够多的收入也就无法覆盖高昂且固定的资本支出。在这个背景下,最近一周红杉资本美国合伙人David Chan的《AI的60 0 0亿美元问题》就容易理解了。

登录后获取阅读权限
去登录
本文刊登于《第一财经杂志》2024年7期
龙源期刊网正版版权
更多文章来自

订阅