戴文渊:最适合大模型的商业模式是什么

ChatGPT的崛起虽意外,却也在情理之中。自GPT—3问世时,我们就已预见到大模型的重要性,只是难以确定其突破时机。2023年,ChatGPT的出圈对整个产业产生了巨大的推动作用。技术进步可能是线性运动,但信心则是跳跃式的。在技术未达到临界点之前,公众对其几乎没有信心。
因此,此轮风暴主要源于信心的转变,而非技术上的重大突破。以AI(人工智能)绘画为例,该技术早已存在,但当时人们对AI作画兴趣寥寥。2023年,即便我们不主动提及,大家也会追问,渴望了解AI作画。
第四范式拥有一个由100多名研究员组成的团队,类似于公司的“达摩院”。对我们而言,大模型是一个不能错过的方向。
自2018年Google(谷歌)推出BERT模型起,我们便着手相关工作。尽管BERT当时存在局限性,但GPT—3的出现为我们指明了技术发展的明确方向。我们在此过程中的投入与2023年有所不同,特别是在技术临界点突破后,团队的士气和信心大增。
信心问题一直困扰着我们。2022年若推出“式说”1.0和2.0版本,市场接受度恐怕不高。因此,尽管我们长期储备了大模型技术,却未给予足够重视。技术临界突破后,我们立即着手产品化,于是在2月和3月迅速推出了“式说”1.0、2.0版本。
在此过程中,我们面临的主要挑战是“可控性”问题。我们需要明确哪些事是可控的,哪些是不可控的,同时探索客户对于可控与不可控范围的接受度。以AI功能实现为例,即便准确率高达99%,若无法满足用户的100%要求,便无法使用。或者至少应确保在指出错误时,AI能够进行自我迭代与修正。
对于大模型能力的涌现,我们并不感到意外或激动,而是视为理所当然。我们对自身大模型的评价是“理应如此”。

登录后获取阅读权限
去登录
本文刊登于《中国商人》2024年7期
龙源期刊网正版版权
更多文章来自

订阅