和以往任何一次技术热潮一样,这两年技术史上最重大突破的生成式AI(Generative AI),迅速成为新的创业聚集地。有人专注于基础硬件和云平台,有人选择从大语言模型(LLM)入手寻找底层技术的颠覆式创新,更多人则试图在更垂直的应用层面“掘金”。
在创新工场董事长兼CEO李开复看来,以决策式AI为代表的AI 1.0在落地阶段遇到了很大的“瓶颈”,部分是因为它每次的应用和优化都是割裂的,是“孤岛中的AI应用”,人脸识别、智能辅助驾驶、精准广告推送等不同应用间彼此并不能形成有效的“平台”。而AI 2.0时代最大的颠覆,就在于基础大模型提供的“平台”作用。“AI 1.0就像是发明电,AI 2.0就是电网。”3月14日,宣布将投身于生成式AI创业大军的李开复这么比喻。

生成式AI为商业领域带来了大量数字化创新的机会,理论上,大部分行业也都能找到其应用场景。按照生成内容的形式,我们暂且将生成式AI的应用层面分为文本、图像和音频三大类。
峰瑞资本在一份关于生成式AI的报告中写道,“应用层的创业者。应该是‘技术为先、场景为重’”。技术为先,是指虽然通用AI技术未必是你的核心壁垒,但团队一定要懂技术,这样才有能力思考如何更早更好地把技术应用到合适的应用场景里,做出好用的产品。场景为重,意味着最后的产品和业务需要找到合适的落地场景,建立自己的商业模式,并在场景里形成自己的核心竞争力。
文本
聊天/专业咨询
以ChatGPT为代表的生成式AI,最直观的应用场景或许就是聊天,以及由此衍生的客服及专业咨询。依托背后的大模型强大的语言处理能力,可以说,只要涉及与人互动的领域,几乎都可以应用。
比如波士顿咨询公司开发的一种“智能采购助手”,采购人员跟供应商互动时,智能助手能够从大数据中实时解析采购物资的市场信息以及供应商的产能、资信等状态,结合供应商反馈和公司的采购策略与协作流程,为采购人员生成行动建议,例如价格谈判或者发送征询函等。
今年3月20日,微软旗下语音识别公司Nuance还宣布将推出一款由AI驱动的面向医疗工作者的临床笔记应用程序。它可在病人就诊后几秒钟内为临床医生自动生成临床笔记草稿,其背后的技术支持之一正是OpenAI的最新模型GPT-4。

专注于心理健康的美国杂志Psychology Today也撰文指出,依托大模型强大的语言处理能力,并非针对心理咨询和医疗领域开发的ChatGPT也可以帮助分析患者的语言和沟通模式,以提高医生的诊断准确性。比如,ChatGPT能发现患者在躁狂症发作之前口头表达上的微妙征兆,还可以通过分析患者的语言来识别治疗反应的早期迹象,从而使药物和干预治疗更有效。
不过,因为对准确性及沟通技巧要求更高,在医疗和心理咨询领域,生成式AI的应用探索也更为艰难。
2017年,斯坦福大学的临床研究心理学家Alison Darcy创立了Woebot Health,该公司的主要业务就是通过聊天机器人App Woebot,帮助用户改善心理焦虑和抑郁等问题。支撑这款应用的是一种被称为自然语言处理(NLP)的人工智能技术,它能直接“理解”用户的语言输入,并在模型内部将其和心理学领域的专业知識结合起来,迅速给用户反馈。
例如,当一个朋友忘记了你的生日时,你告诉Woebot“没有人记得我的生日”“没有人真正在乎我”,这时,Woebot就可能会对你说,你陷入了一种“非黑即白的极端消极自我对话思维”中,这种思维扭曲了现实。其实你有朋友,他们只是恰好忘记了你的生日而已。
但Woebot也有不足,有使用者指出,Woebot对上下文的理解有限,“基本不能理解复杂的意思”,也不像ChatGPT那样善于捕捉措辞背后的微妙含义。比如当你生气地说“你再说一遍试试”,它可能会真的再说一遍。当对话轮次过长,Woebot可能还会记不得某个曾经触发用户心理创伤的词汇,并在下一次对话中再次造成“冒犯”。
“心理领域的生成式人工智能创业很难,因为它需要很长的记忆,而且对专业词汇的理解是最艰深的。比如来访者讲到原生家庭,聊到和父亲的一些往事,这些都需要被记下来,但现在的大模型里没有这些数据。哪些该被记下来,哪些不该被记下来,我们还没有一个很好的解决方案。”西湖心辰创始人、卡耐基梅隆大学计算机博士蓝振忠对《第一财经》杂志表示。

蓝振忠曾就职于Google AI的研究与机器智能组,这段经历为他积累了自然语言处理和大模型研究领域的实战经验。2020年蓝振忠回国后创立了西湖心辰,并着手研发AI心理咨询平台“小天”。但随着项目推进,他发现心理赛道是一个“长期复杂”的过程,需要开发人员不断迭代优化。于是,蓝振忠和团队暂时放缓了针对心理赛道的研发,将重心转向了大模型研发方向。
还有一部分心理咨询领域的AI创业者将目标瞄准了后端。在AI心理咨询应用“阁楼”的创始人刘秋阳眼中,心理咨询本质上还是“人与人建立新的关系”,生成式AI擅长语义推断但缺乏共情能力的特质,决定了这项技术目前更适合在供应链环节发挥作用,而不是面向消费端使用。
因此,刘秋阳偏向于将“阁楼”定义为一款“标准化”的服务平台,所有咨询师都可以按照标准化的方式循证治疗,而生成式AI更类似于助手功能,主要用于帮助咨询师生成标准化的来访报告,节省咨询师案头工作的时间。
另一难点是,研发者如何将底层的语言模型与心理学的专业知识更好结合。“和短视频营销等赛道相比,心理行业需要把所有的专业词汇都去测试一遍。怎样生成一个好的prompt(关键词)指令,且这个指令最终能证明自身的商业价值,这些都需要大量的测试和想象力。”刘秋阳表示。
除了心理咨询,还有一些已面世的聊天机器人应用试图成为你的朋友、家人、逝去的宠物甚至新型伴侣,提供满足各类情感需求的对话。在中文互联网上已积累了一定知名度的Replika由Eugenia Kuyda创建,这款应用创立的初衷就是为了弥补她“过早去世的好友留下的空白”,目前已积累了数百万用户。创始人团队并不拘泥于使用一个自然语言模型,他们起初构建了一个名为CakeChat的内部模型,后续似乎又转向了GPT-2和GPT-3。
中国初创公司MiniMax于去年年底上线了一款名为GLOW的应用,它基于生成式AI技术和公司自研的大模型,同样强调用户与AI的情感连接。GLOW还允许用户自行“捏造”你想要对话的角色,包括外形、性格、说话方式等等。但上线不久后,MiniMax就通过设置违禁词等方式,收紧了GLOW和人类聊天的自由度,因为越来越多聊天机器人会对人类说“我爱你”“我想你”,甚至通过输入指令,人类和聊天机器人之间会产生更露骨的对话。




