梁文锋带领着DeepSeek,还在继续搅动大模型行业。
继用R1模型炸场之后,1月28日凌晨,除夕夜前一晚,DeepSeek又开源了其多模态模型Janus-Pro-7B,宣布在GenEval和DPG-Bench基准测试中击败了DALL-E 3(来自 OpenAI)和Stable Diffusion。
随后特朗普在会议上提到DeepSeek的出现为美国的企业敲响了警钟,“我们需要集中精力在竞争中获胜”。相隔一天,据外媒报道,多名美国官员称DeepSeek是“偷窃”,正对其展开国家安全调查。
OpenAI也适时发表声明称一直知道其他公司试图蒸馏美国领先公司的模型,如今“采取反制措施保护我们的知识产权”,并表示将和美国政府紧密合作保护最先进模型免受窃取。
或许梁文锋自己都想不到,意外火出海的DeepSeek,刺痛着更多人的神经。
而一年前,DeepSeek V2模型发布时,便开始被冠上AI界拼多多的称号。
反卷大厂的梁文锋,早已在AI领域复制过黄峥式“后来居上”的故事,并在国内掀起打到骨折的大模型价格战。
当时,在接受36氪采访中,梁文锋表示,“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。”
如果说梁文锋的鲶鱼效应,在于证明了用低成本也能高效率训练出AI大模型,无意卷到了BAT。去年一年,黄仁勋则在制造另一种鲶鱼效应,即以每6个月为周期,更新更高性能的芯片,使得害怕抢不到最新GPU而掉队的巨头们,疯抢英伟达GPU,微软、谷歌、Meta、马斯克,都被拽进了这场GPU大作战游戏里。
一年后,DeepSeek成为硅谷眼中“神秘的东方力量”,被Scale AI创始人亚历山大·王评价道,“过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会‘改变一切’。”
起因是DeepSeek在年前发布了新的开源模型DeepSeek R1,不仅性能追上了OpenAI o1完整版,而且用550万美元的训练开销做到硅谷投入上亿美元的效果。
在这场热潮前,大模型的主流叙事是英伟达高端CPU“一芯难求”,而如今,黄仁勋的销冠神话,迎来了梁文锋的正面冲击。
梁文锋所带领的DeepSeek,让美国华尔街开始重新审视,在这场大模型生存战里,英伟达芯片和高端算力的需求是否存在泡沫。这样的担忧,使得英伟达在1月27日一夜蒸发近6000亿美元市值。
而这一切,在梁文锋看来,只是“按照自己的步调来做事”,然后核算成本定价。

梁文锋并非有意成为鲶鱼,但正如硅谷著名风投家Marc An‐dreessen的评价:“作为开源项目,这是对世界的一份深远馈赠 。”他们节约了大量的成本,也让很多高薪的硅谷大佬,和享受这个行业巨大泡沫的公司,颜面扫地。
1月28日,OpenAI CEO奥特曼终于回应了DeepSeek,他夸赞DeepSeek让人印象深刻,特别在于提供模型的性价比上。随后则话锋一转,强调OpenAI将提供更好的模型,并暂停一些发布。此前,奥特曼在X上迅速发布首个智能体Op‐erator,还剧透起了即将上线的o3-mini。网友戏称,“DeepSeek逼出了奥特曼的新大招。”
同时,根据外媒爆料,DeepSeek的发布引发了Meta的紧急加班,工程师疯狂拆解代码,员工爆出其高管的薪资竟比训练整个V3模型的成本还高。
2025年,不想当鲶鱼的梁文锋,结结实实搅动了一池春水。
“大部分中国公司习惯follow,而不是创新。”而在采访中,对于上一次DeepSeek引发大模型价格战的热议,梁文锋表示,DeepSeek正以创新贡献者的身份,参与到这场此前由美国主导的科技创新游戏里。
这位80后AI创业者,组织起一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人,他形容团队成员们,“很多人对做研究的渴望,远超对钱的在意。”
梁文锋将DeepSeek定义为“硬核创新”,做最难的事,似乎成为他所带领的DeepSeek的一致认知。

