我一直在等待一个时机写写“AI浏览器”。原因很简单,还是我常说的:AI最缺的是眼睛和手脚。而在今天,能让我们放下手机、打开电脑的理由,主要还是工作。若想让AI成为我们真正的生产力助手,浏览器就是那个能为AI提供眼睛和手脚的最佳载体。
明确一下,本文说的都是电脑上的浏览器。在电脑上,浏览器是我们大多数公司人每天面对时间最长的窗口。今天,人们除了通过浏览器来获取信息、浏览内容,还可以在其中完成各种日常办公任务、处理文档,甚至是专业的设计工作。根据Firefox浏览器官网上显示的用户使用统计实时数据,目前,其用户平均每天使用时长高达5.5小时,足以说明浏览器的重要性。
过去几年,我一直在使用Arc浏览器,其开发团队名字也颇为复古,就叫“浏览器公司”(The Browser Company)。去年年底,这家“浏览器公司”宣布将推出新的“AI浏览器”Dia。在Arc老用户的反对声中,Dia持续往前推进,今年3月开启内测,6月启动公测,同时公司正式宣布将停止为Arc开发新功能。
这段时间中,我身边不少喜欢使用AI的朋友,都将自己的默认浏览器切换成了Dia。
那么,“AI浏览器”到底能否在我们的工作中发挥实用价值呢?要回答这个问题,我们还是得先搞清楚“AI浏览器”到底指什么。在我看来,目前市面上自称“AI浏览器”的产品,可以分为三类。
第一类,是所谓的agentic browser。这是最激进的一派,它们以“agent”为主要卖点,如国内团队开发的Fellou。当然,agent这个概念本身也被用得乱七八糟,我在5月刊的本专栏介绍Manus时已经讨论过。简单概括Fellou和Manus的差异:如果说Manus是一个自带电脑的远程实习生,Fellou更像是请一个实习生来直接操作你的电脑。Manus让许多人第一次看到一台电脑在自己操作自己,只是这台电脑身处远方;Fellou则让你看到你的电脑在自己操作自己。
相较于Manus,Fellou的优点和缺点都源自于此。由于它可以直接使用你在浏览器中已经登录的账号,像是Gmail、小红书、豆瓣、微信网页版等等,它可以触达一些Manus难以触及的地方。但也因为它直接使用你的电脑,尽管团队做了一些创新来避免AI和人类的相互干扰,但我在实际使用中仍然很害怕会“打扰”AI工作。另外,权力越大责任也越大,我真的有些害怕Fellou不小心对我这些个人账号搞了什么破坏。

