当人们进入互联网时代,围绕信息生产、分享与消费的需求,走出了一条相对线性的发展路径,这条路径是网页-浏览器-门户-搜索-社交网络 。站在这条路径基础上,人们在拥抱AI时代的过程中,不同的企业和开发者以此为参照,同时在不同节点寻找着AI化的可能性 。
其中,浏览器是互联网时代第一个全民级应用。比尔·盖茨在三十年前发布了著名备忘录《互联网浪潮》。他在其中写道,我们相信,在未来20年,计算机将对工作、学习和游戏产生根本性影响。出色的软件产品对实现这些进步至关重要。微软由此开始争夺作为入口的软件——浏览器。
在AI浪潮里,AI浏览器是AI应用中竞争极为激烈的节点之一,众多参与者投身到AI浏览器的竞争中,其中有明星创业者,有互联网元老,有国内巨头,还有海外新秀 。Fellou在寻找原生AI浏览器的最佳实现路径,Dia在寻找原生AI浏览器的最佳实现路径,Opera在寻找原生AI浏览器的最佳实现路径,Chrome中置入了AI助手能力,QQ浏览器中置入了AI助手能力,OpenAI要发布自己的浏览器产品,Perplexity要发布自己的浏览器产品。
入口是浏览器给予人们的最直接诱惑,每一次主流浏览器更迭,都是一次入口易手,微软与网景围绕浏览器展开了互联网时代的第一次平台之争,微软胜出,其通过Windows+IE的组合,进一步强化了在桌面端的统治地位。Google推出了Chrome,这使得躺在功劳簿上的IE浏览器被掀翻在地,同时也顺势为搜索找到了最契合自己的搭档。
当人们察觉到AI或许会引发新的颠覆之际,浏览器仍旧是构成AI体验的核心部件之一 。只是 ,AI浏览器从搜索的容器转变为AI能力的躯体 ,从信息获取的窗口转变为代理执行的伙伴 。在这个变化的背后 ,AI正把搜索 、决策 、执行融合为一体 ,使得人们能够借助自然语言来操作完成更为复杂的操作 。
这使得AI浏览器成为一个重叠之处,不同方向的AI应用,诸如AI搜索、通用Agent、copilot等,会在此找到交集。豆包作为AI助理,夸克作为AI搜索产品,ima作为知识库产品,都选择以浏览器的形态来承载自身的产品能力。同时,扣子空间为AI配置的虚拟电脑,Manus为AI配置的虚拟电脑,更像是一个基于浏览器能力实现的Web端工具合集 。
在这个趋势之下,AI浏览器会愈发像一个面向AI时代的操作系统。这是Google曾经期望Chrome达成的目标,即绕开传统桌面系统,以浏览器作为核心,借助云端能力构建起全新的软硬件生态。
当AI凭借一个框以及一个浏览器界面便可完成大部分复杂任务的时候,这也意味着,在桌面上,只剩下了唯一的任务,那便是支持人们打开AI浏览器。
在AI浏览器身上 我们看到了一个更简单的未来交互范式 这个范式涉及人与世界 它不但会改变软件 还会使硬件成为AI的本地算力提供者以及云端算力连接者 进而打造出更灵活 轻量化的软硬件生态 前者能够充分利用电脑硬件配置 在浏览器上支持AI运行复杂任务 后者可以在智能眼镜等轻量化设备上执行简单任务
AI驱动的浏览器改造
网景公司创始人Marc Andreessen曾表示,浏览器是一款软件。这款软件对人们生活的影响极大。在有史以来的软件中,它的影响力排名第一。而且,这个判断直至今日都没有改变。即便在移动互联网极为普及的当下,人们已习惯在微信、抖音上搜索与浏览信息,浏览器在全球仍有数亿用户,它承担着很大一部分复杂的信息获取工作,还是共享文档、多维表格的主要打开方式。
当AI成为新一轮科技浪潮的驱动核心时,浏览器成为了AI能力的关键载体,诸多已发布的AI浏览器产品,依托更智能的搜索体验以及更复杂的任务智能能力,收获关注与追捧,一次次创造出“一码难求”的景象,截至目前,若想注册并使用Fellou、Dia这类AI原生浏览器,仍需先求一个邀请码。
在由AI驱动的情况下,不同的AI浏览器都遵循了AI对话框加浏览器界面的设计,不过在具体使用方面会有不同的侧重,各自不同的立场与出发点,决定了产品的开发逻辑以及使用体验。
我们大体上能够对AI浏览器进行划分,可分为三类,分别是AI原生浏览器,类AI浏览器,以及AI化的传统浏览器。
在AI原生浏览器产品里,使用Dia时,会让我感觉更像是在使用一个浏览器,操作简便又流畅。往它的搜索框填入内容后,用户能自主选择搜索打开网页或者开启聊天对话。在已打开的页面中,用户随时能开启AI对话,可对一个或多个页面进行总结提问,其工作流是先满足信息获取需求,接着才进一步过渡到写文章或编写代码。
相较而言,Fellou给我的感觉更像采用浏览器形态的Manus,其功能更为复杂,由于它强调代理式深度行动和代理式浏览器,我使用它时,第一时间就会产生为助手下达任务的心态,下达任务后,等待助手完成任务,这种使用体验与Manus、扣子空间完全一致,不会有太强的浏览使用感受。
除了AI原生浏览器产品,豆包、夸克、ima的桌面版同样是以浏览器的形式存在,不过在产品定位里不会突出浏览器这一定位。对于这些主打AI助手、AI搜索、AI知识库的产品,浏览器更像是赠送给用户的一个产品功能,能让用户在其中打开任务页面,并且其产品升级依旧会围绕AI对助手、搜索、知识库的优化来开展。
此外,传统浏览器也在把握AI带来的契机,达成老树发新芽的目的。QQ浏览器推出了QBot,它支持多模态搜索,能自动识别页面浏览意图,还可调用辅助办公能力等。Chrome在更新时,集成了Gemini AI助手,微软为Edge浏览器上线了AI助手Copilot Vision 。这种变化实际上为浏览器增添了一个AI插件,这个插件让浏览器在原本的体验之上,拥有了更多的AI能力。
和AI原生浏览器、类AI浏览器产品相比,传统浏览器在进行AI化时会背负更多包袱,很难把一个老产品迅速切换到新赛道,所以,常常会选择渐进式的改造思路。QQ浏览器产品负责人刘汉博称,QQ浏览器会在保留原有优质业务内容的前提下,借助AI实现增量提升,而AI也的确带来了一定的增量。在QQ浏览器AI功能正式发布以前的灰度测试时期,被涵盖的用户活跃度提升,整个大盘呈上升趋势 。
浏览器的竞争逻辑:入口、操作员和智能伙伴
三类产品的实现思路存在不同之处,不过,它们背后的竞争逻辑是一样的。
首先,围绕AI浏览器展开的竞争,其实就是在争夺新一轮的入口掌控权,这已然成为一个共识 。Dia的开发商是The Browser Company ,该公司的CEO是Josh Miller ,他在一封公开信中表明 ,云端营收急剧增长 ,新兴创业公司均以浏览器作为平台 ,加密货币生态依赖浏览器插件 ,WebAssembly开启了全新交互体验……
一切都在往浏览器里聚集。
这个聚集的趋势因AI而变得愈发明显,人们开始越来越多地依靠Web端,来实现AI搜索、AI生图、AI生成视频等需求。同时,我们能看到,在2025年第一季度,AI社交产品在Web端有明显增长,淘宝这类电商平台开始重新重视PC端体验,人们与扣子空间、Manus这类Agent产品的交互更多集中在网页上。
同时,AI正在改变人们在浏览器内的需求匹配模式,现在依靠传统页面承载这些能力,然而未来人们可能无需看到传统页面,更多需求会在浏览器地址栏中被提出,随后由AI进行分配、执行,最终将结果反馈在地址栏延展出来的聊天界面中。在这样的发展趋势情形下,浏览器的地址栏会发生演变,它会如同夸克的搜索框那般,逐渐演变成超级框,最终成为AI的核心入口。
其次,大家争夺的不只是信息获取的入口,还是自动化任务流的起点,在这其中,浏览器会扮演操作员的角色。
Perplexity的首席执行官Arvind Srinivas觉得,Perplexity的产品所要达成的是一系列工作流,比如Perplexity的Agent能够协助用户管理投资组合,在用户读完报告和新闻后,它会告知用户怎样调整风险敞口。这个Agent需要理解整个搜索及信息浏览的过程,而不只是单次的词条搜索。
浏览器是承载这个过程的恰当载体。Arvind Srinivas称,要是你真的期望AI从提供答案转变为采取行动、为你做事,答案本质上是四五个搜索的组合,而行动是一个完整的浏览会话,通过一个提示完成,那你需要有一个浏览器,并且在客户端和服务器端无缝整合计算能力。
Fellou创始人是谢扬,在其介绍里,Fellou产品前四大类使用场景为信息查询、数据爬取、社交媒体发文、自动填表,60%的用例是进行数据查询与爬取。有人借助Fellou在领英上给心仪公司发送求职信息,最终获得10家公司面试邀请,还成功入职其中一家公司。这可以说明,用户也确实期待AI浏览器具备更强的行动力。
要留意的是,AI浏览器可借助cookies获取更多用户的上下文信息,像用户在网站上浏览的内容,进行的操作,登录的账号。与此同时,AI浏览器能让处于已登录状态的用户,通过隐藏标签页访问其他第三方服务,抓取页面数据,还能代表用户进行推理以及执行操作。这能够解决AI应用的问题,其没有底层控制权,无法直接调用其他应用,也不能获取相关信息 。
最后,浏览器之争最终可能还是智能伙伴之争。
谢扬认为,Fellou做的事是让更多人拥有自由,让更多人拥有时间,让更多人能够做自己。Josh Miller告诉《the Verge》,Dia的核心功能是一个聊天工具,它能帮助用户更清晰地查找信息,帮助用户更轻松地查找信息,帮助用户更清晰地完成工作,帮助用户更轻松地完成工作 。浏览器在未来会成为AI助手的一部分 。
这些定位都指向了一种更具记忆力和执行力的智能伙伴。
Chrome OS故事的延续
就我自身的使用感受而言,当下的AI浏览器称不上是一个合格的智能伙伴,它更像是一个尚未学会运用工具以及专业技能的小孩子 。
我们能够要求AI浏览器替我们撰写邮件,帮我们发送简历,为我们编写网页,然而很多时候其水平仅仅只能达到及格程度,甚至有些复杂任务在执行进程中会走向崩溃。比如说,在运用Fellou制作当天的新闻信息简报时,它很难从新闻网站获取足够有效的信息。
AI浏览器要有能力和工具生态。在一定程度上,AI浏览器获取信息的主要方式变了,不再是浏览网页,而是直接和不同应用、服务商在数据或协议层面沟通。Opera开发的AI浏览器Neon获取信息没采用浏览页面的方式,而是借助DOM树和排版资料分析网页内容,从而更快速获取有效信息。
这个生态或许会分成两层。第一层借助AI浏览器的能力,能够打造出一个全新的AI插件体系。Dia正在尝试构建这样一种技能生态,它能让用户利用Dia的“技能”功能编写代码,创建不同的任务与能力,还能像App Store那样将其分发出去,进而成为一个匹配需求与能力的“路由系统”。
The Information在2024年11月的报道中称,OpenAI正在打造一款AI浏览器产品,该产品会与GPT深度整合,还将接入旅游服务商的能力,也会接入食品服务商的能力,也会接入房地产服务商的能力,也会接入零售等服务商的能力 ,第二层是与第三方平台的打通 。联系到亚马逊正尝试打造购物Agent,我们会认为,这种第三方能力的接入,很大概率会通过Agent之间的交互来实现。
拥有应用生态的AI浏览器会更类似一个操作系统。Josh Miller明确指出,Dia最终要构建的是一个基于浏览器的系统,而且在充满Agent的未来,这个系统会成为一个强大的指挥中心。Arvind Srinivas也着重表明,浏览器本质上就是一个容器化的操作系统,是构建Agent的最佳方式。
这仿佛是Chrome OS故事的AI增强版本。Google于2011年推出了Chrome OS,它承载着Google基于Web应用和云服务开发操作系统的雄心。此后,Google又推出了搭载Chrome OS的Chromebook。
Chromebook并非像上网本那样,借助低配置来搭载Windows系统,进而在本地实现轻度办公,它是通过调用云端资源与Google服务相结合的方式,以此满足用户的日常使用需求。
最早的Chromebook被指责是“加了外壳的浏览器”。不过随着Chrome OS持续迭代,Chromebook在北美和欧洲的教育市场不断取得进展,成为350美元以下价位笔记本消费者的主要选择。以这为参考,如果AI浏览器真成了人们最主要的计算空间,AI浏览器或许也会有与其相适配的硬件产品。
这个硬件可以是具备本地算力的PC。这个硬件也可以是只依赖云端算力的智能眼镜。从无缝连接的需求角度来看,AI浏览器是一个类似Chrome OS的轻量化AI操作系统。它围绕AI打造出一个软硬件的新生态。它能让人们生活在AI互联网上。