职场人「解放双手」之路,到底走通了吗?

0 评论 230 浏览 0 收藏 29 分钟

AI浏览器正成为职场人解放生产力的新希望,但理想与现实之间仍有差距。本文深度测评六款主流AI浏览器,从跨网站信息整合到结构化数据抓取,揭秘它们在自动化任务执行中的真实表现,剖析那些令人惊喜的突破与无奈的短板。

一、引子——打工人对AI最朴素的期待

上周四下午四点半,我需要整理一份竞品调研表。任务清单很简单:去六个网站分别查对应产品的功能更新、定价变化、用户评价,然后手动汇总进一张表格。

这件事我做了将近两个小时。

不是因为内容复杂,而是因为它极度繁琐——打开网站、找到对应页面、复制信息、切回表格、粘贴、格式化、再打开下一个网站……整个过程机械到让人怀疑人生。

做到一半我就在想:这件事,不就是应该交给AI来做的吗?

这个念头我相信很多职场人都有过。AI被吹了这么久,”解放双手””自动化工作流””你的数字员工”——这些词在各种产品发布会上出现的频率高得离谱。但真正坐下来用的时候,能帮你把那张竞品表自动填完的工具,我还没见到。

最近大半年,各大厂扎堆做AI浏览器,我最关注的就是里面的 Agent 智能代理功能——它能不能真正做到自动检索、自动决策、自动执行,彻底把那些繁琐重复的操作从我的工作清单里划掉。

带着这个问题,我测了六款产品:Tabbit、夸克、Perplexity Comet、QQ浏览器、Edge Copilot、Fellou。

结论先说:有惊喜,有失望,有一种”差一点点”的复杂情绪。

二、赛道背景——为什么大家都在扎堆做AI浏览器

先说一个很多人没想清楚的问题:为什么是浏览器,而不是一个独立的AI助手App?

答案其实很简单。浏览器是PC端最大的工作容器。你的OA系统在浏览器里,协作文档在浏览器里,查资料在浏览器里,发邮件在浏览器里,填各种表格还是在浏览器里。几乎所有的知识工作,最终都落在一个个标签页上。

这就意味着,如果AI能真正”住进”浏览器,它就能理解你在做什么、看什么,然后直接替你把事情做完——而不是你还需要把内容复制出来、粘贴进AI对话框、再把结果复制回去。那个来回倒腾的过程,本身就是一种低效。

所以从产品逻辑上讲,AI浏览器的想象空间是真实的。问题在于,想象和落地之间,还差着很长一段路。

目前市场上的AI浏览器,大致分两条技术路线:

集成路线的优势是用户不需要换浏览器,打开就能用;劣势是AI能力是”插件式”的,和浏览器本身的整合深度有限。AI原生路线理论上能做到更深的整合,但要说服用户放弃用了多年的Chrome,门槛不低。

说句实话,很多大厂做AI浏览器,与其说是在解决用户问题,不如说是在抢”AI时代的流量入口”。谁能成为用户打开电脑第一个启动的工具,谁就掌握了下一个时代的注意力。这个逻辑没有错,但当商业目的优先于用户价值时,产品往往就会变成功能的堆砌,而不是真正好用的工具。这是我在测评过程中反复感受到的一件事。

三、职场人真正需要什么——用户、需求、场景的三层拆解

在上手测产品之前,我想先把”谁在用、用来干什么”这个问题说清楚。因为如果连用户是谁都没想明白,测评就只是在比参数。

用户层面,职场人其实不是一个均质的群体。我大致把它分成两类:

一类是信息密集型工作者,比如产品经理、市场分析师、研究员。他们的日常工作大量依赖信息的检索、整合和判断,需要同时打开十几个标签页,在不同来源之间交叉比对。

另一类是执行操作型工作者,比如行政、运营、销售支持。他们的痛点不是”找不到信息”,而是”有大量重复性的操作要做”——填表、汇总数据、批量处理文件、发模板邮件。

这两类人对AI浏览器的期待完全不同。前者希望AI帮他们”想得更快”,后者希望AI帮他们”做得更快”。但我观察下来,目前大多数AI浏览器的产品设计,主要服务的是前者,对后者的支持相当有限。

需求层面,我习惯用三层来拆解:

理解这三层需求,是判断一款AI浏览器”有没有做对事”的关键。很多产品在表层需求上做了功能,但没有真正触达深层和终极需求。比如一个”AI总结网页”的功能,满足了表层需求,但如果用户还是需要手动打开每个网页、手动触发总结、手动把结果复制走,它并没有减少多少实质性的操作负担。

场景层面,我把职场中最典型的AI浏览器使用场景归纳成五类,这也是后文测评的评价框架:

  • 信息检索与整合:跨多个网站查资料,自动汇总
  • 结构化数据抓取:从网页提取数据,生成表格
  • 文档阅读与提炼:读PDF报告,总结关键信息
  • 跨平台连续操作:在多个网站之间完成连贯动作
  • 自动化/定时任务:无需人工干预的后台执行

我的评测标准只有一个:功能能不能稳定落地、真正可用。不是”有没有这个功能”,而是”这个功能能不能让我放心地把任务交出去”。

四、深测 Tabbit——一个AI原生浏览器的真实体验

Tabbit 是美团旗下光年之外团队出品的AI原生浏览器,2026年3月2日正式公测,从零基于 Chromium 重构。我用了将近一周,下面是真实的测试记录。

场景一:跨网站信息整合

我给它的任务是:分别打开三个科技媒体网站,找到过去一周关于”AI浏览器”的最新报道,汇总成一份简报,注明来源和发布时间。

Tabbit 的 Agent 开始执行后,我能看到它的操作过程——打开网站、滚动页面、识别内容——这种”可视化执行”的体验是我觉得它做得最好的地方之一。你能看到它在干什么,而不是一个黑箱丢给你一个结果。这个设计细节背后有很清晰的产品判断:用户对AI代操作最大的不安全感,来自于”不知道它在做什么”。把执行过程暴露出来,哪怕慢一点,用户的信任感会高很多。

最终它给出了一份简报,格式清晰,来源标注也在。但有一个问题:它漏掉了其中一个网站的内容,原因是那个网站的页面结构比较复杂,它没能正确识别文章列表区域。我尝试重新下达了一次更明确的指令,指定了页面上的具体区域,第二次它成功了。

这个”需要二次指令才能完成”的体验,说明 Tabbit 的 Agent 目前对复杂页面结构的容错能力还不够强——它对标准化页面表现好,遇到非标准布局就需要用户介入。从产品经理的角度看,这是一个”能力边界不够清晰”的问题:用户在第一次失败之前,无法预判哪类页面会出问题。

场景二:结构化数据抓取

任务:打开某招聘网站,抓取”AI产品经理”职位的前20条结果,提取职位名称、公司、薪资范围、工作地点,生成表格。

这个场景 Tabbit 表现得相当不错。它成功打开了目标页面,识别了列表结构,生成的表格数据基本准确。整个过程我没有做任何干预,从下达指令到拿到表格,大概花了不到两分钟。

唯一的小问题是,部分职位的薪资显示为”面议”,它直接填了”面议”而没有做任何标注或处理。这在实际使用中需要自己再过一遍。更理想的处理方式应该是标注”数据缺失”或者单独列出这类条目,让用户一眼就能看到哪些数据需要手动补充。这个细节不影响功能,但影响”可直接使用”的程度。

场景三:跨平台连续操作

这是我测得最仔细的场景,也是结果最让我复杂的场景。

任务:在京东和天猫分别搜索同一款产品,对比价格和库存状态,告诉我哪个平台更划算,然后把更划算那个平台的商品加入购物车(不支付)。

Tabbit 完成了前半段——搜索、对比价格、给出建议——这部分做得很流畅,价格数据准确,建议也有理有据。但到了”加入购物车”这一步,它执行了下单不付款的操作,和加入购物车指令一点偏差,但我已经觉得很不错了。

这个结果的前提是我把两个平台都分别登录好,其实很能说明当前AI浏览器的普遍处境:信息类任务做得不错,操作类任务一到涉及登录态、支付流程、反爬机制的地方就卡住了。这是整个AI浏览器赛道在”执行层”面临的共同瓶颈。

场景四:文档阅读与提炼

任务:打开一份在线PDF年报,提炼出关键财务数据,用表格呈现。

这个场景 Tabbit 表现稳定,成功率高。它能理解文档结构,提炼的数据准确,格式也整洁。我额外追问了几个具体数据点,它都能准确定位并回答。这大概是目前AI浏览器整体上做得最成熟的能力之一,也是我在日常工作中用得最频繁的功能。

整体判断

用了一周之后,我对 Tabbit 的评价是:信息整合和文档处理场景下,它已经是真实可用的工具;跨平台操作和自动化任务,还需要再等等。

它最大的优势是”执行过程可视化”——你能看到它在做什么,这种透明感会大幅降低用户对AI操作的不安全感。最大的短板是操作稳定性,遇到复杂页面或需要登录态的场景,成功率会明显下降。

Tabbit 的 Skill(妙招)功能值得单独提一下。你可以把反复使用的工作流保存成一键调用的快捷指令,比如”每周一早上抓取行业新闻汇总”这类固定任务,设置一次之后直接调用。这个设计思路是对的——它在帮用户建立自己的”AI工作习惯”,而不只是提供一个通用工具。这也是我觉得 Tabbit 在产品哲学上比较清醒的一点:它知道工具的价值不在于功能多,而在于能不能被用户真正用起来。

五、横向参照——其他五款产品的设计逻辑与公开表现

说明一下:受测试条件限制,以下五款产品的数据主要来源于公开媒体测评、官方演示及产品文档,我会在行文中标注出处,并重点从产品设计逻辑的角度来分析,而不是单纯罗列功能参数。

【夸克】

夸克是目前国内AI浏览器里整合深度最高的一款。它依托阿里千问大模型,AI能力渗透到浏览器的各个环节——划词、截图、悬浮球、侧边栏,基本上你在任何页面上做任何操作,都能随时调出AI。

根据公开测评数据(来源:人人都是产品经理平台实测),在豆瓣电影Top250数据抓取测试中,夸克和 Tabbit 都成功完成了任务,但夸克在《泰坦尼克号》评分数据上出现了偏差,Tabbit 的抓取结果与豆瓣实际数据一致。这个细节说明,即便是同类任务,不同产品在数据准确性上的差异是真实存在的,不能只看”完成了没有”,还要看”完成得对不对”。

在跨平台购物比价场景中,夸克的策略是”明确告知无法直接操作,转而提供替代方案”——它会给你整理一份各平台的公开报价清单,而不是假装自己能完成操作然后报错。这个设计选择我觉得是成熟的:知道自己的边界,并在边界内给出最大价值,比假装全能要好得多。 相比之下,Tabbit 在同样的场景下选择了”尝试执行但报错”,两种处理方式各有取舍——夸克更保守但更可靠,Tabbit 更激进但体验不稳定。

夸克还有一个值得关注的细节:它的收藏功能可以把AI搜索、AI写作等应用下的内容单独收藏,而不只是收藏网页链接。这个设计说明夸克在认真思考”用户的工作成果如何沉淀”这个问题,而不只是在做一个用完即走的工具。

夸克的短板是它的AI能力太”夸克化”了——强依赖阿里生态,如果你不在阿里系产品里活动,很多深度功能就发挥不出来。对于已经深度使用钉钉、阿里云盘、淘宝天猫的用户,夸克的整合价值会高很多;对于其他用户,它更像是一个功能很强但生态比较封闭的工具。

【Edge Copilot】

微软在2025年底正式为 Edge 推出 Copilot 模式,是集成路线的代表产品。

它最值得说的功能是 multi-tab RAG——AI可以同时读取你所有已打开标签页的内容,帮你做跨标签页的信息整合和对比。这个能力在实际使用中确实有价值,比如你同时打开了五个竞品的官网,让它帮你列一个对比表,它能做到。微软 CEO 纳德拉公开说他最喜欢这个功能,用来分析微软过去一年在 Nature 上发表的论文——顺带还炫耀了一把,挺微软的。

但整体来看,Edge Copilot 给人的感觉是**”把 ChatGPT 的能力搬进了浏览器,而不是真正重新思考了浏览器应该是什么样子”**。功能不少,但缺乏一个清晰的产品哲学——它到底想帮用户完成什么类型的任务?这个问题在使用过程中始终是模糊的。它的主页变成了 Copilot 对话框,声称”整合了对话、搜索和网页导航”,但实际体验更像是把三件事拼在了一起,而不是真正融合。

另外,Copilot 目前是”限时免费”,背后调用的是 OpenAI 的模型。这个定价策略本身就说明了问题:微软还没想清楚这个产品的商业模式,用户自然也很难把它当成一个可以长期依赖的工具。

【QQ浏览器】

QQ浏览器走的是最典型的集成路线,在原有浏览器框架上叠加AI能力,推出了”网页搜索+模型对话”的双屏功能。

它的目标用户非常清晰:已经在用QQ浏览器、对AI有基础需求但不想换浏览器的用户。这个定位本身没有问题,但也意味着它的 Agent 能力相对有限,更多是在做”AI增强版浏览器”而不是”AI原生浏览器”。对于职场场景下的自动化任务,QQ浏览器目前还不是主要选手。

【Perplexity Comet】

Perplexity Comet 是海外AI原生浏览器里目前最受关注的一款,主打语音实时交互和自主任务执行。

它的产品哲学比较激进:Perplexity CEO 的原话是”浏览器就是构建 Agent 的最佳方式”。他甚至坦言,最初是想让 Perplexity 成为 Chrome 的默认搜索引擎,被拒绝之后才决定自己做浏览器——这个创业动机听起来有点赌气,但逻辑上是通的:与其依赖别人的入口,不如自己做入口。

Perplexity Comet 的目标是让AI真正像人一样操作网页,而不只是回答问题。在语音实时交互方面,它做得比较超前——你可以用语音和它实时对话,它能看到你当前的页面并直接回应,而且支持实时打断,交互体验更接近真实对话。相比之下,国内一些产品的语音交互需要手动点击才能打断,互动性差了不少。

但 Perplexity Comet 有一个非常现实的问题:订阅费 200 美元/月(约合人民币1400元+),而且目前仍处于邀请制阶段,初期仅向 Perplexity Max 订阅用户及部分邀请用户开放。对于国内职场用户来说,这个门槛基本等于劝退。它更像是一个”让人看到未来长什么样”的产品,而不是一个”现在就能用起来”的工具。

【Fellou】

Fellou 是这六款里定位最有意思的一个——它自己说”我不是AI浏览器”。

它的核心能力是 Deep Action 模式:AI接到任务后,会先自己规划步骤,然后逐步执行,生成的报告甚至是一个完整的网页(用代码写出来的),还可以自由调整样式和内容。这种”任务执行结果可视化”的设计思路,和 Tabbit 的”执行过程可视化”是两种不同的产品哲学——前者让你看到结果有多好,后者让你看到过程有多透明。

Fellou 的信息检索能力很强,因为它本质上是一个真正的浏览器,可以直接访问你登录过的网站、抓取数据、甚至向 Notion 等工具写入内容。但”写入”这个动作目前还不够稳定,每一步都要反复确认,实际使用中需要一定的耐心。有用户测试让它新建一个 Notion 页面并填入内容,整个过程花了好几分钟,中间还出现了多次失败重试。这个体验说明 Fellou 的能力上限很高,但工程稳定性还需要打磨。

六、产品力本质——谁在解决真问题,谁在堆砌功能

测完这六款产品,我想说一个可能有点扎心的判断:

当前AI浏览器的 Agent 功能,普遍存在“能力展示”大于“稳定交付”的问题。

你在发布会视频里看到的那些流畅演示,在真实职场环境里,成功率往往要打一个很大的折扣。遇到复杂页面、反爬机制、需要登录态的操作,大多数产品都会在关键一步卡住。

为什么会这样?我觉得根本原因在于,大多数产品的 Agent 设计是”以功能覆盖率为导向”,而不是“以任务完成率为导向”。

这两种导向的差距,在短期内不容易被用户感知——因为大多数人只会在发布会或者第一次体验时测试AI浏览器,而不是把它放进真实的工作流里用一个月。但当你真的开始依赖它,这个差距就会变得非常明显。

举一个具体的例子。我在测试”跨平台比价并加购”这个场景时,六款产品里没有一款真正稳定完成了最后的加购动作。但它们的失败方式完全不同:夸克直接告诉你”我做不到,但我可以帮你整理报价”;Tabbit 尝试执行但在最后一步报错;Edge Copilot 给了你一个看起来很完整的建议,但实际上没有触发任何操作。三种失败,三种产品哲学——第一种最诚实,第二种最透明,第三种最容易让用户误以为任务完成了。

对于职场人来说,“诚实的失败”比“模糊的成功”更有价值。因为诚实的失败让你知道边界在哪里,你可以据此决定什么任务可以交给AI、什么任务还是自己来。模糊的成功则会让你在不知情的情况下依赖了一个不可靠的结果,等发现问题的时候,代价可能已经很大了。

Tabbit 在这方面做得相对诚实——它的执行过程是可见的,失败了会明确告诉你失败了。这种”透明的失败”是我在这轮测评中最看重的产品特质之一。

还有一个更深层的问题值得想一想:AI浏览器和系统级 Agent(比如 OpenClaw 这类可以直接操控本地电脑的工具)之间,到底是什么关系?

从能力上看,系统级 Agent 的上限更高,它不受浏览器沙箱的限制,可以操作本地文件、在不同软件之间切换,完成”打开Excel处理完数据再发送到微信”这类跨应用任务。但它的门槛也更高——部署复杂、调用成本高、一旦出错风险更大。有用户报告 OpenClaw 因为指令理解偏差,自动删除了邮箱里的邮件。这种”失控风险”对普通职场人来说是很难接受的。

对于普通职场人来说,AI浏览器目前仍然是更现实的选择。它的门槛低、场景清晰、失控风险小,更重要的是它的工作场景和你的日常工作流天然重合——你本来就在浏览器里工作,AI在里面帮你,比让AI去操控你的整台电脑要自然得多。只是它需要在”能力边界”上更诚实地告诉用户:我能做什么、不能做什么、在什么情况下你应该自己来。

七、结尾——写给还在等待的打工人

回到开头那个周四下午。

测完这六款产品之后,我重新做了一次类似的竞品调研任务,这次用 Tabbit 来辅助。结果是:它帮我完成了大约60%的信息抓取工作,剩下的40%我还是需要自己来——主要是那些结构复杂的页面,以及需要登录才能看到的内容。

两个小时变成了大约一个小时出头。这个结果说不上惊艳,但确实有用。

如果你现在就想开始尝试,我的建议是:信息整合和文档处理类的任务,Tabbit 和夸克都已经值得放进你的工作流;跨平台操作和自动化任务,再等等,这个赛道还在快速进化。

如果你愿意再等等——我觉得这个赛道正在往正确的方向走。真正的解放双手不是一个花哨的功能,而是一种确定性。当 AI 浏览器能让你在把任务交出去之后,不再需要反复检查结果是否正确,不再担心它会在哪一步突然断片,那才算真正走通了。

我们还没到那一步,但已经能看到轮廓了。

最后,这篇文章的实测主要集中在 Tabbit 上,其他几款产品的判断难免有信息差。如果你正是 Perplexity Comet、Fellou 或者其他 AI 浏览器的重度用户,非常欢迎在评论区分享你的真实翻车或真香瞬间。在这个 AI 快速迭代的时代,我们每个人的实测,都是在帮彼此避坑。

本文由 @AI宇宙NPC小文 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!