Chrome 推出 Skills 新功能,Agent 重塑上网方式
浏览器正经历从"展示窗口"到"AI代理"的范式转变——Google Chrome推出Skills功能让用户保存复用AI提示词,OpenAI Atlas以"Browser Memories"实现跨会话上下文延续,微软Edge将Copilot升级为"Auto Browse"自主操作网页。三条路线殊途同归:Chrome赌用户惯性(渐进叠加AI能力),Atlas赌迁移意愿(AI原生浏览器接管80%日常运营),Perplexity Comet赌场景切入(多模型协作做深度研究)。

2026 年 4 月 14 日,Google 给 Chrome 浏览器加了一个 Skills 的新功能——用户可以把常用的 AI 提示词存下来,下次在任何网页上一键复用。同一周,OpenAI 的 AI 原生浏览器 Atlas 在 macOS 上开放使用,微软也正在把 Edge 里的 Copilot,从能聊天的 AI继续往能代做网页任务的 AI推进,原来的 “Actions in Edge Preview” 被改成了 “Auto Browse”。
这一连串动作背后指向的是同一件事:浏览器正在经历一次范式转变。过去二十多年里,浏览器的基本工作模式基本没怎么变——用户输入网址或关键词,浏览器展示网页内容,剩下的靠用户自行阅读、点击、填写。
无论是从 Netscape 到 Chrome 的霸主更替,还是从桌面端到移动端的平台迁移,浏览器的角色始终是一个展示窗口。但现在,科技巨头和新兴公司正在竞相回答一个全新的问题:浏览器的下一步,是继续帮用户看网页,还是直接替用户操作网页?
Chrome Skills 背后的战略布局
乍一看,Chrome Skills 并不复杂。你在 Chrome 里跟 Gemini AI 聊天时,觉得某个提示词好用,就能直接从聊天记录里把它存成一个 “Skill”。之后只要输入 / 斜杠命令或者点 + 按钮就能调出来,它会在你当前看的网页上运行,也能同时跨多个标签页工作。

Google 还配套上线了一个 Skills 预设库,覆盖了生产力、购物、食谱、预算管理这些常见场景,你可以直接拿来用,也可以改提示词让它更贴合自己的需求。用户访问 chrome://skills/browse 就能浏览所有可用的 Skills。

但这个功能的战略意义,远不止表面看到的那么简单。
先看时机。Chrome 推 Skills 的背景,是一堆新对手正在涌入浏览器赛道。TechCrunch 指出,Gemini 在 Chrome 里的深度集成,就是在 OpenAI、Perplexity、The Browser Company 等公司扎堆推 AI 原生浏览器的压力下加速的。Chrome 的全球市占率虽然还是第一,但它的优势从来没像现在这样,被 AI 赛道的新物种从根基上动摇过。
再看路径选择。Google 没有另起炉灶搞一个全新的 AI 浏览器,相反,它在 Chrome 的庞大用户盘子上一层层叠 AI 能力。2025 年底嵌入 Gemini 侧边栏,2026 年初上线 Auto Browse ,4 月又推出 Skills——每一步都很克制,降低用户的学习成本的同时,一点点扩大 AI 在浏览过程中的参与度。
值得一提的是 Skills 在安全上的考量。跟其他 Gemini 功能一样,Skills 在执行敏感操作,比如发邮件、加日历之前,都会先弹窗找你确认。这个设计说明 Google 心里很清楚,Skills 不只是一个辅助工具,它其实在为更深层的 Agent 操作铺路——只不过眼下选了一条更稳、更可控的渐进路线。
Google 在早期测试中发现,用户最常创建的 Skills 集中在三个方向:健康营养(快速算食谱里的蛋白质含量)、购物比价(跨标签页生成规格对照表)、文档处理(扫描长文提取关键信息)。这三类场景正好对应了普通人上网最高频的需求,也间接验证了可复用 AI 工作流这件事确实有真实的用户需求在支撑。
三条路线的不同赌注
如果说Chrome Skills代表了”在老地基上盖新楼”的思路,OpenAI 和 Perplexity 则分别代表了另外两种截然不同的战略选择。
Atlas:另起炉灶,AI 就是浏览器本身
OpenAI 的 Atlas 已经在 macOS 上可以用了,它把 ChatGPT 直接做进了浏览器的底层。根据 CNET 的评测,Atlas 最大的差异化功能叫 “Browser Memories”——AI 能记住你在不同网页上的浏览上下文和任务进度,下次打开还能接着来。
更核心的是它的 “Agent Mode”。开启这个模式后,AI 可以在你的监控下自主完成一系列网页操作:扫内容找灵感、起草文案、把产出整理成文档、审计落地页、清理收件箱、采购前自动对比不同工具,甚至根据你的历史操作重建整套工作流。
此外,Atlas 瞄准的痛点很明确——上下文切换。传统方式下,用户得在搜索引擎、AI 对话窗口、文档编辑器、邮件客户端之间来回跳,每跳一次上下文就断一次,信息要手动搬来搬去。这个问题对独立创业者和小团队尤其致命:一个人同时要管策略、做内容、跑运营、回客户,任务之间频繁切换成为了巨大的效率黑洞。
Atlas 想做的事很简单——把研究、写作、编辑、任务管理全揉进一个连续的 AI 浏览环境里,从根上消灭上下文断裂。根据其早期用户反馈显示,Atlas 可以接管一个独立创业者大约 80% 的日常运营工作。
Comet:从”搜索”到”研究”的跃迁
Perplexity 的 Comet 走的是第三条路,专注于帮使用者理解互联网上的信息。如果说 Atlas 的核心价值是操作自动化,那么Comet 的就是知识提取。
Comet 的典型使用场景是替代那些需要打开二十个标签页、逐一阅读比对的研究工作。用户给出一个研究问题,Comet 自主打开多个页面、分析内容、综合结果,直接输出研究报告。
Perplexity 在前几个月还推出了名为 Computer 的多模型协调引擎。Computer 能把复杂任务拆成多个子任务,再分给最合适的 AI 模型去做——Anthropic 的 Claude 负责核心推理,Gemini 跑深度研究,Grok 接轻量快速任务,ChatGPT 处理长上下文记忆。
这套架构的底层逻辑和企业里的分工其实是一样的。让最擅长推理的做推理,最擅长视觉的做图像理解,最快的做轻量任务。没有一个通才模型能在所有维度上都做到最好,但一组专精模型协同起来,整体表现就能大幅提升。这意味着 AI 浏览器已经开始往 AI 任务操作系统的方向长了。
把三条路线放在一起看,可以发现,Google 赌的是惯性——你已经在用 Chrome 了,加点 AI 不用你换地方,Gmail、日历、地图全打通,走得稳但转身也慢。OpenAI 赌的是迁移意愿——如果 AI 体验足够好,用户愿意为此换一个全新浏览器,哪怕扩展、书签、密码管理都要重头来过。Perplexity 赌的是场景切入——不跟前两家争”通用浏览器”这口饭,先把研究场景吃透,用多模型协作和信息综合做出差异化,再看能长多大。
三种赌法各有各的风险。Chrome Skills 被自家产品框架卡住了天花板,Atlas 面临真金白银的迁移门槛,Comet 则要应对 Amazon 已经打上门来的版权诉讼。但有一点是共通的:它们都在试图把浏览器从一个被动的展示工具,变成一个主动替用户干活的系统。差别只在于这个”干活”到底由谁发起、走多深、边界画在哪。
浏览器正在发生的三重变化
将视野从个别产品拉远,可以看到整个浏览器行业正在经历三个层面的结构性变化。
1)从”找信息”到”办事”
2026 年之前,浏览器的核心角色是信息获取入口——你主动搜、主动看,所有动作都由人来驱动。AI 代理浏览器正在把这个关系翻过来:你只要说清楚想要什么结果,AI 自己规划路径、操作网页、完成任务。以前的说法是”帮我打开浏览器查一下”,现在变成了”告诉 AI 你要什么”。
这个演进可以被归纳成四个阶段:2000 年代手动浏览、2010 年代搜索加 App、2020 年代 AI 问答助手、2026 年开始 AI 自主执行。浏览器从”人操作的工具”变成了”为人干活的代理”。换句话说,浏览器的价值衡量标准已经从”能展示多少信息”变成了”能替你办多少事”。
2)从标准化工具到个性化系统
Chrome Skills 就是这一趋势的缩影。当你攒起了一套自己的 Skills 库,你的 Chrome 和别人的 Chrome 已经不是同一个东西了。你的可能擅长食谱转换和营养计算,我的可能专精技术文档摘要和竞品分析——同一个浏览器壳子,跑着完全不同的个性化工作流。
Microsoft Edge 也在走类似的路:Auto Browse 给了 Light、Balanced、Strict 三档安全级别,让用户自己决定 AI 能操作到什么程度。而 Edge 正在测试的浮动 Copilot 工具栏更进一步,把 AI 嵌进了右键菜单——选中文字或图片后右键一点,就能直接摘要、解释、改写。
3)浏览器成为AI分发的主战场
过去两年,AI 主要靠独立 App、API 接口和开发者工具来触达用户。但 2026 年的趋势很明显:浏览器正在成为 AI 能力到达终端用户的最短路径。原因不复杂——浏览器是几乎所有人每天都会打开的软件,把 AI 直接塞进去,比让用户下载一个新 App 或学一套 API 的触达效率高得多。
Google 靠 Chrome、Microsoft 靠 Edge、OpenAI 靠 Atlas,各自把自家 AI 模型的能力直接送到数十亿用户面前。一位 LinkedIn 上的行业观察者估算,2026 年全球 LLM 用户市场份额中,ChatGPT 占约 60%,Gemini 占约 15%,Copilot 占约 13%——而浏览器作为这些 AI 能力的直接载体,正变成决定谁拿到多少份额的关键战场。谁的浏览器装机量大、谁的 AI 嵌入得深,谁就能占住用户日常使用 AI 的第一入口。
AI 浏览器还远未成熟
愿景很理想,但 2026 年的 AI 浏览器赛道还有一堆硬骨头没啃下来。
可靠性还是最大的坎。 根据 Medium 上一篇综合评测的实测结论,即使是表现最好的 AI 浏览器,跑复杂多步骤任务时的失败率还在 10% 到 40% 之间。对于金融操作、医疗信息查询这类容不得出错的场景,这个可靠性离”能用”还差得远。
安全风险很现实。 代理型浏览器要读网页内容、还要替你操作,这天然带来了提示注入的攻击面——恶意网页可以在页面里埋特定文本来诱导 AI 做出错误操作。Edge 的 Auto Browse 为此设计了三级安全模式,不同级别下 AI 需要拿到不同程度的用户授权才能跟网站交互;Atlas 的 Agent Mode 也走的是”先请示、后动手”的路子。但安全研究圈对这些防护到底够不够硬,态度普遍还是保守的。
费用和信任是两道并行的门槛。 大多数高级 AI 浏览器功能都需要付费订阅,价格从每月 20 美元到 200 美元不等,底层 API 调用还要额外花钱。但比费用更难跨过的是信任——”你愿意让一个 AI 登录你的银行账户自己转账吗?”绝大多数人的回答还是不愿意。
覆盖面也是个问题。 Chrome Skills 初期只支持桌面端,而且浏览器语言得设成英语才能用。Atlas 目前也只有 macOS 版,Windows 和移动端的时间表还不确定。也就是说,在相当长一段时间内,这些最前沿的 AI 浏览器功能只能覆盖一小部分用户,大多数人还停在传统浏览体验里。技术前沿和用户现实之间的差距,可能比产品发布节奏还要更慢地弥合。
尽管问题不少,赛道的方向已经不可逆了。当 Google、OpenAI、Microsoft、Perplexity 在同一个季度密集发布 AI 浏览器功能时,真正被改写的是人和互联网之间维持了二十多年的交互契约。而这场改写,才刚刚开始。
本文由人人都是产品经理作者【江天 Tim】,微信公众号:【有新Newin】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!

起点课堂会员权益




