当大厂与极客都在抢“技能”:拆解Agent Skills的现在、方法与未来
Agent Skills的爆发正在重新定义AI与人类的协作方式。从Anthropic的开放标准到微软的'技能市场',这场标准化革命让AI从'纸上谈兵'进化为'实干专家'。本文深度解析技能封装如何解决用户重复解释、开发者成本困境和产品僵化三大痛点,并揭示从个人提效到产品重构的三级应用场景。

2026年初,对于身处互联网和AI浪潮的我们而言,显得尤为不同寻常。如果说过去几年我们习惯了新模型或应用按季度刷新认知,那么今年1月的这波热潮,更像是一次底层“游戏规则”的集体升级。引爆点源于一个朴素的词汇——“技能”(Skills)。
一切始于Anthropic的开发者更新。他们宣布将Agent Skills作为开放标准,允许将复杂、可复用的能力封装为独立的“技能包”。这一举动瞬间激起行业千层浪:OpenAI迅速更新路线图,Google各团队宣布整合类似框架,微软在Copilot预览版上线“技能市场”,字节跳动旗下的Coze也迅速跟进,将“技能”功能推向核心,成为产品经理和AI爱好者的新演练场。
风潮迅速蔓延至开发者社区。GitHub上,“-skill”后缀的新仓库呈指数级增长,热度堪比当年的Docker或Vue.js。技术博主不再局限于分享提示词,转而连载“技能”构建教程;产品经理社群的焦点也从单一功能体验,转向探讨是否将核心流程封装为对生态开放的Skill。
这种热度真实可感,弥漫在晨会、行业交流与社交媒体中。喧嚣之下,核心问题浮现:这究竟是大厂主导的概念炒作,还是一场真正的“能力封装”范式革命?这是否标志着人机协作正从“手工作坊”时代,迈向标准化的“工业生产”时代?
本报告旨在剖析“技能”爆火背后的深层逻辑。这不仅是技术圈的狂欢,更关乎每一位从业者的未来工作模式,以及我们所构建产品的终极形态。
一、什么是Agent Skills(智能体技能)?
通俗来讲,Agent Skills(智//能体技能)就好比给 AI 这个“最强大脑”装上了“灵活的双手”和“全能工具箱”。我们可以通过以下三个层面来拆解:

1. 核心比喻:从“空谈”到“实干”
大模型(LLM)是“大脑”: 它博学多才,能陪聊、写诗、讲道理。但本质上,它被困在服务器里,无法接触外部世界。它“知天下事”,却“难行一步”。
Agent Skills 是“双手”与“工具”: 它们是封装好的执行能力,让 AI 能采取具体行动。
有了 “搜索 Skill”,AI 就能联网查询实时天气,而非凭空猜测。
有了 “绘图 Skill”,AI 就能直接生成海报,而非仅用文字描述。
有了 “Excel Skill”,AI 就能打开表格进行复杂计算,而非只提供公式。
2. 场景对比:以“订机票”为例
没有 Skills 的 AI(纯大模型):
你: “帮我订张明天去北京的票。”
AI: “抱歉,我只是语言模型,无法联网或交易。建议您去携程或机场购买。”
(评价:懂道理,但干不了活)
搭载“订票 Skill”的 AI(Agent):
你: “帮我订张明天去北京的票。”
AI(调用技能): [联网查航班] → [比价] → [调用支付接口]
AI: “已查到明天上午10点国航CA1234航班最合适,票价800元,需要现在下单吗?”
(评价:不仅懂,还能把事办了)
3. 为何在2026年爆发?
正如前文所述,这波热潮的核心在于“标准化”与“封装”。
积木化: 以前开发 AI 功能繁琐,现在开发者将“查股票”、“发邮件”、“控家电”等功能做成了标准的“Skill 积木”。
即插即用: 想要一个金融 AI?无需重新训练大脑,只需将“金融分析”和“股票查询”的积木插入模型,它便即刻化身金融专家。
一句话总结:
Agent Skills 将“能力”封装为“插件”,让 AI 从只会纸上谈兵的“百科全书”,进化为能操作软件、控制设备、处理业务的“全能管家”。
二、洞察:热潮背后,解决的核心痛点是什么?
任何技术热潮的兴起,都不是空穴来风,其背后必然对应着现实世界中亟待解决的、足够普遍的痛点。Agent Skills之所以能迅速获得全行业的共鸣,正是因为它精准地切中了当前AI应用在用户、开发者和产品三个层面上的核心困境。它不是一个被发明出来的需求,而是对既有问题的一次系统性回应。

用户之痛:厌倦了无休止的“重复解释”
作为普通用户,我们与AI的交互正在陷入一种新的“数字疲劳”。我们欣喜于大模型强大的通用能力,却也苦恼于它的“健忘”和“缺乏默契”。想象一下这个场景:你每周都需要撰写一份格式完全固定的周报,内容包括“本周完成事项”、“数据表现”、“下周计划”和“风险与求助”。每一次,你都需要向AI详细描述这个结构,提供数据源,并反复强调输出的口吻和细节。这本质上是在“重复解释同一件事”。
这种体验的痛点在于,用户的宝贵经验和工作流程无法被有效沉淀和复用。我们需要的不是一个每次都要从零开始教的“实习生”,而是一个能够记住我们偏好、理解我们工作流程的“专家助手”。用户渴望的,是一种可一键调用的“专家经验包”,一次配置,永久受益。Agent Skills恰好满足了这种需求,它能将“写周报”这个完整的、包含格式、数据源、风格的流程,固化成一个可随时唤醒的“技能”。
开发者之痛:在成本、性能与灵活性间“走钢丝”
对于开发者而言,痛苦则更加具体和技术化。在Skills出现之前,我们主要通过两种方式让AI执行复杂任务:
其一是“长提示词工程”(Mega-Prompting)。我们将所有可能的指令、背景知识、示例、约束条件全部塞进一个庞大的提示词中。这种方法的弊端显而易见:首先,它极大地挤占了宝贵的上下文窗口(Context Window),导致处理长文档或多轮对话时捉襟见肘;其次,每次调用都传输海量的Token,使得API调用成本居高不下;最后,超长提示词往往会变得非常“脆弱”,微小的改动就可能导致模型输出结果的剧烈波动,稳定性难以保障。
其二是为每个特定场景训练一个专属的Agent或垂直模型。这种方式虽然效果好,但成本高昂到绝大多数团队都无法承受。数据标注、模型微调、部署维护……这一系列操作不仅需要巨大的资金投入,更需要顶尖的算法人才,这显然不是一个可以规模化的解决方案。
Agent Skills的出现,提供了一条优雅的“中间路线”。它允许开发者将复杂的逻辑和重量级的参考资料剥离出提示词本身。正如一份深度分析文档中所强调的,通过“从工具到技能”的语义进化,我们将关注点从“调用一个API”转变为“执行一个封装好的完整流程”[1]。这种封装,系统性地解决了开发者在成本、性能和灵活性之间的“三角难题”。
产品之痛:僵化的功能无法拥抱真实世界的复杂性
从产品设计的角度看,我们正面临一个尴尬的局面:一方面,我们希望打造出足够智能、能够应对万千变化的AI Native产品;另一方面,我们交付给用户的,却往往是一系列固化的、预设好的功能按钮。一个“一键总结”功能,可能无法区分用户是想生成会议纪要,还是提炼论文核心观点;一个“数据分析”功能,可能在面对一个略有不同的表格格式时就彻底失灵。
AI产品的价值,恰恰在于处理那些“非标准”的、充满“边缘情况”(Edge Cases)的真实世界任务。而传统的产品设计范式,在灵活性和适应性上已经力不从心。Skills范式提供了一种全新的解法。它将产品能力“组件化”、“生态化”。产品本身可以是一个轻量级的Agent基座,而其具体功能则由一系列可插拔、可组合、甚至可由用户自定义的Skills来定义。这种架构使得产品能够灵活应对复杂多变的真实场景。正如相关研究指出的,通过引入“渐进式披露”(Progressive Disclosure)机制,AI可以在需要时才加载和执行特定技能的细节,从而在保持界面简洁的同时,赋予产品深不可测的能力[1]。这正是从“功能集合”迈向“能力生态”的关键一步。
三、方法:如何构建一个真正有用的“技能”?——从想法到交付的三层心法
理解了“为什么”需要Skills之后,更关键的问题是“如何”构建一个真正有价值的Skill。这不仅仅是写几行代码或一个提示词那么简单,它需要一种融合了产品思维、架构设计和工程实践的系统性方法。以下,我们将构建一个有效Skill的过程,提炼为从想法到交付的三层心法。

心法一:精准定义——从“工具箱”到“专家SOP”
构建Skill的第一步,也是最容易犯错的一步,就是对“技能”的定义。一个常见的误区是,将Skill等同于一个孤立的工具或API调用。例如,设计一个名为“表格处理”的Skill,听起来很美好,但在实践中往往毫无用处,因为它太模糊了。用户到底想做什么?是提取数据、转换格式、还是生成图表?
一个真正有用的Skill,其本质不是一个“工具”,而是一个封装了专家经验的“标准作业程序”(SOP)。它必须是具体的、场景化的。正如一份案例分析中提到的 `excel_data_extract` 技能[1],它的成功之处就在于其定义的精准:它不叫“Excel处理”,而是明确指向“从格式不规则的Excel文件中,提取指定列名(如‘姓名’、‘销售额’)的数据,并以JSON格式输出”。
这个定义包含了构建一个专家SOP的关键要素:
- 明确的输入(Input):格式不规则的Excel文件,以及用户想要提取的列名。
- 明确的输出(Output):结构化的JSON数据。
- 清晰的执行逻辑(Process):它封装了“何时用”(当需要从混乱表格中抓取数据时)、“怎么用”(告诉它文件名和列名即可)、以及“异常怎么办”(如果找不到列名或文件格式不支持,应该如何报错或提示)。
因此,在构思你的Skill时,请忘掉“工具箱”思维。你应该问自己:我正在试图将哪一位领域专家的哪一项具体工作流程,封装成一个AI可以独立执行的S-O-P?这个SOP越具体、越贴近真实的工作流,你的Skill就越有价值。
心法二:智能架构——善用“渐进式披露”的威力
定义了清晰的SOP后,我们进入架构设计阶段。一个优秀的Skill架构,核心在于如何以最低的成本(尤其是Token成本)和最高的灵活性,将SOP的全部信息传递给Agent。这正是“渐进式披露”(Progressive Disclosure)机制大放异彩的地方。
这一机制的核心思想是“按需加载”,避免在第一时间将所有信息都塞给模型。一个标准的Skill包通常包含三层结构,每一层都在恰当的时机被“披露”给Agent:
- 元数据(Metadata):这是Skill的“名片”,通常在 `SKILL.md` 或类似的定义文件中以YAML格式存在。它只包含最核心的信息,如技能名称、一句话描述、输入输出参数等。Agent通过扫描这层信息,就能快速判断在当前场景下,这个Skill是否可能有用。这部分信息极小,Token消耗几乎可以忽略不计。
- 指令(Instructions):当Agent初步判断某个Skill可用时,它才会去加载 `SKILL.md` 中更详细的指令部分。这里通常是用自然语言描述的、分步骤的执行指南,是SOP的核心逻辑。它告诉Agent“拿到输入后,你应该先做什么,再做什么”。这部分内容是提示词的主体,但只在“被选中”时才加载。
- 资源(Resources):这是实现极致Token节省的关键。对于那些非常长的参考文档、复杂的代码脚本、大量的示例(few-shot examples),我们不应将它们直接写入指令。而是将它们作为独立文件存放在 `resources/` 或 `scripts/` 文件夹中。在指令中,我们只引用它们,例如:“如果用户需要进行情感分析,请调用 `scripts/sentiment_analysis.py` 脚本”或“请参考 `resources/style_guide.md` 中的格式要求生成报告”。只有当执行到这一步时,Agent才会去读取相应的文件内容。
善用这种三层架构,意味着你可以构建出异常强大的Skill,而无需担心上下文窗口爆炸。你可以将整个团队几万字的API文档、几十个代码片段、上百个优秀案例,都作为“资源”打包进去,让Agent在需要时精准调用,实现真正的“能力杠杆”。
心法三:工程化思维——为协作与安全而设计
当你的团队开始构建不止一个Skill时,就必须引入工程化思维。单点的、孤立的Skill价值有限,一个可复用、可组合、可协作的“技能系统”才是最终目标。
- 为协作而设计: 这意味着需要建立团队内统一的“数据交换标准”。如果“用户分析Skill”输出的用户画像数据,无法被“营销文案Skill”直接读取和理解,那么这两个Skill就无法形成工作流,价值大打折扣。因此,需要提前约定好技能之间传递数据的格式(如统一使用JSON)、关键字段的命名规范等。这就像定义软件模块之间的接口(API)一样重要。
- 为安全而设计: 随着Skill变得越来越强大,尤其是当它们能够执行代码、调用外部API或操作文件时,安全问题便成为不可忽视的生命线。一份关于AI安全的内部文档曾发出警告,必须警惕各类“安全陷阱”[1]。例如:
- 代码注入(Code Injection): 如果你的Skill会执行由用户输入内容拼接成的代码,那么恶意用户可能通过输入一段恶意代码来控制你的系统。
- 提示词注入(Prompt Injection): 用户可能会通过巧妙的指令,诱导你的Skill忽略原始指令,转而执行用户的恶意指令,比如泄露 `resources/` 文件夹中的敏感信息。
因此,在设计Skill时,必须将安全作为一等公民。对所有用户输入进行严格的清洗和校验;使用权限最小化原则,确保Skill的执行环境是沙箱化的,只能访问它被明确授权的资源;对Skill执行的敏感操作(如写文件、调用付费API)进行明确的日志记录和审计。一个不安全的Skill,能力越强,破坏性越大。
四、实战:三级应用场景,从个人提效到产品重构
理论和方法最终要落地于实践。Agent Skills的真正魅力在于其广泛的适用性,它能够在个人、团队和产品三个不同层级上,创造出看得见、摸得着的价值。下面,我们将通过一系列具体的实例,展示Skills如何重塑我们的工作与产品。

个人层:打造你的“AI副驾驶”
在个人层面,Skills是实现“能力复利”的最佳工具。它能将我们从大量重复、琐碎但又必须遵循特定模式的工作中解放出来。这就像为自己配置了一系列高度定制化的“AI副驾驶”。
以文档中提到的 `Article-Copilot`(写作副驾驶)为例[1]。作为一个内容创作者,我可能有一套固定的写作流程:先根据主题生成大纲,然后对每个章节进行扩写,接着寻找合适的配图和引用,最后根据我的个人风格进行润色。过去,每写一篇文章,我都得把这套流程对AI复述一遍。现在,我可以将整个流程封装成一个 `Article-Copilot` Skill。当我需要写作时,只需对Agent说:“嘿,用我的写作副驾驶,帮我写一篇关于‘技能经济’的文章。”Agent便会自动执行预设的SOP,一步步完成文章的创作,而我则可以专注于更高阶的创意和思想提炼。
另一个强大的例子是 `AI-Partner`(记忆伴侣)[1]。我们可以创建一个Skill,让它定期读取我们指定的笔记、聊天记录或工作文档,并按照我们定义的逻辑(例如,按项目、按人物、按时间线)进行整理和索引。当我们想回忆“上次和张三开会讨论的关于A项目的结论是什么?”时,不再需要在海量信息中手动搜索,只需向我们的“记忆伴侣”提问,它就能精准地给出答案。这个Skill固化了我们管理个人知识库的工作流,极大地降低了信息检索和关联的认知负荷。
团队层:固化团队知识资产
在团队协作中,最大的内耗之一往往来自于知识的流失和规范的难以统一。新员工不知道报告该用什么模板,不同工程师写的技术文档风格迥异,宝贵的项目复盘经验随着人员流动而消失。Skills为解决这一难题提供了绝佳的方案——固化团队知识资产。
我们可以设想一个名为 “技术文档生成Skill” 的应用场景。这个Skill内部封装了团队所有的知识资产:
指令(Instructions):定义了撰写一篇标准技术文档的完整步骤,例如“首先,描述该模块的设计目标;其次,用UML图展示其架构;再次,详细说明每个API的参数和返回值;最后,提供一个代码示例。”
当团队中的任何成员(无论是新员工还是资深工程师)需要撰写技术文档时,他不再需要四处寻找模板和规范。他可以直接调用这个Skill,甚至让AI辅助他完成大部分内容的填充。AI会严格遵循Skill中定义的规范和术语,确保最终输出的每一份文档都质量统一、格式标准。这个Skill,实质上成为了团队知识的“活的”载体,它不仅沉淀了知识,更保证了知识在每一次实践中都被正确地应用,极大地提升了团队的协作效率和产出质量。
产品层:重构AI Native产品体验
在产品层面,Skills带来的变革是颠覆性的。它预示着下一代AI Native产品体验将从“功能集合”演变为“能力生态”。
让我们以文档中对AI Native笔记应用的展望为例[1]。传统的笔记应用,如Notion或Obsidian,其核心是一个强大的编辑器,辅以各种“Block”或“插件”功能。用户需要主动去学习和使用这些功能。而在Skills范式下,未来的笔记应用可能完全是另一番景象。
它的核心可能是一个“通用Agent”,而产品本身则提供一个基础的“笔记Skills”集合,并开放一个“技能商店”。当用户输入一段凌乱的想法时,比如“下周要准备Q1复盘会,数据在A表格,需要展示增长趋势,还要跟进B项目风险”,他不需要手动去创建待办事项、关联表格、绘制图表。他只需将这段话输入。背后的通用Agent会自动分析这段文本的意图,然后判断并调用一系列不同的Skills来处理:
- 调用 “任务拆解Skill”,将“准备Q1复盘会”分解为具体的待办事项。
- 调用 “数据关联与图表生成Skill”,自动读取A表格,并根据“增长趋势”的指令生成图表。
- 调用 “风险跟踪Skill”,为“B项目风险”创建一个高亮提醒。
- 甚至调用 “语法与风格纠错Skill”,将用户随手记录的口语化表达优化成更正式的书面语。
在这个模型中,产品不再是一个被动等待指令的工具箱,而是一个主动理解、主动服务的智能伙伴。产品的边界被极大地拓宽了,其能力不再受限于开发团队预设的功能,而是可以通过不断增长的技能生态无限扩展。这正是Skills范式对产品重构的深刻意义所在:它让产品真正拥有了“成长”和“进化”的能力。
五、未来:技能经济、生态博弈与我们的行动清单
当我们站在2026年初这个时间点,审视Agent Skills所掀起的波澜,其影响绝不止于当下的技术实现和应用场景。它正在催生一个全新的智能生态,并为所有身处其中的参与者,无论是巨头公司还是个人开发者,带来了新的机遇与挑战。我们需要将视野拉得更高,去展望由Skills驱动的未来趋势,并思考我们当下的行动策略。

趋势展望:生态之争、技能经济与新协议的诞生
生态之争:智能体时代的“操作系统”与“应用商店”。 Anthropic、OpenAI、微软、Google等大厂之所以如此迅速地布局Skills生态,其深层逻辑昭然若揭。他们争夺的,不仅仅是一个技术标准,而是未来智能体时代“操作系统”的主导权。一个强大的Agent基座模型,就像是iOS或Android系统内核;而一个繁荣的Skill Store(技能商店),则对应着App Store。谁的Skills标准成为事实上的行业规范,谁的技能商店拥有最丰富、最高质量的技能,谁就能吸引最多的开发者和用户,从而构建起最强大的生态壁垒。这是一场关乎未来的平台级战争。
技能经济(Skill Economy)的崛起。 随着技能商店的成熟,一个全新的商业模式将应运而生。领域专家,例如顶尖的销售、律师、财务分析师、心理咨询师,他们最宝贵的资产——专业知识和工作流程——将可以通过Skills的形式被产品化和规模化。未来,我们可能会看到一个充满活力的技能市场:企业可以按需订阅“合规审查Skill”或“市场分析Skill”,个人用户可以为自己的Agent购买“个人理财Skill”。计费模式也将更加灵活,可能出现按调用次数付费、按最终产出结果付费等多种形式。这将极大地释放非技术背景专家的生产力,他们可能成为这个新经济体中最大的“技能创造者”。
MCP成为“新HTTP”。 如果说Skills是跑在智能生态之上的“智能应用”,那么必然需要一个底层的“传输协议”来连接不同的Agent和Skills。我们或许可以预见一种名为“模型上下文协议”(Model Context Protocol, MCP)的出现。它可能像HTTP协议定义了网络信息的传输规范一样,定义Agent之间如何交换上下文、传递指令、调用技能、返回结果。当MCP成为行业标准,一个真正开放、互联的全球智能体网络才可能形成,其深远影响将不亚于当年互联网的诞生。
行动清单(Now):给所有从业者的三点建议
面对奔涌而来的趋势,观望和等待是最危险的策略。无论你是什么角色,现在都应该立即行动起来。这里有一份给所有互联网从业者的行动清单:
给所有从业者:立即体验。 理论和分析永远无法替代亲身体验。不要只停留在阅读文章,立即去一个已经支持Skills的平台(如Coze平台),找到一个与你工作相关的现有Skill,试用它,感受它的工作模式。亲自体验一下,从“向AI解释一切”到“调用一个Skill”的转变,究竟有多么不同。这种体感,是理解这场变革最直接的方式。
给创造者(产品、运营、技术):动手制作。 梳理一下你日常工作中,最高频、最让你感到重复和烦躁的“解释性”流程是什么?是每周整理数据报告?是每月撰写项目总结?还是每天回复同类型的用户问题?选择其中一个,哪怕它很小,然后尝试使用skill-creator或类似工具,将这个流程制作成你的第一个Skill。这个过程会让你深刻理解SOP定义、架构设计和工程化思维的重要性。
给思考者(产品/战略):重新评估。 以Skills的视角,重新审视你正在负责的产品或业务。问自己几个问题:我的产品中有哪些功能可以被“技能化”,从而变得更加灵活和强大?我的产品是否有可能从一个提供封闭功能的“孤岛”,转变为一个能够接入外部技能、甚至自身能力也能作为技能输出的“开放生态”的一部分?这种思维转变,可能会为你的产品战略打开一扇全新的大门。
结语:从“提示词博弈”到“能力工程”
回顾Agent Skills在短时间内的爆火,我们可以清晰地看到一条AI应用开发范式的进化路径。它标志着我们正在从一个“技巧时代”,迈向一个“工程时代”。
过去,我们痴迷于“提示词博弈”(Prompt Engineering),我们像炼金术士一样,不断尝试和组合词语,试图在与模型的随机性博弈中,偶然“炼”出理想的结果。这是一种高度依赖个人技巧、不稳定且难以规模化的手工作坊模式。
而Agent Skills的出现,则将我们推向了“能力工程”(Skill Engineering)的新阶段。在这个阶段,我们的核心工作不再是与模型的模糊性作斗争,而是将人类清晰的、结构化的专家知识,通过工程化的方法,封装成可复用、可组合、可依赖的“能力单元”。这是一种系统性的、可规模化的工业生产模式。
对于所有互联网从业者而言,这一转变的意义是深远的。它意味着我们的角色正在发生根本性的变化:我们不再仅仅是AI工具的“使用者”,疲于追赶层出不穷的新功能;我们正在成为智能能力的“架构师”,设计和定义AI如何工作;我们更将成为未来智能生态的“搭建者”,我们创造的每一个高质量Skill,都可能成为这个新世界的一块基石。
变革的号角已经吹响,从“博弈”到“工程”的迁徙已经开始。现在,是时候思考那个最终的问题了:
你,准备将你的哪一项专业知识,封装成下一个改变游戏规则的Skill?
参考资料
综合行业分析与内部研究文档(2026)。本文中关于“渐进式披露”、“从工具到技能”的语义进化、`excel_data_extract`案例、`Article-Copilot`与`AI-Partner`应用实例、AI Native笔记应用展望及“安全陷阱”警示等观点和案例,均引用自相关行业深度分析材料。
本文由 @姚小姚 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
- 目前还没评论,等你发挥!

起点课堂会员权益




