每个没用到的Skill，都在悄悄收你的租

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

每个没用到的Skill，都在悄悄收你的租

智火流辉

2026-05-13

0 评论 84 浏览 2 收藏

14 分钟

Claude AI的skill机制暗藏消费陷阱！实测显示，挂载15个未使用skill时单句话消耗51K token，精简到5个后骤降至31K——那些你以为‘闲置免费’的能力，正在每轮对话中悄悄吞噬token。本文深度拆解Anthropic底层机制，揭示skill描述全量预加载+轮询判断的双重消耗逻辑，更带来ToolSearch优化方案与三大实战策略，帮你截流隐性AI成本。

我说了同一句话，token消耗差了20K。

唯一变量是skill的数量。一次挂了15个，一次只剩5个。

我当时没太信。那10个被我删的skill，我说话之前压根没打算用，那句话就是个普通的工作指令，跟它们一点关系都没有。可账单不管这些。15个挂着的时候，一句话51K。删到5个，同样一句话，31K。

差出来的20K，全是那些我以为放着不用就没成本的skill在吃。

那一刻我意识到，自己对skill的理解从一开始就错了。

我之前是怎么想的呢？大概是这样：skill是种能力储备，多多益善，要用的时候顺手调，不用的时候就在那儿静静待着，零成本。听上去没毛病吧？跟手机装App一个意思，没打开就不耗电。

可Claude真不是手机。skill也不是App。

你以为放着不动就免费，其实它每轮都在收租

得先说清一件事Claude是怎么读你那句话的。

你每发一条消息过去，Claude收到的不是你那句话本身，而是一整个上下文包。里面有什么呢？系统提示、之前的对话历史、工具定义，还有，所有已安装skill的名字和描述。

注意，是所有已安装的skill，不是你这次想用的那几个。

这套机制的逻辑是这样：Claude得先知道自己手里有什么牌，才能判断这局要不要出某张牌。所以每轮对话开始之前，所有skill的元信息都会被一股脑塞进来。这不是偶尔发生，也不是你第一次装skill的时候发生一次，而是每一轮、每一句话，都在发生。

所以15个skill就是比5个贵。不是因为多干了什么活，纯粹是多出来的10个skill的描述文字，轮轮跟着进context。

我打个不太严谨的比方你就懂了。

你开了家公司，每次开会前，助理要把所有员工的简历念一遍，才决定这次叫谁进来。员工5个，念5份。员工50个，念50份。这场会就需要2个人到场，剩下48份简历照样念完，念简历的时间，就是你的token。

Anthropic自己的工程数据其实印证过这件事的严重性。不做任何优化的话，工具定义的token开销可以从55K飙到134K。这数字不是边缘案例，是正常配置下的正常结果。

再算个更直白的账吧。一个skill的描述文字，保守估200到500token。10个就是2000到5000token的固定开销，每轮必扣，不管你这轮用没用。Sonnet的输入token价大概是百万3美元。假设你一天跟Claude说100句话，一个月下来光是那些从来没被调过一次的skill，就在悄悄吃掉几十块。

更麻烦的是这个开销会叠加。多轮对话里，每一轮你都得带上之前的全部历史，再加每一轮重新注入一次skill描述。到第30轮的时候，你发出去的context体积，跟第1轮比，可能已经翻了好几倍。这翻出来的体积里，有相当一部分就是那些永远不会被调用的skill在贡献。

很多人发现自己Claude账单莫名其妙地高，翻来覆去找原因，怀疑是不是任务太复杂、是不是对话太长。很少有人想到要去看一眼自己装了几个skill。

但这往往才是最贵的那行。

Claude每次开口前，都要替你点一遍花名册

理解了每轮注入，还没到底。

还有一层让这事更贵，Claude不只是被动把skill描述装进context，它还得主动地、一个一个地扫，判断当前任务要不要调用某个skill。

这个判断过程，本身就是token消耗。

举个例子。你让Claude帮你写封邮件。它开始写之前，得先过一遍所有已装skill的功能描述，挨个问：写邮件这事，要不要用数据分析skill？要不要用代码审查skill？每个都过一遍，哪怕答案全是不用。

这就是我那个对照实验背后的机制。

15个skill在的时候，说一句话，Claude要扫15个描述，判断15次要不要调。删到5个，Claude只判断5次。那20Ktoken的差距，一部分来自skill描述文字本身的体积，另一部分来自这个逐个判断的过程开销。

我说说为什么我对这事比较确信。Anthropic后来专门开发了一个工具叫ToolSearch，干的事情是这样的：与其每轮全量扫描所有工具定义，不如先告诉Claude“你有个搜索能力，要什么工具自己去查”，把工具定义从全量预装改成按需检索。

这工具的存在本身就是证明。

如果装更多skill不影响token消耗是真的，Anthropic没必要做ToolSearch。正因为默认机制下skill数量和token消耗是绑死的，才需要一个工具专门来打破这个绑定关系。

官方数据说，开启ToolSearch的按需加载之后，工具相关的context消耗可以降85%。85%。这数字什么意思呢？意思是没优化的情况下，你的context里有接近一半的空间，是工具和skill的描述在占着。

回到刚才那个开会的比方。ToolSearch干的事，相当于把会前念所有员工简历改成会前只放一份花名册，要找谁再去查档案。花名册很薄，查档案按需付费。

这就让装2000个skill比装5个还便宜变成可能。前提是你用的是按需加载，skill数量才不再直接决定token开销。

但问题是，大多数人根本不知道这机制，也没主动去开过。他们用的还是默认的全量加载，每个skill，每轮都算钱。

还有件事让问题更难被发现。skill的消耗是隐性的。你能看到每次对话用了多少token，可你很难直觉上把这个数字跟那几个没用过的skill挂钩。除非你像我那样，专门做个对照实验，保持其他都不变，只动skill的数量，然后说同样一句话，看账单。

结果挺让人不舒服的。

有人做过更系统的测试。把一个系统提示从2500行压到核心指令，token降了30-40%，Claude的表现几乎没变化。skill也是同一个道理。我们以为装得多=能力强，可多出来的那部分，对结果几乎没贡献，对token倒是实打实在贡献。

能力的幻觉，和真实的账单，一直同时存在。只是大多数人只注意到了前面那个。

解法不是少装，是别让它永远挂在那

讲到这，可能你已经在想：那就别装太多skill呗，保持精简。

这想法不算错，可只对了一半。

根源不是装了几个skill，是skill的加载时机。你装20个skill但用的是按需加载，开销可能比5个全量加载还低。反过来，你只装5个但其中4个从不用，每轮也还在付那4个的钱。

数量不是核心变量。加载机制才是。

不过在你还没机会去折腾底层加载机制之前，有三件事可以马上做，立竿见影。

第一件，做一次skill审计

把你Claude里装的skill全列出来，然后问自己：过去这一个月，我真的主动用过哪几个？多数人会发现，高频用的就3到5个，剩下的都是当初觉得有用，装完之后基本没碰那种。这部分，就是你每轮都在付钱、但从来没收到货的租金。

第二件，按场景拆分配置，别追求那种“什么都装的万能大杂烩”

一个装了20个skill的全能配置，听起来很爽，可从token效率的角度看，这是最贵的配置方式。更聪明的做法是：写代码用一套配置，做内容用另一套，日常工作沟通用第三套。每套只装这个场景真正会用的skill，需要切换就切换。

操作上稍微麻烦点，但效果是实打实的。每个场景的token开销，会远低于一个什么都塞的通用配置。

第三件，了解一下ToolSearch和deferredloading

ClaudeCode已经内置了deferredloading的支持。MCP工具数量超过一定阈值，系统会自动把大部分工具定义推迟到被调用时才注入，同时给Claude一个搜索工具，让它需要某个功能时自己去查。

这机制不需要你写代码，但你得知道它的存在，知道去检查自己的配置是不是已经触发了这个模式。Anthropic官方文档里有这部分说明，花20分钟读一下，值。

说到底吧，这件事背后是个更普遍的问题，AI工具时代的能力焦虑。

新skill发布，装。看见别人推荐某个工具，装。觉得以后说不定能用到，装。这套逻辑在手机App时代就有了，到了AIAgent时代被进一步放大，因为skill的安装成本实在太低，点一下，几秒钟，搞定。

低安装成本制造了一种幻觉：装了又没损失。

可损失一直在那儿，只是换了一种你看不见的形式，藏在每轮对话的token账单里。

越来越多人开始意识到，AI工具的使用成本不只是订阅费，还有你自己配置出来的那些隐性开销。而这部分隐性开销，很多时候比订阅费本身还贵。

我做那个对照实验的时候，没想到差距会这么大。

51K和31K。我盯着这两个数字看了一会儿，想的不是省了多少钱，是另一个问题：我当初装那些skill，图的到底是什么？

图安全感吧。觉得装了就有了，有了就不怕。万一哪天用得到呢？

可万一哪天用得到是要付钱的。钱是每天、每轮、每句话里悄悄扣走的那些token。我以为自己买的是能力，其实买的是焦虑的缓解。

这种心态不只出现在skill上。订阅了一堆会员万一用得到，收藏了一堆文章万一用得到，报了一堆课万一用得到。多数东西的归宿，就是在某个角落挂着，默默计费。

你的Claude不是工具箱。工具箱里塞满了工具，掀开盖子那一刻没有成本。Claude不一样，它每次掀开盖子，都得把所有工具的说明书念一遍，再决定用哪个。

清理那些没在用的skill，不是在失去能力。

是在收回你一直在付、却从来没收到货的租金。

本文由 @智火流辉原创发布于人人都是产品经理。未经作者许可，禁止转载

题图来自Unsplash，基于CC0协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

智火流辉

一名AI从业者的自我分享。

1篇作品 84总阅读量

有了想法，你就写

09-213786 浏览

营销能否摆脱忽悠的原罪？！

12-151965 浏览

了解用户的阅读习惯，对设计的产出有多重要？

11-012560 浏览

小红书低粉爆文趋势报告，做小红书必看！

09-125222 浏览

理解用户需求：易用性中的易理解性怎么用？

04-247473 浏览

目前还没评论，等你发挥！