每个没用到的Skill,都在悄悄收你的租

0 评论 84 浏览 2 收藏 14 分钟

Claude AI的skill机制暗藏消费陷阱!实测显示,挂载15个未使用skill时单句话消耗51K token,精简到5个后骤降至31K——那些你以为‘闲置免费’的能力,正在每轮对话中悄悄吞噬token。本文深度拆解Anthropic底层机制,揭示skill描述全量预加载+轮询判断的双重消耗逻辑,更带来ToolSearch优化方案与三大实战策略,帮你截流隐性AI成本。

我说了同一句话,token消耗差了20K。

唯一变量是skill的数量。一次挂了15个,一次只剩5个。

我当时没太信。那10个被我删的skill,我说话之前压根没打算用,那句话就是个普通的工作指令,跟它们一点关系都没有。可账单不管这些。15个挂着的时候,一句话51K。删到5个,同样一句话,31K。

差出来的20K,全是那些我以为放着不用就没成本的skill在吃。

那一刻我意识到,自己对skill的理解从一开始就错了。

我之前是怎么想的呢?大概是这样:skill是种能力储备,多多益善,要用的时候顺手调,不用的时候就在那儿静静待着,零成本。听上去没毛病吧?跟手机装App一个意思,没打开就不耗电。

可Claude真不是手机。skill也不是App。

你以为放着不动就免费,其实它每轮都在收租

得先说清一件事Claude是怎么读你那句话的

你每发一条消息过去,Claude收到的不是你那句话本身,而是一整个上下文包。里面有什么呢?系统提示、之前的对话历史、工具定义,还有,所有已安装skill的名字和描述。

注意,是所有已安装的skill,不是你这次想用的那几个。

这套机制的逻辑是这样:Claude得先知道自己手里有什么牌,才能判断这局要不要出某张牌。所以每轮对话开始之前,所有skill的元信息都会被一股脑塞进来。这不是偶尔发生,也不是你第一次装skill的时候发生一次,而是每一轮、每一句话,都在发生。

所以15个skill就是比5个贵。不是因为多干了什么活,纯粹是多出来的10个skill的描述文字,轮轮跟着进context。

我打个不太严谨的比方你就懂了。

你开了家公司,每次开会前,助理要把所有员工的简历念一遍,才决定这次叫谁进来。员工5个,念5份。员工50个,念50份。这场会就需要2个人到场,剩下48份简历照样念完,念简历的时间,就是你的token。

Anthropic自己的工程数据其实印证过这件事的严重性。不做任何优化的话,工具定义的token开销可以从55K飙到134K。这数字不是边缘案例,是正常配置下的正常结果。

再算个更直白的账吧。一个skill的描述文字,保守估200到500token。10个就是2000到5000token的固定开销,每轮必扣,不管你这轮用没用。Sonnet的输入token价大概是百万3美元。假设你一天跟Claude说100句话,一个月下来光是那些从来没被调过一次的skill,就在悄悄吃掉几十块。

更麻烦的是这个开销会叠加。多轮对话里,每一轮你都得带上之前的全部历史,再加每一轮重新注入一次skill描述。到第30轮的时候,你发出去的context体积,跟第1轮比,可能已经翻了好几倍。这翻出来的体积里,有相当一部分就是那些永远不会被调用的skill在贡献。

很多人发现自己Claude账单莫名其妙地高,翻来覆去找原因,怀疑是不是任务太复杂、是不是对话太长。很少有人想到要去看一眼自己装了几个skill。

但这往往才是最贵的那行。

Claude每次开口前,都要替你点一遍花名册

理解了每轮注入,还没到底。

还有一层让这事更贵,Claude不只是被动把skill描述装进context,它还得主动地、一个一个地扫,判断当前任务要不要调用某个skill。

这个判断过程,本身就是token消耗。

举个例子。你让Claude帮你写封邮件。它开始写之前,得先过一遍所有已装skill的功能描述,挨个问:写邮件这事,要不要用数据分析skill?要不要用代码审查skill?每个都过一遍,哪怕答案全是不用。

这就是我那个对照实验背后的机制。

15个skill在的时候,说一句话,Claude要扫15个描述,判断15次要不要调。删到5个,Claude只判断5次。那20Ktoken的差距,一部分来自skill描述文字本身的体积,另一部分来自这个逐个判断的过程开销。

我说说为什么我对这事比较确信。Anthropic后来专门开发了一个工具叫ToolSearch,干的事情是这样的:与其每轮全量扫描所有工具定义,不如先告诉Claude“你有个搜索能力,要什么工具自己去查”,把工具定义从全量预装改成按需检索。

这工具的存在本身就是证明。

如果装更多skill不影响token消耗是真的,Anthropic没必要做ToolSearch。正因为默认机制下skill数量和token消耗是绑死的,才需要一个工具专门来打破这个绑定关系。

官方数据说,开启ToolSearch的按需加载之后,工具相关的context消耗可以降85%。85%。这数字什么意思呢?意思是没优化的情况下,你的context里有接近一半的空间,是工具和skill的描述在占着。

回到刚才那个开会的比方。ToolSearch干的事,相当于把会前念所有员工简历改成会前只放一份花名册,要找谁再去查档案。花名册很薄,查档案按需付费。

这就让装2000个skill比装5个还便宜变成可能。前提是你用的是按需加载,skill数量才不再直接决定token开销。

但问题是,大多数人根本不知道这机制,也没主动去开过。他们用的还是默认的全量加载,每个skill,每轮都算钱。

还有件事让问题更难被发现。skill的消耗是隐性的。你能看到每次对话用了多少token,可你很难直觉上把这个数字跟那几个没用过的skill挂钩。除非你像我那样,专门做个对照实验,保持其他都不变,只动skill的数量,然后说同样一句话,看账单。

结果挺让人不舒服的。

有人做过更系统的测试。把一个系统提示从2500行压到核心指令,token降了30-40%,Claude的表现几乎没变化。skill也是同一个道理。我们以为装得多=能力强,可多出来的那部分,对结果几乎没贡献,对token倒是实打实在贡献。

能力的幻觉,和真实的账单,一直同时存在。只是大多数人只注意到了前面那个。

解法不是少装,是别让它永远挂在那

讲到这,可能你已经在想:那就别装太多skill呗,保持精简。

这想法不算错,可只对了一半。

根源不是装了几个skill,是skill的加载时机。你装20个skill但用的是按需加载,开销可能比5个全量加载还低。反过来,你只装5个但其中4个从不用,每轮也还在付那4个的钱。

数量不是核心变量。加载机制才是。

不过在你还没机会去折腾底层加载机制之前,有三件事可以马上做,立竿见影。

第一件,做一次skill审计

把你Claude里装的skill全列出来,然后问自己:过去这一个月,我真的主动用过哪几个?多数人会发现,高频用的就3到5个,剩下的都是当初觉得有用,装完之后基本没碰那种。这部分,就是你每轮都在付钱、但从来没收到货的租金。

第二件,按场景拆分配置,别追求那种“什么都装的万能大杂烩”

一个装了20个skill的全能配置,听起来很爽,可从token效率的角度看,这是最贵的配置方式。更聪明的做法是:写代码用一套配置,做内容用另一套,日常工作沟通用第三套。每套只装这个场景真正会用的skill,需要切换就切换。

操作上稍微麻烦点,但效果是实打实的。每个场景的token开销,会远低于一个什么都塞的通用配置。

第三件,了解一下ToolSearch和deferredloading

ClaudeCode已经内置了deferredloading的支持。MCP工具数量超过一定阈值,系统会自动把大部分工具定义推迟到被调用时才注入,同时给Claude一个搜索工具,让它需要某个功能时自己去查。

这机制不需要你写代码,但你得知道它的存在,知道去检查自己的配置是不是已经触发了这个模式。Anthropic官方文档里有这部分说明,花20分钟读一下,值。

说到底吧,这件事背后是个更普遍的问题,AI工具时代的能力焦虑

新skill发布,装。看见别人推荐某个工具,装。觉得以后说不定能用到,装。这套逻辑在手机App时代就有了,到了AIAgent时代被进一步放大,因为skill的安装成本实在太低,点一下,几秒钟,搞定。

低安装成本制造了一种幻觉:装了又没损失。

可损失一直在那儿,只是换了一种你看不见的形式,藏在每轮对话的token账单里。

越来越多人开始意识到,AI工具的使用成本不只是订阅费,还有你自己配置出来的那些隐性开销。而这部分隐性开销,很多时候比订阅费本身还贵。

我做那个对照实验的时候,没想到差距会这么大。

51K和31K。我盯着这两个数字看了一会儿,想的不是省了多少钱,是另一个问题:我当初装那些skill,图的到底是什么?

图安全感吧。觉得装了就有了,有了就不怕。万一哪天用得到呢?

可万一哪天用得到是要付钱的。钱是每天、每轮、每句话里悄悄扣走的那些token。我以为自己买的是能力,其实买的是焦虑的缓解。

这种心态不只出现在skill上。订阅了一堆会员万一用得到,收藏了一堆文章万一用得到,报了一堆课万一用得到。多数东西的归宿,就是在某个角落挂着,默默计费。

你的Claude不是工具箱。工具箱里塞满了工具,掀开盖子那一刻没有成本。Claude不一样,它每次掀开盖子,都得把所有工具的说明书念一遍,再决定用哪个。

清理那些没在用的skill,不是在失去能力。

是在收回你一直在付、却从来没收到货的租金。

本文由 @智火流辉 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!