下载了一堆 Skill,为什么还是不好用

0 评论 125 浏览 0 收藏 18 分钟

这是「AI 协作」系列二第 3 篇。上一篇讲了怎样从 0 搭出第一版;这一篇回到我的真实起点:在自己动手之前,我也先下载过一堆别人做好的 Skill。

文中使用一份“会员积分过期提醒优化”的原始生成初稿作为样本。重点不是评价这份 PRD 写得好不好,而是看清:一份结构完整的通用 Skill 输出,为什么仍然不能直接进入自己的项目。

读完这篇,你不需要马上学会重写 Skill。先能从一份完整输出中分清三类内容:已经确认的事实、可以讨论的建议,以及缺少依据却被写成结论的未知。

刚开始搭 AI 工作流时,很多人的第一个动作不是自己写,而是下载。

市面上有各种打包好的 skill、flow、references、rules:这个号称“资深产品经理”,那个可以“一键生成完整 PRD”,还有人整理了几十条规则和参考资料。

于是很容易进入一种“大力出奇迹”的状态:

  • Skill 看起来专业,先下载;
  • Flow 步骤更全,也加进去;
  • References 越多,AI 应该越懂业务;
  • Rules 写得越细,结果应该越稳定。

文件夹越来越满,我们也很容易把“资料齐全”误认为“系统已经成熟”。

为了看它到底能不能用,我给其中一份市场通用版 Skill 输入了一个需求:

新锐美妆品牌希望优化会员积分过期提醒,减少积分清零后的集中客诉。

它很快生成了一份完整 PRD。

问题陈述、目标与 KPI、用户与范围、四项功能、验收标准、技术约束、状态机、待解决问题和竞品附录,一项不少。

它不是只给了几段建议,而是真的交出了一份“像 PRD 的 PRD”

第一眼看过去,我甚至不知道该从哪里挑错。直到我换了一个问题:

如果这份文档明天就要进入评审,里面哪些内容可以直接使用?

答案开始变得不一样。

基线还没采集,目标值已经很精确

先看目标与成功指标:

| 指标 | 当前基线 | 目标 |

|—|—|—|

| 积分过期相关客诉工单数 | 待采集 | 降低 60%+ |

| 收到提醒后兑换转化率 | 无 | ≥ 15% |

| 过期前积分消耗率 | 待采集 | ≥ 50% |

| 提醒触达率 | — | ≥ 85% |

这段比“优化体验、提升满意度”专业得多。

它不但给出了结果指标,还补上兑换、消耗和触达指标。数字明确,衡量方向完整,看起来已经可以直接用于验收。

但再看一遍,会发现一个非常直接的矛盾:

当前基线还是“待采集”,改善目标却已经精确到了 60%、50% 和 85%。

这时真正需要回答的是:

  • 60% 的改善目标从哪里来?
  • “兑换转化率”统计哪些用户、多长时间?
  • 提醒触达率是否能把短信和订阅消息合并计算?
  • 这些数字是业务目标、行业参考,还是 AI 给出的建议?

换成数据看板,会更容易看出问题:数值虽然都填上了,但指标卡片真正需要的验证信息仍然是空的。

这里需要明确:这些指标不是根据业务基线推导出的结果,而是通用版 Skill 直接定义的目标草案,尚未经过业务、数据和责任人的验证。

表格解决了“指标长什么样”,没有解决“指标凭什么成立”。

数字越具体,不代表可信度越高。

没有来源的精确数字,只会让不确定性更难被发现。

这些数字和方案从哪里来?继续往下看,会发现通用版大量使用了行业经验。

参考资料直接变成了项目方案

文档先列出了一组“行业最佳实践”:

| 最佳实践 | 来源 |

|—|—|

| 30 / 14 / 7 / 3 / 1 天分阶段提醒 | 行业通用 |

| 多渠道覆盖 | 腾讯云积分系统方案 |

| 兑换率提升 217% | 某电商案例 |

| 客诉从 500+ 降至 50 以下 | 某电商实战数据 |

有竞品、有行业方案,还有结果数据。单看这一段,会觉得 AI 至少没有闭门造车。

紧接着,这些参考就进入了本期范围:

本期范围:

– 30 / 14 / 7 / 3 / 1 天分阶段提醒

– 短信 + 小程序订阅消息

– 积分页面常驻提醒

– 展示积分数、过期时间和兑换入口

行业里常见的五个提醒节点,直接成了当前项目的五个节点;多渠道覆盖,也直接变成了短信和小程序订阅消息。

中间缺少了一步:为什么它适合这个项目?

  • 五次提醒会不会过于频繁?
  • 当前用户是否具有相同的消费和兑换习惯?
  • 案例数据的样本、周期和业务规则是否可比?
  • 短信与订阅消息是否已经具备?
  • 这些做法是候选方向,还是业务已经确认的本期规则?

References 本来应该帮助我们扩大选项、提出问题和支持论证。在这份输出里,它却替业务完成了选择。

这并不代表行业参考没有价值。相反,它很适合帮助我们快速打开思路。

但从“行业里有人这样做”到“我们这期就这样做”,中间仍然需要产品判断。

References 能扩大答案范围,却不会自动完成“这条经验是否适合我”的判断。

当参考方案被写成确定范围,AI 接下来就会继续补齐系统和技术细节。

越像内部事实,风险越高

技术约束部分看起来尤其专业。通用 Skill 不只写出结论,还会继续补成一段接近研发配置的代码:

# 通用 Skill 生成的技术约束草案

notification:

sms:

enabled: true

quota: unlimited

mini_program_subscription:

enabled: true

template_status: approved

points:

source_table: user_point_detail

expire_field: expire_at

valid_status: VALID

scheduler:

cron: “0 9 * * *”

scan_nodes: [30, 14, 7, 3, 1]

retry_times: 3

delivery:

deadline: none

budget_limit: none

通道状态、表名、字段、枚举、定时任务、成本和排期都有了。代码格式又进一步强化了可信感:它不像建议,更像从现有系统里抄出来的配置。

实际输入并没有提供这些信息。

如果继续沿着这段配置往下推,AI 甚至可以补出一份已经“能交给研发”的库表设计:

这份配置和库表草案并不是来自研发方案,而是 AI 为了让技术章节完整,沿着一个未经确认的表名继续推演出来的。

user_point_detail 是不是真实表名?expire_at 是否存在?有效状态是不是 VALID?积分是否按用户聚合?任务由哪个系统执行?短信通道是否已经接入?小程序订阅消息模板是否审核通过?

这些都需要产品、研发和业务分别确认,不能因为它们被写进“技术约束”代码,就自动变成事实。

技术约束应该记录已经确认的系统限制。尚未确定的表结构、任务机制和实现方式,只能作为技术方案草案待确认项,不能伪装成项目现状。

不同内容被补错,后果也不同:

通用 Skill 最危险的地方,往往不是写了一句明显的错话,而是用非常熟练的项目语言,补出了一项看起来已经确认的内部事实。

越像项目内部事实的内容,越不能由通用 Skill 靠行业常识补齐。

奇怪的是,这份文档并非完全不知道自己缺信息。

待确认项有了,但出现得太晚

在第 8 章,它列出了待解决问题:

## 待解决问题

– 历史过期率需要拉取数据基线

– 小程序订阅消息模板是否审核通过

– 是否需要“即将过期积分”专区

– 是否考虑多笔积分分批过期的聚合提醒

这说明 AI 并非完全没有风险意识。它知道基线尚未采集,知道订阅消息能力需要确认,也注意到了多笔积分的复杂情况。

问题在于,这些问题出现之前,完整方案已经写完了。

也就是说,它并非不知道信息不足,而是先用通用经验完成方案,再把真正会改变方案的问题放到最后。

这也是整份文档最值得注意的地方:

问题不在于有没有“待确认”章节,而在于待确认项有没有资格阻止前面的方案继续生成。

通用版的默认目标通常是尽快交付一份完整文档。因此它很容易:

  1. 先用常见做法填满空白;
  2. 再把不确定内容放到文档末尾;
  3. 把格式完整放在事实可信之前。

它完成的是公共答案

回头看这份 PRD,每一块都有明显价值:

它完成了一份结构完整的标准答案,但真正决定“能不能用于我的项目”的信息,散落在标准结构之外:

所以,我不认为市场通用版 Skill 没用。

它解决了“从哪里开始”,也告诉我“行业里通常怎么写、怎么做”。它可以帮助我们认识标准结构、获得候选方案、建立第一批问题清单,也能反向暴露当前还缺少哪些项目材料。

但它无法直接回答:

在我的项目里,什么是真的,什么能做,什么必须先停下来确认?

通用版知道公共知识,却不知道我的系统边界、团队习惯、历史包袱和评审标准。

市场 Skill 提供的是公共答案;真正能复用的 Skill,需要装入自己的判断依据。

先用四个问题检查你下载的 Skill

不用急着重写。先找一份你下载或收藏过的 Skill,用它跑一个自己熟悉的任务,然后检查:

  • 精确数字是否有基线和来源?
  • 行业参考是否未经判断就变成了项目方案?
  • 系统、成本和排期是否由真实责任人确认?
  • 哪些待确认问题本应阻止方案继续生成?

完成这一步,不需要评价整份输出“好”或“不好”,只要把内容分成三类:

  1. 输入中已经确认的事实;
  2. 可以继续讨论的建议;
  3. 缺少依据、不能直接进入方案的未知。

能把这三类内容分开,就已经看见这份通用 Skill 的适配缺口。

下一步:开始书写自己的第一版

看清这些问题后,我没有继续寻找另一份更强的模板。

我开始把历史 PRD、团队评审习惯和真实返工放在一起,尝试书写自己的第一版 Skill。

但最初写进去的,仍然只是:

  • 写专业一点;
  • 按我的风格;
  • 章节更完整;
  • 异常场景更详细。

这些要求方向都对,却无法稳定执行。

下一篇继续拆解:怎样从一份真正通过评审的旧 PRD 中,提取章节、颗粒度、术语和验收标准,把“像我写的”变成 AI 能执行的规则。

总结:完整只是起点,可信才能进入项目

这次使用市场通用版,我得到的不是“下载的 Skill 都没用”,而是四个更具体的判断:

  1. 指标写得精确,不代表数字有依据;
  2. 参考资料很多,不代表已经完成项目判断;
  3. 技术描述很真实,不代表它来自真实系统;
  4. 列出待确认项,不代表它真的阻止了错误生成。

通用版可以帮助我们快速看到标准结构、候选方案和缺失材料,但不能替我们确认项目事实、系统边界和决策依据。

这一篇先完成“看见适配缺口”。后面的系列会继续解决:

一份 Skill 的成熟,不看它写了多少规则,而看它能否分清事实、建议和未知。

下期预告

公众号继续双线并进

系列一 · 电商产品能力拆解: 继续拆真实业务系统与产品方案。

系列二 · AI 协作 · 第 4 篇:Skill 怎么才算“像我写的”?

市场通用版解决不了项目适配,我开始自己写第一版。但“专业一点”“详细一点”“按我的风格”这些要求,方向都对,AI 仍然只能猜。

下一篇会具体拆解:

  • 怎样选择真正通过评审的历史产物;
  • 怎样提取稳定的章节与表格结构;
  • 怎样确定业务规则需要写到什么颗粒度;
  • 怎样把术语、禁用表达和验收标准写成可检查规则。

第三篇先看清“公共答案为什么不能直接使用”;第四篇开始把自己的工作标准写进去。

作者:Zoe产品手记 公众号:Zoe产品手记

本文由 @Zoe产品手记 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自 Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!