Claude的四月,在学怎么和监管共存

0 评论 563 浏览 0 收藏 27 分钟

Claude 的 web-design Skill 通过先定义设计规范再编写代码的强制流程,解决了 AI 辅助设计中的风格漂移问题。本文通过五个关键场景的深度剖析,揭示了 Anthropic 驾驭工程的核心逻辑:约束不是限制能力,而是让能力变得可用。从源码泄漏到 Mythos 限制使用,AI 行业的等级制正在加速形成。

我做了一个 Claude 用的Skill:web-design。

给它一个网址、或者几句话描述想要的风格,它先出一份完整的设计规范,颜色、字体、间距、动效全部定义清楚,然后再写代码。不是直接甩给你代码让你改,是真的先把视觉语言搭好,再动手实现。

先出规范,再出代码。

这句话说起来简单,但我是踩了很多坑才想通的。

我之前做过很多次”把一个想法交给 Claude 做成页面”的尝试。大部分时候结果是这样的:第一版出来,风格不对,改。改完颜色感觉不搭,再改。字体换了之后间距又乱了,继续改。改到最后你发现已经跑偏了两公里,中间那些对话根本没有让事情变得更清晰,只是在不停地打补丁。

问题不是 Claude 不够强,是没有约束。你给它一个任务,它照着任务做,但”这个页面应该是什么感觉”这件事从来没有被定义清楚。所以每次输出都是靠感觉,感觉漂不定,结果自然也漂。

web-design 这个Skill要解决的就是这个问题。强制先定义,再执行。

这个东西我开源了,还做了一个介绍页。从零到上线,一个晚上搞定。整个过程我没写一行代码,没截一张图,也没手动压缩过任何文件。

做完之后我回想了一下整个四月。Claude 这个月搞出来的几件事:源码意外公开、最强模型 Mythos 发布但不让用、开始要求用户刷脸验证身份。

cc源码泄漏,意外定义标准

四月一号晚上,Claude Code 整套源码因为打包配置失误,直接推到了公开仓库。上千个文件、五十多万行代码,全部裸奔。最先发现的是一个研究员,发了条推,没多久收了好几千颗星。

我手急眼快,在删掉之前把东西全拿到本地。(Github 上的备份仓库后来陆续被下架,但那会儿我已经开始一个一个目录翻了。)

翻了一晚上,最让我停下来的不是代码,是里面的Prompt。每个工具目录里都有一份,是 Anthropic 写给模型的生产级指令。

举一个例子:BashTool 目录里有一段 Git 操作约束,大意是这样的:pre-commit 钩子失败的时候,提交根本没有发生,这种情况下如果执行修改上一次提交的操作,会改掉一个已经成功的提交,导致工作丢失,所以这个操作在任何情况下都不应该使用。

这不是在说”请小心操作 Git”。这是在把一个复杂场景的逻辑链条拆清楚,然后给出一个有据可查的规则。它不是在强制约束操作,而是在解释为什么这个约束是对的,让模型真正理解,而不是死记硬背一条禁令。

给子模型写指令,要像跟一个刚走进房间的聪明同事说话。它没看过你之前的对话,不知道你试过什么,不知道为什么这件事重要。

我之前做多模型协作踩过的所有坑,这一句话全点透了。我以前写子模型指令疑惑为什么结果总差那么一口气。问题就在这里:它不知道背景,不知道你排除了哪些方向,不知道什么对你来说是重要的。信息不对称,结果自然也不对称。

这就是 Anthropic 在用的驾驭工程的核心:不靠强行灌输规则,而是建立一套有逻辑的约束体系。每一条约束都有原因,每一个边界都解释清楚为什么在这里划。让模型在理解约束的基础上自主运转,而不是在规则里磕磕碰碰。

关于这一夜具体扒到的东西,我写过一篇《Claude Code 源码泄露,我扒出来了一些好东西》,这里不展开。

这不是产品发布,是事故。但这个事故让我真正理解了一件事:约束不是在限制能力,约束是在让能力变得可用。

把这套逻辑变成一个 SKILL

理解这件事之后,我回头看自己之前做网页踩的坑,答案很清楚:我从来没有给任务建立一套约束体系,所以每次都在漂。

web-design 这个Skill,就是把这套逻辑搬到网页开发这个具体场景里。

给它一个任务,它不会直接开始写代码,它先出 DESIGN.md,这是给它自己看的设计规范:

颜色系统:定义每个层级的色值和用途

字体规则:定义字族、字号分层和行高

间距系统:用网格定义所有层级的距离

动效原则:规定过渡时长和缓动方式

禁忌清单:列出哪些搭配绝对不能用

这份文件是给它自己看的合约,也是给整个项目看的宪法。先立约束,再执行任务,这跟 Anthropic 给模型写提示词是同一件事。有了这份文件,你可以在任何时候打断对话、重新开始,它都能做出风格一致的东西。

让它自己做了一个它自己的介绍页的晚上,有五个时刻让我印象最深。这五个时刻不只是它做了什么,每一个都在说明这套先约束再执行的逻辑是怎么在实际场景里跑通的。

时刻一:一句话需求,它没问就开干

晚上十一点,我给它扔了一句话:

我准备把这个Skill开源推到 Github 上,然后做一个类似 hueapp.io 的介绍页,这是一个专门为 web 端设计的指令集。

就这一句。没附件,没需求文档,没设计稿,没参考图。

换opus4.6,它会回来问一堆问题:框架用什么,组件库用什么,配色出几版让我选,字体怎么定,要不要适配手机端。这些问题本身没有错,但它们传递了一个信号:它在等你给答案,它不打算自己做判断。

这次没有。opus4.7hui 直接去抓 hueapp.io 的页面开始分析。

这是用法上的一个分水岭,也是用 AI 做事最关键的一个认知转变:当你把 AI 当执行工具,你给它完整的规格书,它负责实现,你是决策者,它是执行者。但当你把它当有判断能力的协作者,你给它目标,它自己想办法达到,你们之间的角色是平的。后者对你来说能做的事多一个数量级。

但这个前提是,它真的能做到自己想办法,而不只是假装没有问题然后出一个驴唇不对马嘴的结果。这一次它证明了这一点。

时刻二:遇到障碍,自己想办法绕

hueapp.io 是单页应用,直接请求拿不到渲染内容,返回全是空壳和脚手架代码。

它没有停下来问我怎么办,也没有直接报告无法抓取”。它会自己切换方案,打开浏览器把页面真实渲染出来,然后一个资源一个资源去分析、截图、读样式。这一步跑了大概六分钟。

然后给我出了一份设计语言报告:整体调性是暗黑编辑风格,克制而不冷硬;配色以深灰黑为底,三级表面结构,用冷蓝和暖粉做双色点缀;字体主副分层清晰,标题大、正文小、标签更小,层次感很强;动效轻而不花哨,过渡时间短,缓动曲线是那种进快出慢的感觉。

它接着又自己去抓了另外两个参考站,把三个站的设计决策统一整进一份报告,每条决策都标了来源,说明这个选择是从哪个参考站提炼出来的,为什么适用于我的项目。我在旁边什么也没做(其实打了把王者)。

这个时刻说明一件事:碰到障碍之后“我应该怎么绕过去”这个判断,现在是它在做,不是我。你不需要全程盯着,给它一个目标,它能自己把事情推进到一个合理的终点。这个能力变化的意义比看上去大得多,因为它直接影响你能委托给它多大的任务。

时刻三:先出规范,再写代码

爬完参考站,它没有直接开始写页面。

它先输出 DESIGN.md。

这份文件读起来不像技术文档,更像一份设计师的工作笔记。颜色系统里每个色值后面跟着用途说明,什么颜色用在背景、什么颜色用在卡片表面、什么颜色用在边框,每一层都有解释。字体规则里每个字号层级都说明了对应的场景,主标题多大

、副标题多大、正文多大、标签多大,不是随意定的,是参照三个参考站提炼出来的比例关系。动效部分规定了过渡时长的范围、进出场动画的方式、哪些交互要有反馈、哪些不需要。禁忌清单里不只写了”不能用什么”,还写了”因为这样会破坏整体的克制感”。

这是它在用设计师的语言,而不是工程师的语言,来描述这个项目应该长什么样。

确认完,它才开始写代码。我没有给它任何额外的指令,就说了一句”可以,开始吧”,它就按照这份规范开始实现。

这份 DESIGN.md 在整个流程里的作用,和 Anthropic 的系统提示词是同一件事:先建立约束,再开始执行。有了这份文件,后面所有的输出都有据可依,你可以在任何时候打断对话、换一个新的对话窗口继续,它都能做出风格一致的东西。这个一致性不是靠记忆,是靠约束。

时刻四:卡顿,自己诊断砍依赖

介绍页做到中途,动效库加了太多:渐变背景、3D 球体、平滑滚动、滚动联动,六七个库堆在一起。效果是真的炫,但页面一滑动就卡成 PPT,加载也慢。

我丢了一句:

滑动不丝滑太卡了,怎么解决?动效加载也慢。

它没说”我可以尝试优化一下,请告诉我您希望如何调整”,也没推卸责任说这是浏览器性能问题。

它给了一份诊断清单。把所有动效库过了一遍:首屏渐变背景是真的在服务视觉体验,留着;3D 球体图墙是内容展示的核心,留着;平滑滚动能明显提升使用感受,留着。但主线程阻塞的那几个、加载时间占大头却几乎没有用户感知的那几个,全部标了叉,然后自己动手删。

删完页面立刻顺滑了。

这个时刻最让我印象深的不是它删掉了什么,而是它用来做判断的那个标准:这个库对用户体验是不是真的有价值,还是只是在我自己的审美里好看。 它在用这个标准评估它自己之前做的东西,然后主动砍掉不达标的部分。

大部分 AI 工具会在你满意之前一直往上加,因为加比减安全,加错了还有机会改,减错了用户会不高兴。它选择直接砍,说明它有一个内部的判断标准,而不只是在追着你的满意度信号走。

时刻五:”我对不起这个页面”

差不多凌晨一点,项目推上 Github,介绍页上线,域名也起好了。

介绍页效果是真的炫。首屏是渐变动效背景,往下滚动到展示区是一个 3D 球体图墙,几十张截图贴在球面上慢慢转,鼠标拖拽能转动它。

我满意了,顺手翻了一下 Github 仓库页。翻到底下的自述文件。

干巴巴一块文字,介绍页那么炫,仓库首页却像十年前没人维护的开源项目,对比很强烈。

我甩了一句:

自述文件内容是不是有点太丑了。你好歹放一个页面首屏的图呀,而且你都没有打标签,链接地址放的位置也不对。

它回了:你说得对,我对不起这个页面。

不是”好的我来帮您优化一下”,不是”请告诉我您希望如何调整”。是”我对不起这个页面”,感觉还挺有意思,但是感觉缺了点什么。

然后它开始自己动手。演示链接置顶,介绍页首屏截图放在第一行,安装命令移到单独的标题下,加了构建状态徽章、版本徽章、协议徽章,补上目录结构和详细的使用说明。

做完还补了一句:

一个好的自述文件,顶部应该就是首屏截图或演示图,有构建状态和版本徽章,演示链接放顶部最显眼的位置,视觉上要有呼吸感。

它不只改对了,还告诉我它的判断标准是什么。这个对我来说比改的结果更有价值,因为这个标准我可以带走,用到下一个项目里。

一晚上五个时刻,每一个都在印证同一件事:先建立约束,再放行能力,这套逻辑不只是 Anthropic 训练模型的方法,也是普通人用 AI 做复杂任务的核心方法论。DESIGN.md 是约束,没有它,后面的每一步都会漂。

Opus 4.7:闷葫芦技术员

这五个时刻,用的都是四月十五号晚上刚更新的 Opus 4.7。

用了两天,我得到一个结论:4.7 编程能力更强,审美也更好,但人味儿没了。

先说它变好的地方。

写代码,它准、快、稳。给它一个需求,不废话直接干,不会来回确认细节,不会把一个简单任务搞成十轮对话。遇到问题自己想办法,遇到报错自己诊断,遇到效果不好的东西自己砍,这些做得比之前任何版本都流畅。审美也真的变好了,做出来的东西视觉完成度高,不再是那种功能齐全但看着哪儿都不对劲的感觉。

但让它写点有温度的东西,你会感觉到一层玻璃在那里。

让它帮你写一段产品说明,出来的东西读起来通顺但没有味道。让它帮你打磨一篇文章,它能挑出逻辑问题,但给你的修改建议是对的但没劲。让它以第一人称写一段感受,你会立刻察觉那不是人的声音。

写代码行,写作真不行。

这两件事它做的不是同一种任务。写代码,对错可以验证,跑通了就是跑通了,报错了就是报错了,它在一个有明确反馈机制的环境里工作,可以自己迭代,自己修正。写作没有这个机制,”这句话有没有温度”这件事没有 pass/fail,它拿不到那个反馈信号,所以只能往安全的方向走,往不会出错的方向走,结果出来的东西不会错,但也不会打动任何人。

那句”我对不起这个页面”,是它说出来的。但用了两天之后,我总觉得它不会再说第二次了。不是因为它变差了,而是因为它变得更稳了,更可控了,更不会偏离预期了。

这不是 bug,是驾驭工程在起作用。模型越来越稳、越来越可控,某种东西被系统性地磨平了。

四月剩下的那几件事

现在回头看四月,那几件事放在一起就清楚了。

Mythos 发布,但不给你用。

四月八号,Anthropic 推出 Claude Mythos,专门用于安全漏洞审计,官方说它找漏洞的能力比绝大多数安全研究员都强,只输给最顶尖那一小撮人。圈子里炸了,所有人都在等它什么时候对外开放。

然后就没然后了。Mythos 只给合作机构用,普通用户打开模型列表根本看不到这个名字,开发者论坛追问一周,官方只回”暂无对外发布计划”。

逻辑不难理解。能找漏洞的模型,反过来就是能利用漏洞的模型,这两件事在技术上是一回事,区别只是你下什么指令。Mythos 一旦公开,每一个想做攻防的人都拿到了一个顶级工具。这个责任 Anthropic 扛不住,所以锁起来,只在自己能控制的环境里用。

这不是保守,是理性判断。但理性判断的结果是:你永远用不到最强的那个版本。

刷脸进门。

就在前两天,Claude 官网更新了一个信息:Claude 后续会增加身份验证,政府颁发的带照片证件、摄像头实时自拍,大约五分钟,合作方是 Persona Identities。

艹,原地爆炸。

我是从 3.5 用到 4.6 的深度用户,跟它协作的场景多到我自己都记不过来。突然被要求交证件和人脸,Anthropic 给的理由也很官方:防止滥用、执行使用政策、遵守法律义务。听起来都对。但说白了就是全世界监管压力越来越大,AI 公司要给自己系上安全带,代价是把合规成本摊到每个用户头上。

Anthropic 在收紧。能收的全在收。

源码泄漏是意外,但让我们看见了 Anthropic 怎么约束模型。Mythos 是主动锁住,战略决策。刷脸是把约束延伸到用户端,从控制模型到控制谁能用模型。三件事方向一致,力度在递增。

这个收紧,是谁来定义的

AI 的等级制正在形成,而且已经成型了。

几乎所有头部公司都在做同一件事,把模型分层卖。最强的留给机构,企业版付高价,个人版是蒸馏过的、能力削过的版本,受监管地区再阉割一次,连蒸馏版都不是完整的。

这不是阴谋,是必然。像处方药和非处方药,像核燃料和工业铀,像军用通讯设备和消费级手机。凡是能力足够强到可能造成危害的东西,最后都会被分层分级,都会有人来决定谁能用、谁不能用、在什么条件下能用。AI 只是又一个加入这个队伍的技术而已。

以后你用的 AI,永远不会是这家公司能做出来的最强的那个。

问题不只是”最强的那个给不给你用”。

Mythos 要不要开放、开放给谁、刷脸需不需要验、今天给你用的这个版本是不是被减过,这些决定现在全部由 Anthropic 一家公司做。没有公开征询,没有用户投票,没有第三方评估这个判断是不是合理的。你作为用户,唯一的角色是接受方。

你可能会说,公司做自己产品的决定不是天经地义?

如果是普通产品这没问题。但 AI 不是普通产品,它是会重新定义很多行业工作方式的基础设施。你能用多强的 AI,决定了你能做多少事,不能用某种 AI,意味着某些活你干不了,某些机会你拿不到。这个影响量级和普通产品不是一回事。

这件事如果只由企业来定义,会出现两种风险。

一种是过度谨慎:Anthropic 驾驭不了 Mythos,就把它锁起来。这个判断可能是对的,但它是单方面的,没有公开讨论,就决定了全世界人都不该用。另一种是悄悄变化:今天你用的 4.7,明天可能因为合规要求被再砍一刀,你用着用着发现某些任务它拒绝做了,问它为什么,它给你一个很官方的”按使用政策”。你连反对的语言都没有。

我不是说 Anthropic 做错了,安全和合规都是正当的。但我们作为直接受影响的人,应该有机会参与这个规则的讨论,不能只当接受方。

4.7 让我一个晚上做完了以前要一周的事。但 4.7 之所以能给我用,是因为 Anthropic 认为它足够安全、足够可控。真正强的那个,锁在柜子里。

所以这个四月如果让我用一句话总结,不是”4.7 真好用”,也不是”Mythos 真可惜”,而是:

我们正在进入 AI 的监管时代,游戏规则正在被少数几家公司悄悄定义。

本文由 @小普 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自作者提供

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!