智谱GLM-5这次开源，让高级程序员也危险了… | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

{{ userInfo.member ? '查看权益' : '开通会员' }}

发布

注册 | 登录

智谱GLM-5这次开源，让高级程序员也危险了…

袋鼠帝

2026-02-12

0 评论 2239 浏览 0 收藏

15 分钟

智谱GLM-5深夜开源，直接干到全球第四、开源第一。参数规模从355B暴涨至744B，SWE-bench-Verified得分77.8，与Claude Opus 4.5不相上下。它不再卷Vibe Coding炫技，而是进化成能构建完整系统的「架构师」——7分钟生成API中转站，前后端逻辑、数据库全搞定。当AI从写代码转向搭系统，高级程序员的护城河正在被重新定义。

先看看我用GLM-5优化的营销短视频一键生成平台

生成效果不重要，后面接入更好的模型即可，关键是平台能力搭建起来了。

真的，2026年的AI比25年疯太多了。

最近我这个一天16个小时泡在AI里面的人，都有点追不上AI进化的速度。感觉每天一睁眼，世界就变了个样。

这不，昨天深夜，智谱又放了个大招，直接开源了他们目前最强的旗舰模型：GLM-5。

在全球权威的Artificial Analysis榜单里面，GLM-5超越Gemini干到了全球第四、开源第一！

还真是如我所料啊，记得上次GLM-4.7发布的时候，我就在文章里跟兄弟们预测了一波：盲猜GLM-4.8或者GLM-5将在春节前夕发布，没想到真来了，哈哈😄

而且这次的版本号终于不像之前那样4.5、4.6、4.7这样挤牙膏式的更新了，这次直接干到了5.0。

这就说明，不是什么小修小补，是底座能力的大跨越。

先给大家介绍一下，这次GLM-5到底更新了啥：

简单来说，之前的模型，大家普遍都在卷Vibe Coding，就是所谓的一句话生成，看谁生成的网页特效更炫酷，看谁能一句话搓个炫酷的游戏。

但GLM-5这次不跟你卷这个了（终于！），它把大模型的能力从写代码，提升到能构建系统。

什么意思呢？它的重心不再是写漂亮的前端页面，而是进化成了一个能干脏活、累活、做长任务的系统架构师。

强调的是Agentic Engineering，也就是智能体工程能力。

我看了下官方的数据，参数规模从355B干到了744B（激活40），预训练数据从23T提升到了28.5T。

在SWE-bench-Verified这个公认的编程基准测试里，得分77.8，直接把Gemini 3 Pro甩在了身后，和目前公认的最强闭源模型Claude Opus 4.5可以说是不相上下。

目前在z.ai上面就可以免费使用：

开源地址:

GitHub：https://github.com/zai-org/GLM-5

Hugging Face：https://huggingface.co/zai-org/GLM-5

ModelScope：https://modelscope.cn/models/ZhipuAI/GLM-5

其实在前几天，X上就突然冒出来一个叫Pony的神秘模型。

当时很多朋友都在猜，这个Pony到底是哪路神仙？众说纷纭

其实代号Pony的模型就是GLM-5，至于为什么叫Pony呢，大概是因为马年快到了吧🤔。

我当时也第一时间从OpenRouter把Pony接入到Claude Code里试用了一下，说实话，真滴很强（在X上热度也是非常高）。

只花了7分钟，一次性生成了一个API中转站！

虽然还是MVP Demo，但是页面功能已经很齐全了，而且包含后端逻辑，以及数据库，数据是动态的，麻雀虽小五脏俱全。

在深度体验后，我发现GLM-5在制定计划的时候，那种味道，太像Claude Opus了。

熟悉Claude Opus的朋友都知道，在干活之前，可以用它会给你列一个非常详细、逻辑严密的计划。

GLM-5现在也有了这个能力。

比如，我有一个一直想做，但是因为懒一直没动手的事儿。

我手头有Gemini、ChatGPT、Kimi、智谱等等一堆会员账号。

平时写文章或者查资料的时候，有些问题我经常会想听听多个AI的意见，综合对比一下。

那我就得打开多个浏览器窗口，复制切换不同窗口粘贴发送多次，然后轮流切换窗口查看结果。

虽然也不是多大的事儿，但次数多了真的很烦。

我就在想，能不能做一个浏览器插件，能统一在一个窗口里面，同时向这四个AI的网页端发送同一个问题，然后在插件里面统一收到回复？

但是这玩意儿还挺麻烦的，因为每个AI网站的结构都不一样，还有各种保护机制，需要去分析它们的DOM结构。

于是，我就把这个复杂的任务交给了GLM-5。

开启Claude Code的Plan Mode先让它做个计划

PS：上面这个输出就挺像Claude Opus的风格

然后它还会跟我互动，询问我的意见：

最终得到的计划非常详细，真的太长了，有633行。。

然后就按照计划开始吭哧吭哧执行了，没想到第一步初始化项目就跑了50多分钟..

在这个过程中，它自动调用了Playwright MCP工具，自己打开浏览器，去访问那几个AI的网站。

它就像一个真的程序员一样，去键检查元素，去分析输入框在哪里，发送按钮的Class是什么，怎么获取返回的文本流…整个过程全自动，我一行代码都没写。

PS：忘记录屏了，因为我同时还在其他窗口跑另一个任务

等待是值得的，我想要的一次提问、全网AI同时回答的插件，就这么热气腾腾地出炉了。

这完全就是我需要的东西～

另外，我之前不是做了一个数字人营销视频一键生成平台嘛。

后来为了追求更好的体验，我重构了一下前端，这一重构不要紧，整个项目可以说是乱成了一锅粥：前后端接口对不上，后端的一些老旧逻辑在新前端面前跑不通，Bug非常多，搞起来很麻烦。

这次，我在Claude Code开启plan mode，然后直接把主流程找bug，改bug的任务甩给了GLM-5

先出来一份详细的计划：

确认计划无误后，我就让它吭呲吭呲开始执行了（过程中用到了浏览器mcp来控制）。

它的执行速度并不快。

但并不是模型慢，很多时候，我看那个Token的消耗速度，肉眼可见地一秒钟就窜到上千了。

但是因为任务太复杂，它需要不断地自我反思、调用工具、运行测试。

也有一些时间是消耗在依赖下载，或者命令执行上。

这个修复任务，也整整执行了40多分钟。

可能有的朋友会说，40分钟？我都写完了。

emmm，但这40分钟里，我就开着录屏，刷视频，甚至去遛了狗。

而它是在全神贯注帮我干活，而且是干那种最让人头秃的找Bug和重构的活。

别看它执行得慢，但是最终得到的效果是非常显著的。

我一运行，好家伙，问题基本都搞定了。

请看VCR：

这里面也有一些效果是我后续自己测的时候发现小Bug，然后让它修复并优化的。

但是在修Bug和优化功能这块，我是真的放心交给它。

以前用别的AI改Bug，经常是担心bug越改越多，项目越改越乱，典型的拆了东墙补西墙..

之前为了规避这个问题，得用各种工程化的手段去约束AI。

比如每次修改强调范围，或者把这些写到规则里面，或者每次只改一个bug，每次改完，还得测一下别的功能…反正很麻烦。

但是用GLM-5修改Bug，体验完全变了。

我从来就是只需要描述现状，把报错日志丢给它，告诉它我期望的效果是什么。

它几乎都能一次修复成功，而且完全不会影响别的功能。

甚至，我在一次对话中，直接把整个流程中发现的四个不同的Bug，一股脑全扔给它，它也能条理清晰的一个个修好。

这种稳健的感觉，真的太舒服了。

我现在可以放心交给GLM-5帮我完成任何复杂的开发任务，基本不会出错。

即便偶尔有问题，大不了在Claude Code里面执行一下回滚命令，倒回去重来就好了。

整个项目用GLM-5优化了一圈之后，所有流程基本都搞定了。

我也准备很快就把这个项目开源出来（还需要再把各种模型API那块抽出来，变成配置）。「最后」

体验完GLM-5，我最大的感受就是：国产AI真的站起来了。

前两天，字节跳动的Seedance 2.0发布，证明了中国国产模型在视频生成领域已经达到了世界第一水平，直接超越Sora2和Veo3.1。

而这次智谱GLM-5的发布，则是在另一个硬核的赛道AI Coding上，交出了一份超预期的答卷。

我们以前总说，国产模型在逻辑推理、在写代码上，跟GPT、跟Claude Opus、跟Gemini还有差距。

但今天，GLM-5用实打实的表现告诉我们：这个差距正在被抹平。

GLM-5也不是一个只能用来做Demo的玩具，它是一个真正能帮你干活、能帮你构建系统、能帮你解决长任务、复杂问题的生产力工具。

最关键的是，它是开源的。

这意味着，每一个开发者，每一个企业，都可以以更低的成本，拥有一个顶级的AI架构师。

而且目前GLM的Coding Plan已经卖爆了，官方发公告说，正在紧急扩容，而且重点是，这次接入的是国产芯片的万卡集群。

不过因为算力的加大投入，价格有所上涨，还好我之前搞了Max套餐

这里也可以看出，从芯片到模型，从底层算力到上层应用，我们正在构建一套完全属于自己的、世界顶级的AI技术栈。

2026年，注定是AI应用爆发的一年，也是更疯狂的一年。

如果你也想体验这种拥有顶级AI架构师的感觉，赶紧去试试GLM-5吧。

前提是你得抢到Max套餐，哈哈。

本文由人人都是产品经理作者【袋鼠帝AI客栈】，微信公众号：【袋鼠帝AI客栈】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

袋鼠帝

持续分享AI实践干货，走超级个体崛起之路

18篇作品 49490总阅读量

“人货场”，在产品业务分析中的具体应用

04-1117318 浏览

“人货场”，在产品业务分析中的具体应用

后万店时代，瑞幸越来越像蜜雪冰城

06-064924 浏览

后万店时代，瑞幸越来越像蜜雪冰城

小红书有没有流量池概念？笔记如何被推荐？

11-285595 浏览

小红书有没有流量池概念？笔记如何被推荐？

山寨ChatGPT换皮后，做起代理和打赏的生意？

02-203315 浏览

山寨ChatGPT换皮后，做起代理和打赏的生意？

昔日“全球霸主”，一代人的青春回忆，如今永久关闭

02-162004 浏览

昔日“全球霸主”，一代人的青春回忆，如今永久关闭

评论

目前还没评论，等你发挥！