GLM-4.6 首发实测:和 Claude 4.5 比怎么样?
GLM-4.6 昨夜低调放号,我们第一时间拉来 Claude 4.5 做 48 小时盲测。结果出乎意料:中文指令遵循率 GLM 领先 9.4%,代码一次性可运行率反超 7%,更在 2024 高考数学卷拿下 142 分,比 Claude 高 18 分;但在多轮逻辑推理和长程上下文回忆上,Claude 依旧守住“最像人”的金身。谁更懂中国开发者?谁更值得放进生产环境?今天放出 6 组实测截图+ prompt,让你一眼看懂该把算力押给谁。

起点课堂会员权益