"Claude"相关的文章
AI
GLM-4.6 首发实测:和 Claude 4.5 比怎么样?

GLM-4.6 首发实测:和 Claude 4.5 比怎么样?

GLM-4.6 昨夜低调放号,我们第一时间拉来 Claude 4.5 做 48 小时盲测。结果出乎意料:中文指令遵循率 GLM 领先 9.4%,代码一次性可运行率反超 7%,更在 2024 高考数学卷拿下 142 分,比 Claude 高 18 分;但在多轮逻辑推理和长程上下文回忆上,Claude 依旧守住“最像人”的金身。谁更懂中国开发者?谁更值得放进生产环境?今天放出 6 组实测截图+ prompt,让你一眼看懂该把算力押给谁。
业界动态
字节成了Anthropic“自宫”的受害者

字节成了Anthropic“自宫”的受害者

Anthropic 为“安全”挥刀自宫——把 Claude 调到“保守模式”,结果最大金主字节先被误伤:豆包 API 调用延迟飙 3 倍、RAG 召回率掉 15%,广告审核误杀率飙到 20%。安全红线越收越紧,字节一边掏钱给 Anthropic 续命,一边连夜找国产模型做备胎。大模型的“安全税”来了,第一个买单的,正是相信“技术无国界”的巨头。
AI
AI混战日:OpenAI开源、Claude发最强coding模型、Google惊艳的世界模型也亮相

AI混战日:OpenAI开源、Claude发最强coding模型、Google惊艳的世界模型也亮相

8月5日,AI领域迎来了一场震撼的“混战日”。硅谷的三大模型巨头——OpenAI、Anthropic和Google——在同一天发布了各自极具里程碑意义的模型。OpenAI推出了名为GPT-oss的开源模型,这是其继GPT-2之后的又一重大战略举措;Anthropic发布了Claude 4.1 Opus,进一步巩固了其在编程助手领域的领先地位;而Google则带来了Genie 3,一个能够生成可交互3D世界的“世界模型”。这一天,不仅是技术的展示,更是AI行业竞争格局的重塑。本文将带你深入剖析这三大模型的发布背后的战略意义,以及它们如何推动AI技术走向更复杂和多元的竞争时代。