"DeepSeek"相关的文章
AI,个人随笔
别骂国产大模型了,老外们正用得不亦乐乎

别骂国产大模型了,老外们正用得不亦乐乎

当里约市政府发布的Rio 3.5开源模型被证实六成权重来自中国Nex-AGI、四成来自阿里Qwen时,全球AI圈再次见证了中国开源模型的渗透力。从日本乐天到Airbnb,从OpenCode到Notion,中国开源模型正以性价比和确定性改写开发者的工具链选择。本文通过套壳事件、商业应用与榜单评测的对比,揭示国产模型在海外崛起与国内争议的割裂现状。
AI
算力差距下的中美AI竞赛:数据、事实与破局点

算力差距下的中美AI竞赛:数据、事实与破局点

当Anthropic的10万亿参数Mythos模型因性能过强被美国政府封锁时,中国最强模型DeepSeek V4 Pro仍停留在1.6万亿参数规模。本文深度剖析中美AI竞赛中算力鸿沟的残酷现实:美国科技巨头年投入超7250亿美元资本开支,单家企业算力就超过中国AI产业总和。国产GPU如何在软件生态孱弱、训练芯片缺失的困境中寻找突围路径?
AI
大厂开始收紧AI Token:从无限用到现在不够花

大厂开始收紧AI Token:从无限用到现在不够花

从无限额狂欢到精打细算,互联网公司的AI Token策略正在经历剧烈调整。腾讯、字节等大厂纷纷将统一额度改为动态调配,而中小公司更是直接砍至人均500美元。这场由Token-maxxing引发的狂欢背后,是惊人的资源浪费与效率质疑。当Claude Sonnet单日消耗达50美元,当《红楼梦》续写成为消耗手段,行业终于开始重新思考AI工具的真实价值。
AI,个人随笔
CowAgent对接DeepSeek V4空响应排查:一个/v1路径引发的血案

CowAgent对接DeepSeek V4空响应排查:一个/v1路径引发的血案

开源AI助理框架CowAgent遭遇API调用难题?当配置DeepSeek V4 Pro模型后持续返回空响应时,一次从API测试到SSE解析的深度排查揭开了路径拼接的致命细节。本文不仅揭示了缺少/v1路径前缀的隐蔽陷阱,更提供了包含Thinking模式配置、max_tokens调整在内的完整解决方案,堪称AI Agent对接第三方模型的避坑指南。
AI,个人随笔
产品经理手搓配图工具:三次迭代,找图从 30 分钟压到 5 分钟

产品经理手搓配图工具:三次迭代,找图从 30 分钟压到 5 分钟

当内容创作者还在为配图效率苦恼时,Claude与DeepSeek的联合作业给出了自动化解决方案。这个自研工具通过Markdown标记、关键词自动提取与Pexels素材库联动,将找图时间从30分钟压缩至5分钟。更值得关注的是,产品经理通过解决自身痛点获得的实战经验,正在重塑对AI工具价值的认知。
AI
给中国大模型提个醒:最重要一场战争要来了

给中国大模型提个醒:最重要一场战争要来了

中国大模型行业正陷入技术狂欢与商业落地的巨大断层。当DeepSeek、Kimi和豆包在参数竞赛中厮杀时,Anthropic已用编程与办公赛道验证了LLM商业化的黄金公式——本文深度剖析为何这两个十万亿美元级赛道才是大模型公司的终极战场,以及中国玩家该如何打破认知陷阱,在窗口关闭前造出真正的'车'而非'引擎'。