"DeepSeek"相关的文章
AI,个人随笔
DeepSeek V4来了,把技术报告啃了一遍,说说我的真实看法

DeepSeek V4来了,把技术报告啃了一遍,说说我的真实看法

DeepSeek V4的发布不仅是一次技术迭代,更是一场AI行业的降维打击。1.6T参数的MoE架构、100万token上下文的高效处理、MIT协议开源,再加上仅为竞品1/7的定价策略,这款中国AI大模型正以颠覆性的技术架构和商业逻辑重新定义行业标准。本文将从模型架构、训练方法到地缘政治影响,全面解析V4如何改写AI竞争格局。
AI,个人随笔
DeepSeek V4到底什么水平?梁文锋融资的最佳选择是什么?

DeepSeek V4到底什么水平?梁文锋融资的最佳选择是什么?

DeepSeek V4的发布再次印证了开源与闭源大模型的微妙差距。在奥数与代码领域表现抢眼的同时,其百科检索能力暴露了数据源的天然短板,而人类终极考试HLE则仍是大模型难以逾越的高峰。本文深度剖析国产大模型领跑者面临的商业化抉择困境,从融资困局到收购可能,揭示AI创业者在技术理想与商业现实间的两难抉择。
AI
DeepSeek再放大招,国产大模型坐不住了

DeepSeek再放大招,国产大模型坐不住了

沉寂十五个月的DeepSeek以V4系列模型强势回归,不仅用1.6万亿参数刷新开源模型天花板,更完成从英伟达到华为昇腾的生态迁移。Pro版性能直逼顶级闭源模型,Flash版实现低成本推理,标配百万token上下文彻底改变开发者游戏规则。这场技术突围背后,是国产硬件生态突围与推理成本控制的深度博弈。
AI,个人随笔
复盘DeepSeek V4叙事策略: 一场预期违背的反转式公关

复盘DeepSeek V4叙事策略: 一场预期违背的反转式公关

DeepSeek V4的发布看似低调,实则暗藏玄机。这场没有盛大发布会的更新,通过极简的API文档和社交媒体推送,巧妙完成了从技术迭代到品牌升级的多重战略目标。本文将拆解其'先抑后扬'的发布策略,揭示如何将15个月的'技术沉默'转化为品牌资产,以及百万字上下文窗口与国产算力组合拳背后的商业智慧。
AI,个人随笔
DeepSeek不想只做大模型了

DeepSeek不想只做大模型了

DeepSeek V4的发布不仅是技术参数的升级,更是国产算力与AI产业深度融合的信号。在1.6万亿参数、百万token上下文的性能背后,最值得玩味的是定价说明中关于昇腾950的那行小字——它揭示了模型公司正在将价格战与国产芯片的供给节奏深度绑定。本文将从技术路径、算力博弈与商业压力三个维度,拆解这场正在改写中国AI产业规则的暗线战争。
AI,个人随笔
DeepSeek告别“孤胆英雄”时代

DeepSeek告别“孤胆英雄”时代

DeepSeek V4的发布不仅标志着其在Agent能力和推理技术上的重大突破,更揭示了这家中国AI独角兽从研究团队向基础设施级玩家的战略转变。面对训练成本飙升、人才争夺战和生态布局需求,DeepSeek正在与腾讯、阿里展开18亿美元融资谈判,这场关乎中国大模型未来格局的资本博弈背后,隐藏着技术路线与商业逻辑的深层抉择。