为什么说DeepSeek，气质特殊？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

伯虎财经

2026-05-27

0 评论 516 浏览 0 收藏

9 分钟

在AI行业疯狂内卷的背景下，DeepSeek以独特的节奏和理念逆势突围。创始人梁文锋将量化交易的成功经验注入AI研发，用算法优化思维打造出效率惊人的R1模型。这家不设KPI、倡导自下而上创新的公司，正在用国产算力挑战行业共识。当同行追逐风口时，DeepSeek为何坚持深耕底层技术？

过去两年AI公司忙死了！有多夸张？今年1月，国内平均1.5天就有一个新模型发布。OpenAI火了，大家做Chatbot；多模态热了，冲视频生成；Agent一爆，又去搞智能体。整个行业，像一场大型军备竞赛。

但DeepSeek却显得很“慢”。最近发布的V4距离V3发布，间隔长达484天。

这到底是为什么？

其实这种反常的节奏，和创始人梁文锋有很大关系。

梁文锋2015年做幻方量化，其实很早就财富自由了。怎么赚的钱呢？简单说，就是用算法炒股，让AI去理解人性和市场的非理性。

2019年，当很多大厂还没搞清大模型是什么的时候，他已经开始囤GPU。

到了2022年，ChatGPT横空出世，AI一下子被推到了全球中心。第二年，梁文锋直接把幻方的核心资源转向大模型研发，成立了DeepSeek团队。

在他看来，通用人工智能的时代已经开始了。而这个战场的想象力，远比量化交易要大得多。

而DeepSeek本身是一家公司气质很特殊的公司。

首先是梁文锋本人，特别不像一个典型CEO。很少露面、不怎么接受采访、不参加聚餐。

内部也很特别。没有严格KPI，没有硬性DDL，不打卡，大部分员工下午六七点就下班。

这其实挺魔幻的。因为无论是OpenAI、Google、还是国内大厂，核心AI团队都是在高强度运转的。

但梁文锋的观点是：人一天真正高质量工作的时间，其实只有6到8小时。后面很多加班，本质上是在制造低质量决策，还浪费算力。

因此，DeepSeek内部更偏向“自下而上”的协作方式。很多项目不是被分配出来的，而是三五个人觉得某个方向有意思，就自发组队开始做。明确价值之后，再逐步投入资源。

结果就是，这家公司真的在这种“不卷”的状态下，把东西做出来了。

DeepSeek V3和R1发布之后引发行业或者说是全球震动，尤其是R1。它用不到OpenAI十分之一的成本，达到了接近GPT-o1的能力。

这件事第一次让很多人意识到：中国AI与美国之间的差距，可能并没有想象中那么大。

过去行业有一个共识：中国大模型整体落后美国两三年，而且在高端GPU受限的情况下，这种差距可能会继续扩大。

但DeepSeek用一种“以小博大”的方式，直接打破了这种叙事。

DeepSeek最核心的能力，不是参数规模，也不是资金投入，而是效率。

因为在技术路径上，很多公司选择“堆算力”，但DeepSeek更像一个做算法优化的团队：它不断思考一个问题，能不能用更少资源，做出更强模型？

以R1为例，此前传统大模型每次处理问题都是激活全部参数，但杀鸡焉用牛刀，很多问题并不需要那么多资源投入。而R1,会先让大模型先判断问题类型，再精准调用对应的模块。比如数学题交给逻辑推理单元，写诗交给文学模块处理。

同时，选择从垂直场景切入，追求在部分领域的表现更优，再逐步完善。

所以，我们会发现DeepSeek长期专注于底层优化。包括稀疏注意力、长上下文、训练效率提升等方向，甚至尝试将底层算子体系从CUDA、Triton逐步迁移到国产开源生态。

这背后，其实是梁文锋对AGI的一种理解。

他非常重视两件事。

第一，是国产生态。DeepSeek一直在适配国产GPU，例如V3.1中的FP8设计，就是为下一代国产芯片做准备。他曾提出一个很核心的问题：能不能用现有的一部分算力，实现更普适的智能能力？V4与华为昇腾的合作中，完成了从训练到推理的全栈适配。证明了用国产算力训出顶级模型这条路是走得通的。

第二，是原创式创新。

DeepSeek持续探索一些短期回报不确定的方向，比如Janus统一多模态理解与生成，Prover形式化证明，OCR优化，以及持续学习、类脑计算等研究。所以他坚持开源，他说：“开源不是损失，而是一种文化表达。对技术人来说，被全世界follow，本身就是最大的荣誉。”

但问题也来了，理想主义是有成本的。尤其在AI进入高速竞争阶段之后。因为现在行业拼的，已经不只是“谁先做出来”，而是“谁更新更快”。

OpenAI在卷Agent，Anthropic在卷Coding，Google和字节在卷视频生成，国内同行也都在疯狂迭代。

但DeepSeek的节奏，明显更慢。它没有全力押注Agent，也没有All in多模态生成。于是争议也变多了。有人觉得它太慢了；有人觉得它错过风口；还有人觉得，它太沉迷技术理想主义。

而更现实的问题是人才。现在AI行业最稀缺的就是人才。DeepSeek已经有一些核心成员被挖走。包括参与早期模型训练的王炳宣、R1核心作者郭达雅，还有OCR核心作者魏浩然。

原因也很简单：外面给得太多了。

猎头直接开两三倍薪资，甚至八位数总包。再加上智谱、MiniMax上市之后估值大涨，Kimi、阶跃也在冲IPO。

相比之下，DeepSeek长期没有明确估值，员工手里的期权到底值多少钱，其实没人知道。这也是为什么，最近会不断传出DeepSeek准备融资的消息。虽然官方还没回应，但并不难理解。一方面，给员工更明确的预期；另一方面，也意味着DeepSeek开始真正进入下一阶段。

值得一提的是，有媒体报道，虽然外界不断挖人，但仍有不少人选择留在DeepSeek。

原因是这里更鼓励研究，也更尊重原创。

就像梁文锋说的那样，对顶级人才吸引最大的，肯定是去解决世界上最难的问题。

而现在，DeepSeek就在做这件事。

说实话，DeepSeek接下来发展怎么样，很难下结论。

但它已经改变了很多东西：它让中国AI重新开始重视底层创新，也让很多人第一次意识到，中国AI未必只能跟跑。

至于外界的纷纷扰扰，DeepSeek的回应是：“不诱于誉，不恐于诽，率道而行，端然正己。”

本文由人人都是产品经理作者【伯虎财经】，微信公众号：【伯虎财经】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

伯虎财经

伯虎团队聚焦头部企业，以深度原创为特色，为你发掘精彩的商业价值。

159篇作品 350858总阅读量

从精准洞察到共鸣共振，综艺营销的短期效果和长期机会｜2022内容营销名场面

01-147792 浏览

甲方的绝杀：别的品牌也能用啊

07-072943 浏览

官宣！起点会员重大升级！2023行业大会/职业体系课等全新权益等你来解锁

05-277708 浏览

入局跑腿业务，滴滴、高德们找到新战场

12-052269 浏览

视频号2022复盘：演唱会破圈，百万粉创作者涌现，电商闭环或迎来爆发

01-163282 浏览

目前还没评论，等你发挥！