为什么说DeepSeek,气质特殊?
在AI行业疯狂内卷的背景下,DeepSeek以独特的节奏和理念逆势突围。创始人梁文锋将量化交易的成功经验注入AI研发,用算法优化思维打造出效率惊人的R1模型。这家不设KPI、倡导自下而上创新的公司,正在用国产算力挑战行业共识。当同行追逐风口时,DeepSeek为何坚持深耕底层技术?

过去两年AI公司忙死了!有多夸张?今年1月,国内平均1.5天就有一个新模型发布。OpenAI火了,大家做Chatbot;多模态热了,冲视频生成;Agent一爆,又去搞智能体。整个行业,像一场大型军备竞赛。
但DeepSeek却显得很“慢”。最近发布的V4距离V3发布,间隔长达484天。
这到底是为什么?
其实这种反常的节奏,和创始人梁文锋有很大关系。
梁文锋2015年做幻方量化,其实很早就财富自由了。怎么赚的钱呢?简单说,就是用算法炒股,让AI去理解人性和市场的非理性。
2019年,当很多大厂还没搞清大模型是什么的时候,他已经开始囤GPU。
到了2022年,ChatGPT横空出世,AI一下子被推到了全球中心。第二年,梁文锋直接把幻方的核心资源转向大模型研发,成立了DeepSeek团队。
在他看来,通用人工智能的时代已经开始了。而这个战场的想象力,远比量化交易要大得多。
而DeepSeek本身是一家公司气质很特殊的公司。
首先是梁文锋本人,特别不像一个典型CEO。很少露面、不怎么接受采访、不参加聚餐。
内部也很特别。没有严格KPI,没有硬性DDL,不打卡,大部分员工下午六七点就下班。
这其实挺魔幻的。因为无论是OpenAI、Google、还是国内大厂,核心AI团队都是在高强度运转的。
但梁文锋的观点是:人一天真正高质量工作的时间,其实只有6到8小时。后面很多加班,本质上是在制造低质量决策,还浪费算力。
因此,DeepSeek内部更偏向“自下而上”的协作方式。很多项目不是被分配出来的,而是三五个人觉得某个方向有意思,就自发组队开始做。明确价值之后,再逐步投入资源。
结果就是,这家公司真的在这种“不卷”的状态下,把东西做出来了。
DeepSeek V3和R1发布之后引发行业或者说是全球震动,尤其是R1。它用不到OpenAI十分之一的成本,达到了接近GPT-o1的能力。
这件事第一次让很多人意识到:中国AI与美国之间的差距,可能并没有想象中那么大。
过去行业有一个共识:中国大模型整体落后美国两三年,而且在高端GPU受限的情况下,这种差距可能会继续扩大。
但DeepSeek用一种“以小博大”的方式,直接打破了这种叙事。
DeepSeek最核心的能力,不是参数规模,也不是资金投入,而是效率。
因为在技术路径上,很多公司选择“堆算力”,但DeepSeek更像一个做算法优化的团队:它不断思考一个问题,能不能用更少资源,做出更强模型?
以R1为例,此前传统大模型每次处理问题都是激活全部参数,但杀鸡焉用牛刀,很多问题并不需要那么多资源投入。而R1,会先让大模型先判断问题类型,再精准调用对应的模块。比如数学题交给逻辑推理单元,写诗交给文学模块处理。
同时,选择从垂直场景切入,追求在部分领域的表现更优,再逐步完善。
所以,我们会发现DeepSeek长期专注于底层优化。包括稀疏注意力、长上下文、训练效率提升等方向,甚至尝试将底层算子体系从CUDA、Triton逐步迁移到国产开源生态。
这背后,其实是梁文锋对AGI的一种理解。
他非常重视两件事。
第一,是国产生态。DeepSeek一直在适配国产GPU,例如V3.1中的FP8设计,就是为下一代国产芯片做准备。他曾提出一个很核心的问题:能不能用现有的一部分算力,实现更普适的智能能力?V4与华为昇腾的合作中,完成了从训练到推理的全栈适配。证明了用国产算力训出顶级模型这条路是走得通的。
第二,是原创式创新。
DeepSeek持续探索一些短期回报不确定的方向,比如Janus统一多模态理解与生成,Prover形式化证明,OCR优化,以及持续学习、类脑计算等研究。所以他坚持开源,他说:“开源不是损失,而是一种文化表达。对技术人来说,被全世界follow,本身就是最大的荣誉。”
但问题也来了,理想主义是有成本的。尤其在AI进入高速竞争阶段之后。因为现在行业拼的,已经不只是“谁先做出来”,而是“谁更新更快”。
OpenAI在卷Agent,Anthropic在卷Coding,Google和字节在卷视频生成,国内同行也都在疯狂迭代。
但DeepSeek的节奏,明显更慢。它没有全力押注Agent,也没有All in多模态生成。于是争议也变多了。有人觉得它太慢了;有人觉得它错过风口;还有人觉得,它太沉迷技术理想主义。
而更现实的问题是人才。现在AI行业最稀缺的就是人才。DeepSeek已经有一些核心成员被挖走。包括参与早期模型训练的王炳宣、R1核心作者郭达雅,还有OCR核心作者魏浩然。
原因也很简单:外面给得太多了。
猎头直接开两三倍薪资,甚至八位数总包。再加上智谱、MiniMax上市之后估值大涨,Kimi、阶跃也在冲IPO。
相比之下,DeepSeek长期没有明确估值,员工手里的期权到底值多少钱,其实没人知道。这也是为什么,最近会不断传出DeepSeek准备融资的消息。虽然官方还没回应,但并不难理解。一方面,给员工更明确的预期;另一方面,也意味着DeepSeek开始真正进入下一阶段。
值得一提的是,有媒体报道,虽然外界不断挖人,但仍有不少人选择留在DeepSeek。
原因是这里更鼓励研究,也更尊重原创。
就像梁文锋说的那样,对顶级人才吸引最大的,肯定是去解决世界上最难的问题。
而现在,DeepSeek就在做这件事。
说实话,DeepSeek接下来发展怎么样,很难下结论。
但它已经改变了很多东西:它让中国AI重新开始重视底层创新,也让很多人第一次意识到,中国AI未必只能跟跑。
至于外界的纷纷扰扰,DeepSeek的回应是:“不诱于誉,不恐于诽,率道而行,端然正己。”
本文由人人都是产品经理作者【伯虎财经】,微信公众号:【伯虎财经】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!

起点课堂会员权益




