DeepSeek V4到底什么水平?梁文锋融资的最佳选择是什么?

0 评论 363 浏览 0 收藏 12 分钟

DeepSeek V4的发布再次印证了开源与闭源大模型的微妙差距。在奥数与代码领域表现抢眼的同时,其百科检索能力暴露了数据源的天然短板,而人类终极考试HLE则仍是大模型难以逾越的高峰。本文深度剖析国产大模型领跑者面临的商业化抉择困境,从融资困局到收购可能,揭示AI创业者在技术理想与商业现实间的两难抉择。

今天V4终于上线了,我经过一番使用,发现果然没有超预期,但是也不算低于我的预期。

以下7个测试里,DeepSeek排第一的是奥数能力(Apex Shortlist)和代码能力(SWE Vertifed),其它都是中游,HLE垫底。

所有测试大家分数基本都很接近,反而是在SimpleQA里DeepSeek领先Claude和GPT不少,但大家都远远输给Gemini。

为啥?这其实只是一个简单的百科类短知识测试,比如某人哪年出生,哪地在哪国境内,就是你以前会在搜索引擎上搜的,而Gemini背后有谷歌。

DeepSeek垫底的还是HLE,人类最后的考试,这是所有模型的噩梦,超高难度的综合学科推理与通用智力测试,看各家的分数就知道,它还远远没被大模型征服,我以前有篇文章专门介绍过《什么是人类的最后一场考试》。

最终结论似乎也很简单了:在所有开源模型里,V4依然领先,但已不是遥遥领先,相比顶级闭源大模型,依然有差距,但依然差距不大。

这个结论,也是DeepSeek给自己的一个结论:强于所有开源,略输顶级闭源。

但是这个相比其它开源模型的不再遥遥领先,恰恰反映出了过去15个月以来,DeepSeek 遇到的困境。

我犹记得25年1月,R1上线,一时举世轰动,国产大模型六小龙的封号,正式成为历史,很多人甚至质疑智谱和月之暗面还继续做下去的意义是什么。

国外开源社区对DeepSeek一片好评,一众媒体也都在惊呼,难道中国AI水平即将反超美国?英伟达更是暴跌20%以表尊敬。

但是过去的15个月,DeepSeek的优势在明显缩小,而肉眼可见的未来,DeepSeek回到遥遥领先状态的概率,是不大的,因为过去一年限制它的所有因素,今天依然在限制它,包括人才流失和国产芯片。

融资,当然能缓解这件事,至少可以给内部人才发期权了,可以延缓人才流失了,但融资本身也会带来不少新问题。

我最近几天拜读了DeepMind创始人哈撒比斯的传记(为行文方便以下简称小哈),看到第七章时,心中一动:小哈当年的选择,不恰恰就是DeepSeek融资的最佳出路吗?

DeepMind成立后其实有过几轮融资,但是又要做研究,又要搞融资,智商爆表的小哈都被搞烦了,所以才会在最终的最终,索性一次性卖给了谷歌,然后自己安心加入做研究。

后来的故事我们都知道了,他做出了AlphaGO,获得了诺贝尔奖,并让Gemini迎头赶上了ChatGPT

这,难道不也正是梁文锋的最佳选择么?

我在之前的文章《感人!DeepSeek估值翻倍了》里提过:

“DeepSeek如果真要开始融资,人的因素又是个问题。如果看过梁文锋早期采访,就会发现这个团队还得有个专门管融资的人,梁的性格特质,非常不适合和那些想要尽快看到一个大饼被吹起来的投资人接触。我记得25年春节后有过一阵讨论就是,为什么中国的VC们,集体错过DeepSeek?当然,作为嘲讽VC的文章,这个视角没问题,也是一般读者爱看的,但当时我觉得更应该问一问的是,为什么DeepSeek其实没接触过多少投资人?怎么说呢,放到当下,我其实更希望看到的新闻是,DeepSeek已经直接拿到一轮天使或者A轮了,估值和金额都没那么重要了,甚至可以完全保密。因为这说明背后肯定是有了让梁非常信任的人,而他也信任梁,能答应梁相对理想化的条件。 这也说明融资这件梁相对不擅长的事情,以一种高效的方式被迅速解决了,他可以继续专注模型的研究了。 现在这种正在融资的新闻不断传出来,说明DeepSeek似乎进入了一种广撒网的阶段,且中国应该几乎没有不想投DeepSeek的基金,至少会派人去接触,这么一来一去,得分散多少时间精力?”

小梁和当年的小哈,其实遇到的是一样的困境。

DeepMind先是在2010-2013年间,拿了几轮包括Peter Thiel和马斯克的融资,之后才整体卖给了谷歌。这其中的一个因素是,Peter Thiel伤到了小哈的心。

小哈以为最初对他有知遇之恩的Peter Thiel,会在后继每轮持续支持他,然而实际上因为AlexNet在ImageNet比赛上的突破性胜利,AI在当时已经算是个热门赛道了,买卡的成本也已经高了不少。精明的从0到1大师,这次似乎不太愿意继续在从1-10下注了。他给DeepMind的评估就是,科学层面是顶级A+,商业层面是最差的F,可能永远无法盈利。

其实说起来,整体卖掉公司,尤其在早期就整体卖掉公司,还是卖给大厂,本来对很多硅谷初创公司来说,就是一种比较主流的选择,区别只是创始人马上离开还是继续加入。

Youtube创始团队其实很早就把公司卖掉了,ins和WhatsApp也是如此。这些产品后来的发展虽也曾有坎坷,但整体还是相当不错的。

所以,到时候如果真看到DeepSeek直接被某大厂收购了,你也别觉得太惊讶。在操作上,这本就并无任何的不可行性,融资就是包含收购选项的,而DeepSeek的问题是之前一直没出来谈过估值,一旦估值确定了,后面就好说了。

不进行一轮一轮的融资,在避免牵扯研究的精力之外还有一个好处,那就是如果公司走到上市IPO,是必须对商业化有个交代的,市场是会考核你的,你必须有可观的收入和利润,并且还得严控成本和资本支出,由此一来,很多关乎10年AGI大计的长远投入,就不得不受到限制了。

更别说,这些考核是永久循环的,每隔三个月,那些焦虑自己排名的基金经理和焦虑自己派点的分析师,就会来找你一次,而他们想看的仅仅只是公司增速是否beat预期。

那么问题来了,如果小梁整体加入一家公司,哪家大厂最合适呢?

在我心中,当然是那家已经和DeepSeek业务联动最多的公司。

我不会在本文中直接说出这家公司的名字,以免文章被删。

因为,这家公司本身也非常愿意整体收购DeepSeek的最大理由是:他家的模型,是比较弱的,他家的AI产品,是那种砸了红包也扶不起来的。

毕竟,双向奔赴的感情,才是最有希望长久走下去的。

当然也是因为,这家公司,也是过去相对最善待被投公司的。

我曾在某篇文章里提到过,卖了公司的张小龙,反而做成了远超他原本上限的事,这些事对他和他的收购方来说,是一场绝对重大的双赢。

张小龙不用再为融资而苦恼,彼时的他只是一个朴素的程序员啊。而后来他也可以长期让微信保持相对较低的商业化程度,慢慢探索微信里的小程序和视频号等生态。

如果微信是独立上市公司,他再坚持也很难做到这件事。

当然,其实我觉得还有一条最佳出路:DeepSeek像OpenAI一样,从开源模型转为闭源模型。但是要继续保持模型能力领先,然后像OpenAI一样开始C端收费或者加入广告。

当然这条路,除了网友不答应,梁文锋自己也不愿意吧。

本文由人人都是产品经理作者【柳胖胖】,微信公众号:【一个胖子的世界】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!