"开源模型"相关的文章
AI,个人随笔
用 MiniMax 把 M3 跑了几天,我对国产开源模型的判断

用 MiniMax 把 M3 跑了几天,我对国产开源模型的判断

MiniMax M3的发布不仅刷新了国产开源模型的性能上限,更关键的是它首次将长上下文、Agentic Coding和原生多模态三大核心能力整合在单一模型中,彻底改变了AI工作流的拼接架构。本文从实际应用场景出发,深入剖析M3如何通过1/20的计算成本突破,让曾经因成本过高而搁置的产品方案重获商业可行性,同时揭示开源生态可能面临的重新洗牌。
AI
AI的中场危机:没人能轻松获益,所有人都在焦虑

AI的中场危机:没人能轻松获益,所有人都在焦虑

AI行业的疲惫感正在全球蔓延,从开发者到普通用户都陷入选择焦虑与成本困境。2026年模型市场呈现诡异局面:顶级模型成为精英专属工具,普惠版本却普遍降智,行业两极分化加剧。本文深度剖析算力瓶颈、语料枯竭等底层原因,揭示企业市场变现难题,并探讨如何打破这场由技术停滞引发的系统性危机。
AI,个人随笔
我用了一个外卖公司做的 AI,然后它悄悄变成了我的日常工具

我用了一个外卖公司做的 AI,然后它悄悄变成了我的日常工具

当美团推出AI大模型LongCat-2601时,多数人的第一反应是质疑——一个外卖公司能做AI?然而,这款在工具调用能力和响应速度上表现突出的开源模型,正在颠覆行业对AI产品出身的刻板认知。本文从真实使用场景出发,深入解析LongCat如何用'战场式训练'打造出独特的工具调用能力,同时坦诚面对它的现存短板,为AI从业者提供一份务实的选型指南。
AI
开个脑洞:如果DeepSeek和Kimi们合并

开个脑洞:如果DeepSeek和Kimi们合并

中国AI领域正上演一场技术与商业的深度碰撞。DeepSeek与Kimi在16个月内多次技术路线迎头相撞,从MLA注意力机制到Muon优化器,从国产芯片适配到全球市场开拓,两家公司的互补性正在构建中国大模型的事实标准。本文假设性探讨:若这两家开源巨头合并,将如何重塑技术底座、商业格局与全球AI竞争态势?
AI,个人随笔
DeepSeek V4到底什么水平?梁文锋融资的最佳选择是什么?

DeepSeek V4到底什么水平?梁文锋融资的最佳选择是什么?

DeepSeek V4的发布再次印证了开源与闭源大模型的微妙差距。在奥数与代码领域表现抢眼的同时,其百科检索能力暴露了数据源的天然短板,而人类终极考试HLE则仍是大模型难以逾越的高峰。本文深度剖析国产大模型领跑者面临的商业化抉择困境,从融资困局到收购可能,揭示AI创业者在技术理想与商业现实间的两难抉择。
AI
DeepSeek再放大招,国产大模型坐不住了

DeepSeek再放大招,国产大模型坐不住了

沉寂十五个月的DeepSeek以V4系列模型强势回归,不仅用1.6万亿参数刷新开源模型天花板,更完成从英伟达到华为昇腾的生态迁移。Pro版性能直逼顶级闭源模型,Flash版实现低成本推理,标配百万token上下文彻底改变开发者游戏规则。这场技术突围背后,是国产硬件生态突围与推理成本控制的深度博弈。
AI
DeepSeek V4的五个关键信号

DeepSeek V4的五个关键信号

DeepSeek V4的发布掀起了开源与闭源大模型的定价风暴!1.6万亿参数的V4-Pro与284B参数的V4-Flash双双开源,百万token上下文成为标配,输出价格低至GPT-5.5的1/100。混合注意力架构与Muon优化器的突破,让长文本处理成本骤降70%以上。这场技术迭代背后,是国产AI在算力适配与Agent生态建设的系统性突围。
AI
梁文锋想通了

梁文锋想通了

DeepSeek百亿美元融资传闻背后,是中国AI竞争逻辑的深刻转向。这家曾以“技术奇迹”和开源理想著称的公司,正面临产品入口、多模态、生态闭环与人才激励的多重挑战。本文深度剖析其从研究机构回归商业公司的必经之路,以及融资背后关于估值、期权与长期竞争力的真实博弈。