"开源模型"相关的文章
AI
开个脑洞:如果DeepSeek和Kimi们合并

开个脑洞:如果DeepSeek和Kimi们合并

中国AI领域正上演一场技术与商业的深度碰撞。DeepSeek与Kimi在16个月内多次技术路线迎头相撞,从MLA注意力机制到Muon优化器,从国产芯片适配到全球市场开拓,两家公司的互补性正在构建中国大模型的事实标准。本文假设性探讨:若这两家开源巨头合并,将如何重塑技术底座、商业格局与全球AI竞争态势?
AI,个人随笔
DeepSeek V4到底什么水平?梁文锋融资的最佳选择是什么?

DeepSeek V4到底什么水平?梁文锋融资的最佳选择是什么?

DeepSeek V4的发布再次印证了开源与闭源大模型的微妙差距。在奥数与代码领域表现抢眼的同时,其百科检索能力暴露了数据源的天然短板,而人类终极考试HLE则仍是大模型难以逾越的高峰。本文深度剖析国产大模型领跑者面临的商业化抉择困境,从融资困局到收购可能,揭示AI创业者在技术理想与商业现实间的两难抉择。
AI
DeepSeek再放大招,国产大模型坐不住了

DeepSeek再放大招,国产大模型坐不住了

沉寂十五个月的DeepSeek以V4系列模型强势回归,不仅用1.6万亿参数刷新开源模型天花板,更完成从英伟达到华为昇腾的生态迁移。Pro版性能直逼顶级闭源模型,Flash版实现低成本推理,标配百万token上下文彻底改变开发者游戏规则。这场技术突围背后,是国产硬件生态突围与推理成本控制的深度博弈。
AI
DeepSeek V4的五个关键信号

DeepSeek V4的五个关键信号

DeepSeek V4的发布掀起了开源与闭源大模型的定价风暴!1.6万亿参数的V4-Pro与284B参数的V4-Flash双双开源,百万token上下文成为标配,输出价格低至GPT-5.5的1/100。混合注意力架构与Muon优化器的突破,让长文本处理成本骤降70%以上。这场技术迭代背后,是国产AI在算力适配与Agent生态建设的系统性突围。
AI
梁文锋想通了

梁文锋想通了

DeepSeek百亿美元融资传闻背后,是中国AI竞争逻辑的深刻转向。这家曾以“技术奇迹”和开源理想著称的公司,正面临产品入口、多模态、生态闭环与人才激励的多重挑战。本文深度剖析其从研究机构回归商业公司的必经之路,以及融资背后关于估值、期权与长期竞争力的真实博弈。
AI,个人随笔
从Hermes的微调策略看AI产品的场景化落地

从Hermes的微调策略看AI产品的场景化落地

当多数AI工具陷入「越用越平庸」的怪圈时,Hermes带来了颠覆性的进化逻辑。这款开源AI Agent不仅能记住用户对话历史,更会通过Skill系统持续沉淀解决方案,实现真正的「越用越聪明」。从零配置部署到动态学习循环,它为解决AI落地难题提供了全新范式——或许真正的智能不在于预设完美方案,而在于和用户共同成长的能力。