"推理模型"相关的文章
AI,个人随笔
从 DeepSeek R1 看推理模型:更强、更贵、更慢?

从 DeepSeek R1 看推理模型:更强、更贵、更慢?

2024年后的大模型分工趋势愈发明显,推理模型作为其中的关键一环,因其在多步骤、复杂问题上的稳定性而备受关注。本文深入剖析推理模型的本质、优劣势及应用场景,并以DeepSeek R1为例,揭示推理能力的训练路径与实现方法。从纯强化学习到SFT+RL的组合拳,再到蒸馏技术的低成本部署,带你全面理解推理模型的演进逻辑与实战价值。
AI
AI产品经理必修课:从“半成品”到“杀手级应用”——深度解析后训练(Post-training)

AI产品经理必修课:从“半成品”到“杀手级应用”——深度解析后训练(Post-training)

2025年AI领域最深刻的变化,不是算力的军备竞赛,而是后训练技术的战略崛起。从SFT塑造产品人格、RLHF量化用户体验,到推理模型实现System 2思考,本文以卡帕西的经典理论为框架,揭示AI产品经理如何将原始模型雕琢成商业产品。这不仅是技术解码,更是一份从'数据贵族化'到'工具路由'的实战指南。
AI
DeepSeek走下神坛?阿里QwQ模型32B参数吊打671B

DeepSeek走下神坛?阿里QwQ模型32B参数吊打671B

通义千问推出的QwQ-32B模型,以仅32B的参数规模便展现出媲美甚至超越DeepSeek 671B参数模型的性能,引发了行业的广泛关注。本文将深入探讨QwQ-32B模型的技术亮点、性能表现以及其对大模型本地化和C端市场发展的潜在影响,分析阿里在大模型领域的战略布局是否有望改变当前的竞争格局,并推动AI技术的普惠化发展。