推理模型 | 人人都是产品经理

AI,个人随笔

CowAgent对接DeepSeek V4空响应排查：一个/v1路径引发的血案

开源AI助理框架CowAgent遭遇API调用难题？当配置DeepSeek V4 Pro模型后持续返回空响应时，一次从API测试到SSE解析的深度排查揭开了路径拼接的致命细节。本文不仅揭示了缺少/v1路径前缀的隐蔽陷阱，更提供了包含Thinking模式配置、max_tokens调整在内的完整解决方案，堪称AI Agent对接第三方模型的避坑指南。

布谷谷

AI Agent API调试 CowAgent

AI,个人随笔

从 DeepSeek R1 看推理模型：更强、更贵、更慢？

2024年后的大模型分工趋势愈发明显，推理模型作为其中的关键一环，因其在多步骤、复杂问题上的稳定性而备受关注。本文深入剖析推理模型的本质、优劣势及应用场景，并以DeepSeek R1为例，揭示推理能力的训练路径与实现方法。从纯强化学习到SFT+RL的组合拳，再到蒸馏技术的低成本部署，带你全面理解推理模型的演进逻辑与实战价值。

张艾拉

AI训练 DeepSeek LLM

AI

AI产品经理必修课：从“半成品”到“杀手级应用”——深度解析后训练（Post-training）

2025年AI领域最深刻的变化，不是算力的军备竞赛，而是后训练技术的战略崛起。从SFT塑造产品人格、RLHF量化用户体验，到推理模型实现System 2思考，本文以卡帕西的经典理论为框架，揭示AI产品经理如何将原始模型雕琢成商业产品。这不仅是技术解码，更是一份从'数据贵族化'到'工具路由'的实战指南。

Echo想要全链跑通

AI产品 RLHF SFT

AI

AI到顶了？OpenAI首席科学家否认，行业从堆算力转向追求智能密度

OpenAI首席研究科学家Lukasz Kaiser在《Mad》播客中深度剖析了AI发展的真实现状，反驳了“AI减速论”，并揭示了推理模型如何成为AI发展的新引擎，以及模型蒸馏技术在推动AI普及中的关键作用。

硅基观察Pro

个人观点技术演进推理模型

AI,个人随笔

深夜突袭，DeepSeek-Prover-V2加冕数学王者！671B数学推理逆天狂飙

DeepSeek-Prover-V2 发布，包含 7B 和 671B 参数模型。其训练核心依赖递归加强化学习，提升了数学推理能力。

新智元

DeepSeek 产品分析推理模型

AI,个人随笔

AI销售数据分析神器 + 超强推理模型（销售人，别错过！）

这款AI销售数据分析工具通过自动化分析和推理模型，快速生成详细报告，帮助销售团队精准定位问题、发现亮点，优化策略。无论是产品分析、地区对比还是成本结构，它都能提供全面洞察和可执行建议。

陈宇明

AI工具推理模型数据分析

AI

DeepSeek走下神坛？阿里QwQ模型32B参数吊打671B

通义千问推出的QwQ-32B模型，以仅32B的参数规模便展现出媲美甚至超越DeepSeek 671B参数模型的性能，引发了行业的广泛关注。本文将深入探讨QwQ-32B模型的技术亮点、性能表现以及其对大模型本地化和C端市场发展的潜在影响，分析阿里在大模型领域的战略布局是否有望改变当前的竞争格局，并推动AI技术的普惠化发展。

科技旋涡

DeepSeek 大模型推理模型

分析评测

Claude/混元/QwQ/DeepSeek 最全实测+拆解，谁最强谁翻车？

近期，Claude 3.7、混元（QwQ）、DeepSeek等推理模型纷纷推出新版本，引发了行业的广泛关注。为了探究这些模型的真实能力，本文通过编程、文本创作、悬疑推理、策略规划和实时信息搜索等五大任务维度，对Claude 3.7、QwQ、DeepSeek R1以及混元T1进行了全面实测与深度拆解。