个人随笔 做题家vs科学家:一个30B模型如何颠覆万亿参数的AI军备竞赛 当AI行业陷入万亿参数的军备竞赛时,MiroThinker 1.5用30B参数重新定义了智能的本质。这款模型通过‘科学家模式’的训练理念,将主动查证、多轮校验与自我修正内化为核心能力,在多个基准测试中媲美甚至超越超大模型。本文深度解析其Interactive Scaling技术如何突破传统Scaling Law的天花板,为AI发展路径提供全新思路。 深思圈 AI产品技术原理案例分析
AI 最近聊爆的Skills 到底是啥?请用通俗易懂的话告诉我 Prompt的时代正在被Claude Skills彻底颠覆。这款工具将零散的提示词转化为持久化、模块化的能力包,让AI不再‘失忆’,而是真正掌握程序性知识和执行逻辑。通过渐进式披露的精妙设计,Skills实现了数百种能力的懒加载,同时与MCP形成完美互补。本文不仅详解Skills的核心机制,更手把手教你打造企业级代码审查专家,揭示AI从‘工具’跃升为‘数字员工’的关键进化。 虾灰鱼 AI应用ClaudeMCP
AI,个人随笔 对话 John Schulman:如果带着 2025 的记忆回到十年前,OpenAI 能多快造出 ChatGPT? OpenAI联合创始人John Schulman的最新访谈揭示了AI领域的关键认知变革:后训练阶段的精细化操作比单纯堆砌算力更能释放模型潜力。他的新项目Thinking Machines正致力于终结AI开发的‘炼金术时代’,通过引入可拆解的‘原语’构建标准化训练流程。本文深度解析了从强化学习进化到多模态突破的技术趋势,并为创业者提炼出2025年AI赛道的三条实战法则。 张艾拉 AI创业ChatGPTOpenAI
AI,个人随笔 用 Agent Skill 倒推 AI 应用解决方案 最近发现Agent skill 真的非常很好用,完全可以把我之前的很多项目都用skill重新做一遍了,同时也发现了skill的一种好玩的用法。 本文主要介绍了skill的一种特殊用法:用 Agent Skill 倒推 AI 应用解决方案 猫猫观察员的AI思考 AgentAI应用Skills
个人随笔 从原理切入,看大模型的未来 当罗永浩与豆包的辩论展现出AI的情感交互能力,大模型已从效率工具转向情感化设计新阶段。本文从温度参数调控到Prompt工程,深度解析大模型如何通过自训练与引导优化实现人格化进化。通过对比人类成长三要素,揭示AI发展正从技术竞赛转向人性化共生的未来路径。 潮生 AI产品个人观点技术原理
AI Agent应用模型选型,为什么技术参数不是唯一标尺?我用这个框架解决80%的争议 当研发拿着最新的开源模型评测榜单,兴奋地告诉你“这个模型数学推理能力又提升了5%”,而你正在为下个季度提升15%的用户留存绞尽脑汁时,该如何抉择?这不是虚构的场景,而是2026年,每一位涉足AI领域的产品经理每天都在经历的“甜蜜烦恼”。 红岸小兵 AgentAI产品技术原理
AI 梁文锋DeepSeek新论文!接棒何恺明和字节,又稳了稳AI的“地基” 十年未变的Transformer底层架构迎来突破!DeepSeek提出mHC新方法,用"数学护栏"解决多路径信号传输稳定性难题。这不仅是残差连接的升级,更是中国AI团队在基础架构领域的一次硬核"秀肌肉"。 硅星人 AI产品DeepSeek技术原理
AI 告别“调教”:Claude Skills 正在终结 AI 的“草台班子”时代 Claude Skills 不仅仅是一个新功能,它是 AI 从“聊天框玩具”走向“工业级应用”的分水岭——它将“提示词工程”彻底升级为了“上下文工程”。 LBJ-山顶见 AI应用ClaudeSkills
AI 一寸短一寸险:小模型反杀的核心逻辑——模型蒸馏 2024年AI圈还在疯狂比拼模型参数量,2025年风向突变——推理成本和部署效率成为关键指标。DeepSeek用37B参数模型蒸馏出7B小模型却能对标70B性能,揭示了模型瘦身的革命性突破。本文将深入解析量化、剪枝、蒸馏三大核心技术,特别是思维链蒸馏如何让小模型真正'学会思考'而非'死记硬背',带你看懂AI落地从'大力出奇迹'到'精巧实用'的范式转移。 击水三千 DeepSeek技术原理模型蒸馏
AI,个人随笔 DeepSeek发布重磅技术mHC:给大模型训练装上“智能限速器”,解决AI界头痛的稳定性难题 大模型训练的稳定性问题一直是AI领域的痛点,DeepSeek最新发布的流形约束超连接(mHC)技术给出了惊艳的解决方案。这项创新不仅将信号放大控制在1.6倍内实现稳定训练,更在270亿参数模型上实现了多项任务性能2%以上的提升。对于产品经理而言,这意味着30%的算力成本降低和更快的迭代速度,或将重塑AI行业的竞争格局。 Alex的荒诞产品观 DeepSeek个人观点技术原理
AI 万字观止:别让RAG“失真”——“语料质量”方是企业级知识库落地的通关钥匙 2025年,RAG(Retrieval-Augmented Generation)几乎成了大模型项目落地的标配技术。从客服机器人到智能问答助手,从合规审查到业务支持,RAG系统正在重塑企业知识流动的方式。本文将带你穿越RAG的技术迷雾,回到第一性原理:RAG系统的核心,是构建一套“可检索、可生成、可信任”的知识库语料体系。 徐泽谦 RAG技术原理知识库
AI,个人随笔 RAG前生今世:重塑AI记忆的大模型“外挂”进化史 RAG技术正在重塑大语言模型的应用边界!从最初的朴素检索到如今的多模态融合,这项技术如何突破AI的‘参数茧房’?本文将深度解析RAG从概念诞生到GraphRAG演进的全过程,揭示其在知识时效性、专业领域准确性和数据隐私保护方面的革命性突破。 阿洋聊AI LLMRAG企业级架构