个人随笔 病历质检优化实践 医疗AI系统的架构迭代正经历从野蛮生长到精细设计的转变。本文以口腔诊疗场景为例,深度拆解如何通过中间件路由、RAG规则解耦和思维链编排三大技术方案,将原本臃肿的百节点系统重构为灵活高效的智能引擎,实现从'病种爆炸'到'零代码维护'的跨越式升级。 里奥 LLM应用RAG医疗AI
AI AI 编程的“减肥”革命:CodeACT 带来的高效进化故事 在代码大模型训练陷入‘数据海战术’困境的2024年,南京航空航天大学的研究团队带来了突破性解决方案CodeACT。这套结合‘学霸式精准刷题’CDAS算法与‘俄罗斯方块式打包’Dynamic Pack的技术框架,仅用40%数据就让模型性能提升8.6%,训练速度提升4倍,重新定义了AI训练的效率革命。本文深度解析这场关于‘少即是多’的技术哲学实践如何改变大模型进化范式。 yan AI编程CodeACT大模型训练
AI,个人随笔 DPO:当行业开始嫌 RLHF 太累的时候 DPO的诞生揭示了AI训练领域的一个残酷真相:RLHF虽有效却如同苦役。这种新方法摒弃复杂的评分体系,回归人类最本能的偏好判断,不仅解放了训练师,更重塑了大模型对齐的工程实践。本文将深入解析DPO如何用『二选一』的朴素智慧,解决RLHF时代的技术沉疴与人性困境。 青蓝色的海 AI对齐DPORLHF