个人随笔 大模型竞赛转向:决胜关键为何是“后训练”? 当前,通用模型在产业落地中面临知识断层、难以对齐用户隐性偏好等难题,而后训练正是解决这些 “最后一公里” 问题的核心。业界已探索出 SFT+RL、纯 RL 等训练范式,MoE 模型、FP8 精度等技术也成为后训练的重要选择。本文解析后训练的关键价值、产业痛点及顶级玩家的实践路径,探讨其如何成为大模型价值释放的决胜场,以及云平台在其中的支撑作用。 甲子光年 后训练大模型技术原理
AI Transformer终结者!谷歌DeepMind全新MoR架构问世,新一代魔王来了 Transformer杀手来了?KAIST、谷歌DeepMind等机构刚刚发布的MoR架构,推理速度翻倍、内存减半,直接重塑了LLM的性能边界,全面碾压了传统的Transformer。网友们直呼炸裂:又一个改变游戏规则的炸弹来了。 新智元 AI产品LLM技术原理
AI,个人随笔 为什么 RAG 能让 AI 更 “聪明”?工作原理深度拆解 在人工智能领域,大语言模型(LLM)的快速发展为自然语言处理带来了革命性的突破。然而,这些模型在处理实时信息、专业领域知识以及确保回答准确性和可靠性方面仍面临挑战。本文将深入探讨一种名为RAG(Retrieval-Augmented Generation,检索增强生成)的技术框架,它通过结合信息检索与大语言模型的生成能力,为AI模型提供了强大的外挂支持。 梧桐AI RAG基础知识技术原理
AI,个人随笔 一文读懂MCP及三大传输协议 通过MCP,AI模型能够以统一的方式访问资源和工具,从而实现更高效、更智能的交互体验。本文将详细解读MCP的工作原理、传输机制及其在实际应用中的优势,帮助读者更好地理解这一创新技术如何推动AI从简单的聊天工具迈向真正的智能代理。 梧桐AI MCP基础知识技术原理
AI 最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文 重磅开源!新一代最强小模型SmolLM3横空出世:30亿参数,支持128k长上下文!而且训练、对齐、架构、数据等全链路,Hugging Face这次100%开放——堪称真「Open AI」。 新智元 产品分析技术原理智能体
AI 如果AI的创造力“涌现”是个误会,那AI怎么帮我们创新? 在AI技术飞速发展的当下,我们常常惊叹于其惊人的创造力,但这种创造力的来源究竟是什么?本文从一个全新的视角探讨了AI创造力背后的真相,指出其并非源于“完美”的知识体系,而是源自“不完美”的设计约束。 赛先声 AI应用个人观点技术原理
AI 如何构建高质量AI对话训练数据 在对话类AI产品爆发的当下,如何构建高质量的训练数据,已经成为产品经理、算法工程师乃至标注团队都绕不开的核心问题。本文作者结合一线经验,系统拆解了对话数据构建的关键流程、常见误区与优化策略,是一份兼具技术深度与实操价值的干货指南,值得每一位AI从业者收藏。 养心进行时 AI产品技术原理经验分享
个人随笔 机器人导航算法并不神秘,熊孩子给同学送书的的路上就能参悟 移动机器人导航算法的核心逻辑与我们的日常行为非常相似。从规划路线到动态避障,从定位恢复到任务执行,这些看似复杂的概念其实都蕴含在我们熟悉的场景中。本文将通过一个生动的故事,带你轻松理解机器人导航算法的奥秘,让你发现技术背后的简单与熟悉。 新夸克 个人观点技术原理案例分析
AI 模型微调:从理论到实践的深度解析 在人工智能领域,模型微调已成为提升模型性能、使其适应特定任务的关键技术。本文将全面系统地介绍模型微调的各个方面,帮助读者深入理解这一重要技术。 李雨田讲AI产品 大模型技术原理理论知识
AI,个人随笔 大模型轻量化技术,让AI跑的更快更省 随着大模型参数规模不断膨胀,其高昂的计算资源需求和低效的运行速度成为制约其广泛应用的瓶颈。本文将为您深入剖析大模型轻量化技术,供大家参考。 明思AI AI应用大模型技术原理
AI 构建高准确率RAG系统,从语料质量与拆分策略做起 在企业构建 AI 问答系统和知识增强服务的过程中,RAG(检索增强生成)架构因其高效性和准确性而备受关注。然而,许多团队在实施 RAG 系统时,往往忽视了语料质量和拆分策略的重要性,而这两者正是决定系统能否成功上线的关键因素。本文将深入探讨如何通过高质量的语料库和科学的拆分策略,提升 RAG 系统的准确率和可维护性。 QQQ RAG技术原理经验分享
个人随笔 LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍 最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。 新智元 AI产品大模型技术原理