个人随笔 大模型竞赛转向:决胜关键为何是“后训练”? 当前,通用模型在产业落地中面临知识断层、难以对齐用户隐性偏好等难题,而后训练正是解决这些 “最后一公里” 问题的核心。业界已探索出 SFT+RL、纯 RL 等训练范式,MoE 模型、FP8 精度等技术也成为后训练的重要选择。本文解析后训练的关键价值、产业痛点及顶级玩家的实践路径,探讨其如何成为大模型价值释放的决胜场,以及云平台在其中的支撑作用。 甲子光年 后训练大模型技术原理
AI,个人随笔 AI大模型+资讯,资讯阅读的第三次革命 当信息爆炸让人喘不过气,AI大模型正把“读新闻”变成“用新闻”。从秒懂专业名词的划词解读,到一键生成个人日报的AI早报,今日头条、腾讯新闻、新浪新闻集体上演“资讯App智能化军备赛”。本文深度横评三家大厂的AI功能:谁能真正把浩瀚资讯化繁为简,谁又只是在炫技?答案关乎每个想在信息洪流里高效获取价值的你。 光锥智能 AI应用产品分析大模型
个人随笔 从数据洞察到决策革命:大模型重构企业数字化运营新范式 在数字经济高速发展的今天,企业数字化转型已从技术工具的应用演变为核心竞争力的重构。基于大模型技术的深度赋能,我们通过构建智能化分析体系,实现了从数据洞察到决策执行的闭环升级,推动企业运营效率、决策精度和业务创新能力的全面提升。下面将结合具体实践,系统阐述大模型技术对企业数字化业务的重构路径与价值创造机制。 董方旭 个人观点大模型数字化运营
AI,个人随笔 Scale AI:AI 产业链的“隐形军火商” 在AI大模型的聚光灯之外,有一家公司低调却关键地撑起了整个产业链的“地基”——它就是 Scale AI。从数据标注到模型评估,从政府合同到硅谷独角兽,这家“隐形军火商”如何在AI竞赛中扮演幕后操盘手? 张艾拉 AI应用产品分析大模型
AI,个人随笔 大模型微调后,可上线的标准是什么? 随着大模型微调技术(尤其是LoRA轻量参数微调)的广泛应用,如何判断一个微调后的模型是否可以进入上线测试阶段,成为了一个亟待解决的问题。本文结合心理场景项目中的实践经验,详细探讨了大模型微调后上线前的评估标准。 养心进行时 个人观点大模型经验分享
AI 模型微调:从理论到实践的深度解析 在人工智能领域,模型微调已成为提升模型性能、使其适应特定任务的关键技术。本文将全面系统地介绍模型微调的各个方面,帮助读者深入理解这一重要技术。 李雨田讲AI产品 大模型技术原理理论知识
AI,个人随笔 大模型轻量化技术,让AI跑的更快更省 随着大模型参数规模不断膨胀,其高昂的计算资源需求和低效的运行速度成为制约其广泛应用的瓶颈。本文将为您深入剖析大模型轻量化技术,供大家参考。 明思AI AI应用大模型技术原理
AI 大模型竞争:落后生的两条追赶路线 在大模型竞赛中落后的厂商采取两种追赶路线:苹果、Meta 等大厂通过重金挖人等手段补强短板;国内 AI 六小龙因融资环境恶化,选择裁员收紧资源,集中力量在模型迭代上。 字母榜 个人观点大模型行业观察
AI 企业大模型落地的现实解法:为什么RAG是绕不开的技术路径? 在实际落地过程中,通用大模型在企业场景中面临诸多挑战,如数据安全、生成幻觉、缺乏业务语境等问题,导致其难以直接应用于业务。本文将深入探讨 RAG(检索增强生成)架构如何成为企业大模型落地的现实解法。 QQQ RAG个人观点大模型
产品设计 大模型技术如何重构智能客服对话体验 随着人工智能技术的飞速发展,尤其是大语言模型(LLM)的出现,智能客服领域正经历一场深刻的变革。从最初的规则引擎到如今的深度学习和大模型技术,智能客服的对话体验已经发生了翻天覆地的变化。本文将深入探讨大模型技术如何从底层逻辑到用户体验,全方位重塑智能客服的对话体验。 阿堂 大模型智能客服经验分享
个人随笔 LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍 最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。 新智元 AI产品大模型技术原理
AI 让审批快起来!DeepSeek大模型赋能政务申办受理平台的实践路径 在数字化转型的浪潮中,政务服务的审批效率成为提升民众满意度和政府效能的关键。本文将深入探讨DeepSeek大模型如何赋能政务申办受理平台,通过智能化手段解决审批流程中的痛点,提升审批速度和质量。 柳星聊产品 AI应用DeepSeekG端产品