"大语言模型"相关的文章
AI,个人随笔
Token到底应该翻译成什么?

Token到底应该翻译成什么?

Token正在成为AI世界的硬通货,但你真的懂它吗?从ChatGPT的对话消耗到API计价单位,这个看似简单的概念实则是模型理解世界的原子单位。本文深度解析Token为何既非字也非词,揭示其作为算力经济学核心指标的底层逻辑,并预判音译「托肯」可能成为下一代技术语言的关键词。
AI,个人随笔
影响大模型输出的手段-prompt篇

影响大模型输出的手段-prompt篇

大语言模型的表现并非随机,而是被Prompt(提示词)、参数和模型本身三大维度决定。本文作为系列首篇,将揭秘如何通过精准的Prompt,将AI从随机聊天对象变成可控生产力工具。从破除AI迷信到五大核心技巧,包括明确边界、专家角色、上下文信息、Few-Shot提示和输出格式,带你彻底告别AI的盲盒式体验。
产品运营
AI产品实操复盘:如何从0到1设计一款高价值沉睡用户智能召回系统?

AI产品实操复盘:如何从0到1设计一款高价值沉睡用户智能召回系统?

在AI时代,私域运营正在经历一场革命性的变革。传统的标签化用户召回策略不仅效率低下,更可能引发用户反感、造成宝贵线索的流失。本文通过一款面向中小商家的智能召回应用案例,深度拆解如何利用大语言模型重构私域运营的底层逻辑——从动态意图识别到精准触达时机判断,打造真正懂用户需求的「数字大脑」。
AI
从Transformer到MoE:大模型架构的范式转移

从Transformer到MoE:大模型架构的范式转移

大语言模型领域正经历一场静默却深刻的架构革命。从Transformer到MoE再到Mamba,这场由成本与效率驱动的变革正在重塑AI行业的底层逻辑。本文将带你穿越2017-2025年的关键技术节点,解密MoE如何实现参数规模与计算成本的解耦,剖析Mamba挑战注意力霸权的可能性,并深度解析Qwen3等前沿开源模型的混合架构设计。
AI,个人随笔
十分钟读懂RAG

十分钟读懂RAG

大语言模型虽强,却面临幻觉、知识截止和上下文限制三大痛点。RAG技术应运而生,让AI能够'带书考试',通过分片、索引、召回和生成四步精准解决问题。本文将深入解析RAG的工作原理、应用场景与局限,助你掌握这套AI工程体系的核心逻辑。