第21页 | 技术原理 | 人人都是产品经理

AI,个人随笔

从零学习大模型（6）——Transformer 结构家族：从 Encoder 到 Decoder，大模型为何偏爱 “单边设计”？

Transformer 架构的伟大之处，不仅在于提出了注意力机制，更在于提供了一套 “模块化” 的设计框架 —— 通过组合编码器（Encoder）和解码器（Decoder），可以衍生出多种结构变体。从 BERT 的 “纯编码器” 到 GPT 的 “纯解码器”，从 T5 的 “编码器 - 解码器” 到 LLaMA 的 “前缀解码器”，不同结构的选择直接决定了模型的核心能力。

红岸小兵

基础知识大模型技术原理

AI,个人随笔

从零学习大模型（5）——位置编码：让 AI 读懂 “语序” 的关键技术

在 Transformer 架构中，有一个容易被忽略却至关重要的模块 —— 位置编码（Positional Encoding，PE）。如果说注意力机制让模型能 “理解关联”，前馈神经网络让模型能 “提纯特征”，那么位置编码的作用就是让模型能 “感知顺序”。

红岸小兵

位置编码基础知识技术原理

AI,个人随笔

从零学习大模型（4）——Transformer 的 “内部齿轮”：FFN、残差连接与归一化如何让 AI 更聪明？

本文将从功能原理、技术细节到实际作用，系统解析这些 “幕后模块”：为什么 FFN 能让注意力的输出更 “有用”？残差连接如何让模型 “越 deep 越聪明”？归一化又为何能让训练 “稳如泰山”？

红岸小兵

Transformer 基础知识大模型

AI,个人随笔

从零学习大模型（3）——注意力机制：从 Self-Attention 到 KVCache，AI 如何学会 “聚焦”？

从 Transformer 的 Self-Attention 到 GPT 的 KVCache，注意力机制的每一次优化都推动着 AI 能力的跃升。本文将从基础原理出发，解析 Self-Attention、Cross-Attention 的核心逻辑，以及 MHA、GQA 等优化策略如何让 AI 在效率与性能间找到平衡。

红岸小兵

AI产品基础知识大模型

AI,个人随笔

从零学习大模型（2）——从文字到数字：Tokenizer 与 Embedding 如何让 AI 读懂人类语言

从 ChatGPT 到文心一言，大模型已成产品革新的关键。但要真正理解它们的能力，产品经理必须掌握底层的语言处理机制。这篇文章将拆解 Tokenizer 与 Embedding 的核心逻辑，用产品视角解析 AI 如何“读懂”语言。

红岸小兵

基础知识大模型技术原理

AI

上下文工程：大语言模型的新范式

大语言模型不止靠参数“大”，更靠“上下文”聪明。本文系统性拆解上下文工程的设计逻辑与调用策略，从提示构造、状态保持到信息注入，揭示当下LLM开发正从模型调参，走向“上下文编排”的工程新范式。

猫猫观察员的AI思考

大语言模型技术原理经验分享

AI

为什么你的AI助手总是搞错事？Context Engineering了解一下

问个问题，AI回得牛头不对马嘴？别急着吐槽它“太蠢”，可能是它根本没听懂你是谁、想干啥。本文用浅显易懂的方式，带你认识一个冷门却超关键的概念——Context Engineering，也许是AI真的“读懂你”的那把钥匙。

梧桐AI

Context Engineering 大模型技术原理

AI,个人随笔

Manus 内部的 Context 工程经验（精校、高亮要点）

构建AI智能体时，上下文工程是塑造其行为的核心。如何通过优化KV缓存、动态管理工具、利用文件系统拓展记忆等策略，让智能体更高效、稳定地运转？这些来自实践的经验，或许能为智能体开发提供关键指引。

一泽Eze

Manus 技术原理经验分享

大模型竞赛转向：决胜关键为何是“后训练”？

当前，通用模型在产业落地中面临知识断层、难以对齐用户隐性偏好等难题，而后训练正是解决这些 “最后一公里” 问题的核心。业界已探索出 SFT+RL、纯 RL 等训练范式，MoE 模型、FP8 精度等技术也成为后训练的重要选择。本文解析后训练的关键价值、产业痛点及顶级玩家的实践路径，探讨其如何成为大模型价值释放的决胜场，以及云平台在其中的支撑作用。

甲子光年

后训练大模型技术原理

AI

Transformer终结者！谷歌DeepMind全新MoR架构问世，新一代魔王来了

Transformer杀手来了？KAIST、谷歌DeepMind等机构刚刚发布的MoR架构，推理速度翻倍、内存减半，直接重塑了LLM的性能边界，全面碾压了传统的Transformer。网友们直呼炸裂：又一个改变游戏规则的炸弹来了。

新智元

AI产品 LLM 技术原理

AI,个人随笔

为什么 RAG 能让 AI 更 “聪明”？工作原理深度拆解

在人工智能领域，大语言模型（LLM）的快速发展为自然语言处理带来了革命性的突破。然而，这些模型在处理实时信息、专业领域知识以及确保回答准确性和可靠性方面仍面临挑战。本文将深入探讨一种名为RAG（Retrieval-Augmented Generation，检索增强生成）的技术框架，它通过结合信息检索与大语言模型的生成能力，为AI模型提供了强大的外挂支持。

梧桐AI

RAG 基础知识技术原理

AI,个人随笔

一文读懂MCP及三大传输协议

通过MCP，AI模型能够以统一的方式访问资源和工具，从而实现更高效、更智能的交互体验。本文将详细解读MCP的工作原理、传输机制及其在实际应用中的优势，帮助读者更好地理解这一创新技术如何推动AI从简单的聊天工具迈向真正的智能代理。

梧桐AI

MCP 基础知识技术原理