第24页 | 技术原理 | 人人都是产品经理

AI,个人随笔

深度解析： AI 幻觉的形成和应对路径

从技术原理到实际使用，大模型的“幻觉”问题始终绕不开：它不仅影响输出准确性，更关系到业务决策与风险控制。本文将深入剖析AI幻觉的形成原因，探讨应对路径与工程优化思路，并从使用者视角出发，提出如何“和幻觉共处”的实践建议。

张艾拉

AI应用个人观点技术原理

AI,个人随笔

从零学习大模型（12）——混合专家模型（MoE）：让大模型 “分工协作” 的高效架构

本期我们从零起步，拆解 MoE 的核心理念与架构优势，透视背后的“专家调度”机制，探索如何通过“分工协作”赋予大模型更灵活的表现力与算力效率。

金融产品小兵

大模型技术原理混合专家模型

AI,个人随笔

从零学习大模型（11）——模型压缩与量化：让大模型 “轻装上阵” 的核心技术

大模型“烧钱”又“吃资源”？压缩与量化技术才是让它轻装上阵的关键一招。本文手把手拆解核心原理与常见手法，帮你厘清技术演进脉络，打好基础理解一切模型优化策略的关键一步。

金融产品小兵

大模型技术原理系列文章

AI,个人随笔

从零学习大模型（10）——从 SFT 到 RLHF：大模型如何学会 “符合人类期待”？

监督微调（SFT）让大模型能 “听懂指令”，但要让模型 “说的话符合人类偏好”—— 比如回答更礼貌、推理更严谨、拒绝有害请求，还需要人类反馈强化学习（RLHF）。这种从 “能做” 到 “做好” 的跨越，正是对齐技术（Aligning）的核心目标。RLHF 并非简单的 “二次训练”，而是通过人类反馈构建 “奖励信号”，让模型在试错中学会贴近人类价值观。

金融产品小兵

大模型技术原理用户激励

AI,个人随笔

从零学习大模型（9）——大模型监督微调进阶：从数据工程到推理强化的微调全流程

从数据工程到强化推理，监督微调的每一环节都决定着大模型的实际表现。本篇将系统梳理大模型微调的全流程，不仅是一次知识的深度补完，更是助力技术团队构建高质量微调体系的实战指南。

金融产品小兵

大模型微调技术原理

AI,个人随笔

从零学习大模型（8）——预训练：大模型的 “知识积累期”—— 从任务设计到数据工程

预训练（Pre-training）是大模型构建通用能力的核心环节。就像人类通过大量阅读积累知识，大模型通过在海量数据上的自监督学习，捕捉语言规律、语义关联和世界常识，为后续 “专项技能学习”（微调）奠定基础。这个过程的质量直接决定模型的上限 —— 数据的广度、任务的设计、筛选的精度，共同塑造了模型的语言理解、逻辑推理和生成能力。

金融产品小兵

大模型技术原理预训练

产品设计

一文搞懂Session处理：原理、实践与常见问题剖析

Session 很常见，但你真的知道它是怎么运作的吗？本文从零拆解 Session 的原理、使用方法以及常见坑点，用最清晰的方式帮你在产品体验优化、用户登录设计等场景中少踩雷、快上手。

十三豆

Session机制常见问题技术原理

AI,个人随笔

从零学习大模型（7）——解码策略：大模型如何 “选词说话”？从基础方法到投机解码

本文将系统解析解码策略的核心逻辑：基础解码方法如何工作？top-k、top-p 等参数如何调控生成效果？投机解码为何能让大模型推理速度翻倍？

金融产品小兵

大模型技术原理解码策略

AI,个人随笔

AI产品经理技术：Wan2.2开源！最大亮点并非画质，扩散MoE亮点揭秘

Wan2.2的重点绝非画质的提升？这篇文章将从MoE专家模型架构的诞生，发展，以及Wan2.2的MoE的不同点。让各位产品经理们对未来AI模型发展的思路和脉络有更深入的认识。

产品经理小易

AI产品经理大模型技术原理

AI,个人随笔

从零学习大模型（6）——Transformer 结构家族：从 Encoder 到 Decoder，大模型为何偏爱 “单边设计”？

Transformer 架构的伟大之处，不仅在于提出了注意力机制，更在于提供了一套 “模块化” 的设计框架 —— 通过组合编码器（Encoder）和解码器（Decoder），可以衍生出多种结构变体。从 BERT 的 “纯编码器” 到 GPT 的 “纯解码器”，从 T5 的 “编码器 - 解码器” 到 LLaMA 的 “前缀解码器”，不同结构的选择直接决定了模型的核心能力。

金融产品小兵

基础知识大模型技术原理

AI,个人随笔