第17页 | 大模型 | 人人都是产品经理

AI,个人随笔

AI大模型风向突变：从技术预热到商业爆发，京东、小米等 B 端案例揭秘价值密码！

AI 大模型正从技术预热转向商业爆发，推理成本下降推动多模态应用，政策与备案加速行业规范化。京东、小米等企业的 B 端实践，正揭开大模型在商业场景中创造价值的密码。

产品参赵

AI应用 b端产品大模型

AI,个人随笔

从零学习大模型（4）——Transformer 的 “内部齿轮”：FFN、残差连接与归一化如何让 AI 更聪明？

本文将从功能原理、技术细节到实际作用，系统解析这些 “幕后模块”：为什么 FFN 能让注意力的输出更 “有用”？残差连接如何让模型 “越 deep 越聪明”？归一化又为何能让训练 “稳如泰山”？

红岸小兵

Transformer 基础知识大模型

AI,个人随笔

从零学习大模型（3）——注意力机制：从 Self-Attention 到 KVCache，AI 如何学会 “聚焦”？

从 Transformer 的 Self-Attention 到 GPT 的 KVCache，注意力机制的每一次优化都推动着 AI 能力的跃升。本文将从基础原理出发，解析 Self-Attention、Cross-Attention 的核心逻辑，以及 MHA、GQA 等优化策略如何让 AI 在效率与性能间找到平衡。

红岸小兵

AI产品基础知识大模型

AI

大模型时代的AI Infra内容浅析与趋势思考

从算力到框架，从数据到分布式系统，大模型时代下的AI基础设施（Infra）已经不只是“托底”，而是决定产品性能、演化速度与落地深度的关键变量。本文将抽丝剥茧，拆解AI Infra的关键组件及发展趋势，看清支撑智能浪潮的底层力量。

明思AI

AI Infra 大模型行业观察

AI,个人随笔

从零学习大模型（2）——从文字到数字：Tokenizer 与 Embedding 如何让 AI 读懂人类语言

从 ChatGPT 到文心一言，大模型已成产品革新的关键。但要真正理解它们的能力，产品经理必须掌握底层的语言处理机制。这篇文章将拆解 Tokenizer 与 Embedding 的核心逻辑，用产品视角解析 AI 如何“读懂”语言。

红岸小兵

基础知识大模型技术原理

AI,个人随笔

从零学习大模型（1）——Transformer架构：原理、演进与AI领域的颠覆性影响

在深度学习的发展历程中，2017 年谷歌团队发表的《Attention Is All You Need》论文具有里程碑意义 —— 该论文提出的 Transformer 架构，彻底改变了自然语言处理（NLP）乃至人工智能领域的技术路径。与传统循环神经网络（RNN）、卷积神经网络（CNN）不同，Transformer 以 “注意力机制” 为核心，实现了并行化计算与长序列依赖建模的双重突破，成为当前所有大型语言模型（如 GPT、BERT）的基础架构。本文将从技术原理、架构设计、演进历程及应用价值四个维度，系统解析这一革命性模型。

红岸小兵

Transformer 基础知识大模型

AI,个人随笔

【本地化部署】Dify大语言模型(LLM) 应用开发平台【小白教程】

不想连云端也依赖？这份教程手把手带你把 Dify LLM 应用平台部署到本地，从环境配置到启动调试全流程复刻，助你在数据私有性、系统自控性上实现真正“自己掌握主动权”的开发体验。

董方旭

LLM 大模型操作指南

AI

多模态都是假的：最强模型数不清手指、认不出雷碧

把六指图喂进“最强”多模态模型，它依然坚称只有五根手指；让它认“雷碧”，也会被文字带偏。作者用一连串实测拆穿幻象：模型并非“看见”，只是高维概率复读机。数据偏差、任务粒度、长尾缺失才是幻觉根源。认清边界，才能补数据、改架构，把 AI 真正用在刀刃上。

叶小钗

产品评估多模态大模型

AI

大模型评估：指标和方法【上】（二）

大模型的发展愈发迅猛，评估却常常落后一步。本文围绕多维评估指标与方法论展开，深入剖析模型性能到底该如何被“看见”。延续上篇思路，本篇将从实战出发，为你补齐模型评估的“底层逻辑”。

猫猫观察员的AI思考

大模型经验分享评估体系

AI

为什么你的AI助手总是搞错事？Context Engineering了解一下

问个问题，AI回得牛头不对马嘴？别急着吐槽它“太蠢”，可能是它根本没听懂你是谁、想干啥。本文用浅显易懂的方式，带你认识一个冷门却超关键的概念——Context Engineering，也许是AI真的“读懂你”的那把钥匙。

梧桐AI

Context Engineering 大模型技术原理

AI

大模型评估：初学者入门（一）

大模型的风口已至，但评估却始终是一道“看不清又绕不过”的门槛。本篇文章将从基础概念出发，手把手引导初学者理解大模型评估的核心逻辑与方法体系，厘清技术指标背后的实际含义，为后续深入探索打下坚实的认知地基。

猫猫观察员的AI思考

AI产品 LLM 基础知识

大模型竞赛转向：决胜关键为何是“后训练”？

当前，通用模型在产业落地中面临知识断层、难以对齐用户隐性偏好等难题，而后训练正是解决这些 “最后一公里” 问题的核心。业界已探索出 SFT+RL、纯 RL 等训练范式，MoE 模型、FP8 精度等技术也成为后训练的重要选择。本文解析后训练的关键价值、产业痛点及顶级玩家的实践路径，探讨其如何成为大模型价值释放的决胜场，以及云平台在其中的支撑作用。

甲子光年

后训练大模型技术原理