技术原理 | 人人都是产品经理

AI人工智能

从“对话记忆”到智能交互：AI多轮对话的技术探索

从“对话记忆”到智能交互，AI 多轮对话技术正不断演进，推动人机交互迈向更自然、更智能的阶段。本篇文章将深入探讨 AI 在多轮对话中的技术突破，分析关键算法、应用场景及未来发展趋势，帮助你理解 AI 交互的最新前沿。

阿司匹汪

AI产品技术原理案例分析

AI人工智能,个人随笔

大模型如何 “听懂” 人类提问？一文揭秘核心训练链路

在当今数字化时代，大语言模型如ChatGPT、豆包、DeepSeek等以其强大的语言理解和生成能力，深刻改变了我们的生活与工作方式。它们仿佛拥有了“数字大脑”，能够快速精准地回答各种问题，从学术理论到生活琐事，无一不能应对自如。然而，你是否好奇过，这些大模型究竟是如何“听懂”人类语言的？它们背后的训练机制又隐藏着怎样的奥秘？

王小佳

基础知识大模型技术原理

AI人工智能

AI大模型是怎么从一个“小白”到学会人类语言的

大模型从一个“小白”变成一个掌握人类语言的过程称之为“预训练（Pretrain）”，本文尝试用尽量“大白话”的方式描述大模型是如何“预训练”的。

弋十三

AI应用大模型技术原理

AI人工智能,个人随笔

阿里Qwen3发布：性能超R1、o1，成本仅R1的1/4，融合思考与非思考模式

阿里通义千问团队推出的Qwen3系列开源大模型，以其卓越的性能和成本效益，为人工智能领域树立了新的标杆。Qwen3不仅在多个基准测试中展现出与DeepSeek-R1、o1等模型相媲美的能力，而且通过融合思考与非思考模式，显著提升了模型的灵活性和性价比。

知危

Qwen 产品分析技术原理

AI人工智能

主流 AI 生成 3D 技术流派辨析：Text-to-3D, Image-to-3D 与 NeRF 应用概览 (AI+3D 产品经理笔记 S2E02)

AI生成3D技术正在迅速改变我们创造和体验三维内容的方式。从文本到图像，再到复杂的三维模型，AI技术的多样性为产品设计、游戏开发、虚拟现实等多个领域带来了前所未有的机遇。

Mu先生Ai世界

3D技术 AI产品经理 AI生成

AI人工智能

从0构建大模型知识体系（4）：大模型的爸爸Transformer

在人工智能领域，尤其是自然语言处理（NLP）的浪潮中，Transformer架构无疑是近年来最重要的突破之一。它不仅彻底解决了传统循环神经网络（RNN）的健忘和训练速度慢的问题，还开启了大语言模型的新纪元。本文将从机器翻译这一经典任务出发，深入剖析Transformer架构的核心原理，包括编码器-解码器架构、注意力机制的奥秘，以及它如何通过纯注意力机制实现高效的序列处理。

夜雨思晗

Transformer 大模型技术原理

AI人工智能,个人随笔

到底有多重要？shapley value来解释解释

无论是全局特征重要性分析，还是单个样本的特征贡献解释，SHAP都能提供清晰的视角。本文将通过实际案例，展示如何利用SHAP来分析数据，优化决策，并提供相关代码资源供读者参考。

小王子和小企鹅

shap value 技术原理数据分析

AI人工智能,个人随笔

浅显理解LLM底层技术

大语言模型（LLM）作为人工智能领域的重要分支，近年来在自然语言处理（NLP）方面取得了显著进展。然而，对于非技术出身的人来说，理解LLM的底层技术往往显得晦涩难懂。本文作者通过类比和通俗易懂的方式，深入浅出地介绍了LLM的底层技术原理，包括词元（token）的概念、有监督学习与无监督学习的区别，以及语言生成技术如GPT和BERT的工作机制。

打打泥

LLM 大模型技术原理

AI人工智能

解码 AI Agent 的底层逻辑与进化之路

AI Agent作为人工智能领域的重要概念，近年来随着技术的飞速发展而备受关注。从Alpha Go到ChatGPT，AI Agent的底层逻辑和进化路径逐渐清晰。本文将深入探讨AI Agent的定义、从“指令执行者”到“目标追求者”的核心蜕变，以及其在不同应用场景中的表现和面临的挑战。

Easton费曼说

Agent AI产品底层逻辑

AI人工智能

在人工智能领域，大模型的交互和应用一直是技术发展的关键。近期，MCP（Model Calling Protocol）作为一种新兴的标准化交互协议，迅速吸引了全球技术圈的关注。从OpenAI到谷歌，各大AI巨头纷纷投入MCP的怀抱，试图通过这一协议实现大模型间的无缝交互。本文将深入剖析MCP的起源、核心价值、与现有技术的对比，以及它对未来技术生态的潜在影响，探讨MCP是否真的有可能成为“AI界的HTTP”。