AI AI大模型是怎么从一个“小白”到学会人类语言的 大模型从一个“小白”变成一个掌握人类语言的过程称之为“预训练(Pretrain)”,本文尝试用尽量“大白话”的方式描述大模型是如何“预训练”的。 跳跳堂 AI应用大模型技术原理
AI,个人随笔 阿里Qwen3发布:性能超R1、o1,成本仅R1的1/4,融合思考与非思考模式 阿里通义千问团队推出的Qwen3系列开源大模型,以其卓越的性能和成本效益,为人工智能领域树立了新的标杆。Qwen3不仅在多个基准测试中展现出与DeepSeek-R1、o1等模型相媲美的能力,而且通过融合思考与非思考模式,显著提升了模型的灵活性和性价比。 知危 Qwen产品分析技术原理
AI 主流 AI 生成 3D 技术流派辨析:Text-to-3D, Image-to-3D 与 NeRF 应用概览 (AI+3D 产品经理笔记 S2E02) AI生成3D技术正在迅速改变我们创造和体验三维内容的方式。从文本到图像,再到复杂的三维模型,AI技术的多样性为产品设计、游戏开发、虚拟现实等多个领域带来了前所未有的机遇。 Mu先生Ai世界 3D技术AI产品经理AI生成
AI 从0构建大模型知识体系(4):大模型的爸爸Transformer 在人工智能领域,尤其是自然语言处理(NLP)的浪潮中,Transformer架构无疑是近年来最重要的突破之一。它不仅彻底解决了传统循环神经网络(RNN)的健忘和训练速度慢的问题,还开启了大语言模型的新纪元。本文将从机器翻译这一经典任务出发,深入剖析Transformer架构的核心原理,包括编码器-解码器架构、注意力机制的奥秘,以及它如何通过纯注意力机制实现高效的序列处理。 夜雨思晗 Transformer大模型技术原理
AI,个人随笔 到底有多重要?shapley value来解释解释 无论是全局特征重要性分析,还是单个样本的特征贡献解释,SHAP都能提供清晰的视角。本文将通过实际案例,展示如何利用SHAP来分析数据,优化决策,并提供相关代码资源供读者参考。 小王子和小企鹅 shap value技术原理数据分析
AI,个人随笔 浅显理解LLM底层技术 大语言模型(LLM)作为人工智能领域的重要分支,近年来在自然语言处理(NLP)方面取得了显著进展。然而,对于非技术出身的人来说,理解LLM的底层技术往往显得晦涩难懂。本文作者通过类比和通俗易懂的方式,深入浅出地介绍了LLM的底层技术原理,包括词元(token)的概念、有监督学习与无监督学习的区别,以及语言生成技术如GPT和BERT的工作机制。 打打泥 LLM大模型技术原理
AI 解码 AI Agent 的底层逻辑与进化之路 AI Agent作为人工智能领域的重要概念,近年来随着技术的飞速发展而备受关注。从Alpha Go到ChatGPT,AI Agent的底层逻辑和进化路径逐渐清晰。本文将深入探讨AI Agent的定义、从“指令执行者”到“目标追求者”的核心蜕变,以及其在不同应用场景中的表现和面临的挑战。 Easton费曼说 AgentAI产品底层逻辑
AI 5000字深度长文:详解科技圈爆火的MCP 在人工智能领域,大模型的交互和应用一直是技术发展的关键。近期,MCP(Model Calling Protocol)作为一种新兴的标准化交互协议,迅速吸引了全球技术圈的关注。从OpenAI到谷歌,各大AI巨头纷纷投入MCP的怀抱,试图通过这一协议实现大模型间的无缝交互。本文将深入剖析MCP的起源、核心价值、与现有技术的对比,以及它对未来技术生态的潜在影响,探讨MCP是否真的有可能成为“AI界的HTTP”。 鹅厂技术派 AI应用MCP技术原理
产品运营 重新理解抖音算法 在信息爆炸的时代,推荐算法已成为各大平台的核心竞争力之一。抖音作为全球领先的短视频平台,其算法的运作机制和优化策略备受关注。本文将深入剖析抖音算法的逻辑与原理,探讨其如何通过协同过滤、Wide&Deep模型等技术手段实现千人千面的内容推送。 海克财经 个人观点技术原理抖音
AI,个人随笔 从0构建大模型知识体系(3):大模型的祖宗RNN 从自然语言的数字化过程,到RNN的数学原理、训练方法和文本生成机制,再到其在现代大模型中的地位和影响,本文将为你揭开RNN的神秘面纱,带你深入理解大语言模型的核心技术基础。 夜雨思晗 RNN大模型技术原理
AI 与AI合作必备:产品经理的模型原理与应用指南 随着AI技术的飞速发展,大模型如ChatGPT、Stable Diffusion等已广泛应用于产品开发中。然而,许多产品经理对AI模型的原理和应用仍缺乏深入了解。本文将从产品视角出发,深入剖析AI模型的底层原理、训练流程、评估方法以及典型应用场景,为产品经理提供一份清晰、实用的AI产品实战指南。 Jessie AI应用基础知识大模型
AI LLM「想太多」有救了!高效推理让大模型思考过程更精简 大模型虽然推理能力增强,却常常「想太多」,回答简单问题也冗长复杂。Rice大学的华人研究者提出高效推理概念,探究了如何帮助LLM告别「过度思考」,提升推理效率。 新智元 LLM技术原理推理大模型