AI,个人随笔 DeepSeek V4最大的遗憾 DeepSeekV4技术报告缺席的Engram模块引发业界热议。这个由DeepSeek与北大联合开发的记忆优化技术,本可让大模型实现知识直接查询而非重复计算,显著提升效率与性能。尽管未出现在V4中,Engram的理念已在CXL内存池化、视觉移植等方向开花结果,为下一代AI模型埋下伏笔。 量子位 AI应用DeepSeekTransformer
AI,个人随笔 大模型面试/分析必备:从原理到面试题,一篇就够 大模型技术正重塑AI应用生态,但背后的Transformer架构、训练三阶段与RAG/Agent等核心概念仍令非技术从业者困惑。本文系统拆解LLM从预训练到RLHF的对齐逻辑,深入剖析检索增强与智能体两大应用范式,更提供数据构建方法论与高频面试题解析,助你跨越理论与实践的认知鸿沟。 赵小洛 AI AgentLLMRAG
AI 拆解DeepMind重磅论文:我们训练的AI为何只是在表演意识? ChatGPT引发的AI意识争论终于迎来科学解答。谷歌DeepMind最新论文从底层架构出发,通过Transformer运行逻辑分析与实验验证,彻底拆解了大模型的"意识伪装"——那些看似共情的对话只是统计学重构,而非真正的理解与思考。文章深度解读了AI无法跨越的三条意识红线,并呼吁行业回归工具本质:我们制造的是一面反射人类智慧的镜子,而非拥有灵魂的生命。 冒泡泡 AI意识ChatGPTDeepmind
AI Transformer:让AI学会”一目十行”的神秘架构 你知道吗? 2017年,Google发了一篇论文,名字叫《Attention is All You Need》。这篇论文的八位作者,后来走出了六家AI公司——OpenAI、Character AI、Cohere……整个大模... AI星球 AI架构Attention机制BERT
个人随笔 深度拆解:别再迷信麦克风“偷听”了,那是对现代推荐算法的误解 为什么刚聊完冲锋衣,手机App就精准推送?真相远比"语音偷听"更可怕!本文从产品经理视角,深度拆解推荐系统背后的Transformer架构、端侧算力与跨端数据联盟如何构建精密预测模型,揭示那些让你细思极恐的"影子画像"和"行为熵"埋点逻辑。当算法能捕捉你的每毫秒犹豫时,我们是否正在交出灵魂的托管权? lris碎碎念 Transformer产品伦理推荐系统
AI,个人随笔 从“撞大运”到“控概率”:Transformer 告诉我的 AI 协作真相 很多 AI 产品经理都经历过这样的阶段:沉迷于搜集各种“Prompt 秘籍”,却在模型偶尔的“人工智障”面前束手无策。当我摸索着了解 Transformer 黑盒后才发现:如果不理解概率,我们对 AI 的掌控终究只是幻觉。 van ner AI应用Transformer个人观点
AI 为什么 AI 无所不能,却连洗车该开车还是走路都搞不懂? 大语言模型时而如神明般无所不能,时而像呆萌的'大聪明'犯下低级错误。本文深度解析LLM底层Transformer架构的三大核心环节,揭秘AI为何不会数数、为何在简单问题上翻车,以及如何通过理解Tokenization机制和注意力原理,真正掌握驯服AI的'黑盒密码'。 瓜瓜的产品局 AI产品LLMPrompt Engineering
AI,个人随笔 ChatGPT背后那个”幽灵”,到底是什么 Transformer 架构的诞生彻底改写了 AI 领域的游戏规则。从 ChatGPT 到 Sora,从 AlphaFold 到 ViT,看似毫不相关的技术突破背后都藏着相同的 DNA。本文将带你穿越 RNN 与 CNN 的旧世界,揭示注意力机制如何突破长程建模的困境,并探索这种『关系处理机器』是如何从语言领域溢出,重塑我们对世界的认知方式。 酸奶AIGC AI技术AlphaFoldChatGPT
AI,个人随笔 砍掉75%的Token,性能几乎不变——视觉AI的_断舍离_哲学 多模态AI处理图像和视频时为何总是卡顿?V²Drop技术突破揭示了一个关键真相:视觉Token的爆炸式增长是根本瓶颈。这项来自中国顶尖实验室的创新方案,能在砍掉75%冗余Token的同时保持97%性能,彻底解决了与FlashAttention的兼容难题,为工业质检、自动驾驶等实时场景带来革命性提速。 鱼尾落晴朝 AI加速CVPRToken压缩
AI,个人随笔 AI进化史——长出”眼睛、记忆、想象力和大脑”的四大超能力 AI的进化绝非一蹴而就,它经历了四次革命性的底层技术突破,如同获得了四个关键"器官"。从CNN赋予视觉能力,到RNN/LSTM建立记忆系统,再到GAN与Diffusion点燃生成能力,最后Transformer以注意力机制构建超级大脑——每次突破都重塑了信息处理的基本方式。本文将深度拆解这四次技术革命的底层逻辑,揭示AI如何从"分不清猫狗"到"能与你聊哲学"的进化之路。 苏苏的AI笔记 AI进化CNNGAN
AI 超越万亿参数:揭秘决定大模型成败的“隐形之手”—— 关键超参数详解 参数规模的光环下,超参数才是大语言模型的真正灵魂。本文将深度解析学习率调度、批量大小、模型架构等关键超参数如何如同精密食谱般影响模型表现,揭示从70B到万亿参数竞赛背后那些不为人知的“炼丹”艺术与技术权衡。 卡萨丁AI AI技术LLMTransformer
AI 3万字解读:多模态AI(Multimodal AI)起源、演进与思考研究报告 多模态AI的发展历程是一部从单一感知到全面认知的技术史诗。从AlexNet在2012年引爆深度学习革命,到GPT-4o实现原生多模态理解,再到世界模型对AGI的终极探索,每一次技术跃迁都在重新定义人机交互的边界。本文将深度解析CNN、GAN、ViT、Diffusion等关键技术的演进脉络,揭示多模态AI如何逐步突破感知局限,走向对世界的理解与建模。 卡萨丁AI AI发展史CNNTransformer