"技术原理"相关的文章
AI,个人随笔
如何通俗地理解 RAG?

如何通俗地理解 RAG?

RAG(检索增强生成)是大模型解决‘知识滞后’与‘私有数据缺失’两大痛点的关键外挂。其核心逻辑是将企业私有文档‘切片’并转化为‘向量’存储于外部知识库;当用户提问时,系统先通过向量相似度检索出最相关的知识片段,再将其作为上下文‘喂’给大模型。
AI,个人随笔
Agent的“记忆”到底怎么来?

Agent的“记忆”到底怎么来?

目前AI模型的智能发展到现在,Agent已成为最热门的产品形态。在Agent类产品的实现过程中,有两个关键要素:一是允许模型调用各类工具,二是赋予模型"记忆"能力以支持复杂任务的规划和长期操作。那么,Agent的记忆到底是什么?很多人说自己"训练"了一个Agent,实际上发生了什么?本文尝试解读Agent实现中主要的记忆来源和处理方式。
实测分享:ArkUI-X 6.0.2 Release 版本体验,这些更新还可以!

实测分享:ArkUI-X 6.0.2 Release 版本体验,这些更新还可以!

ArkUI-X 6.0.2 Release版本发布,虽无颠覆性功能,却以‘精准补漏’直击开发者痛点。核心亮点包括:平台桥接实现Ability与Bridge解耦,支持全局调用、子线程运行及同步接口,彻底解决调用繁琐与UI卡顿难题;新增无障碍、振动器、地理位置管理3个核心API的跨平台适配,大幅降低多端代码冗余。实测显示,该版本在保持低适配成本的同时,显著提升了开发效率与应用流畅度,是跨平台开发者从6.0.0升级的首选版本。
AI
智谱GLM-5强调的Agentic Engineering能力是什么?

智谱GLM-5强调的Agentic Engineering能力是什么?

智谱发布GLM-5,宣称开启‘Agentic Engineering(代理工程)’时代。从Andrej Karpathy提出的‘氛围编码’到追求完整工程闭环的‘代理工程’,行业重心正从代码生成转向自主修复与长程规划。GLM-5在SWE-bench Verified榜单逼近闭源第一梯队,但随之而来的涨价也揭示残酷现实:能力阈值决定可行性,成本阈值决定普及率。未来软件工程将分层演进——日常辅助靠低价模型,关键攻坚则需付费购买‘加速券’。
AI
非技术背景,一文读懂大模型后训练(万字长文)

非技术背景,一文读懂大模型后训练(万字长文)

大模型的后训练都在训练些什么?sft、rl、ppo、lora、adapter,这些算法开发们口中的专属名词,都代表着什么意思?本文将尽可能从非技术角度,一文帮你读懂大模型后训练。 同时这也是继去年发布《非技术背景,一文带你读懂大模型》后,时隔一年多,推出的非技术系列第二篇文章啦。也确实看到大家对于此类非技术向讲解的科普文比较感兴趣,希望这篇新文章能一样受大家的喜欢。
AI,个人随笔
16个月估值破10亿美元!众多VC押注一个新品类,AI写代码越快,这个问题越致命

16个月估值破10亿美元!众多VC押注一个新品类,AI写代码越快,这个问题越致命

AI让代码产出速度提升10倍,但生产环境的运维难度也在同步飙升。当开发者对AI生成的代码熟悉度下降,半夜被叫醒修Bug的次数反而增加。Resolve AI仅用16个月估值破10亿美元,凭借多Agent系统帮Coinbase将事故调查时间缩短72%。本文深度解析这个正在定义"AI for prod"新品类的公司,揭示AI编程革命背后被忽视的运维危机与破局之道。