"LLM"相关的文章
AI,个人随笔
拆解AI训练师核心工作:需求承接、规则制定、质检验收全流程(含多模态模型认知)

拆解AI训练师核心工作:需求承接、规则制定、质检验收全流程(含多模态模型认知)

AI训练师正成为AI项目落地的关键角色。本文系统拆解从大语言模型原理到项目全流程执行的实战方法,涵盖需求分析、数据标注、团队管理等核心环节,并提供汽车厂商标注案例的完整方案模板。无论是新手入门还是团队标准化建设,都能从中获得可直接落地的操作指南。
AI,个人随笔
AI产品经理实战手册/1:提示词工程与系统架构

AI产品经理实战手册/1:提示词工程与系统架构

提示词工程正经历从魔法咒语到系统配置的范式跃迁。本文深度解析2025年AI产品开发中最前沿的三大命题:如何用提示词构建确定性商业系统?智能体如何通过提示词实现非线性任务处理?百万级用户产品如何建立工程化提示词工作流?从ReAct模式到DSPy自动化优化器,揭示AI产品经理必须掌握的下一代核心技能。
AI
一文读懂AI编程原理与技术演进

一文读懂AI编程原理与技术演进

AI编程正在颠覆传统开发模式,Claude code等工具已能完成80%的代码编写和95%的测试工作。这不仅意味着开发效率的飞跃,更预示着产品经理需要掌握AI编程技能的时代已经到来。本文将深入剖析AI编程的底层原理与技术演进,从Transformer架构到Agent编程时代,揭示如何在这场生产力革命中保持竞争力。
AI,个人随笔
还在花冤枉钱做人工标注?掌握这套“AI评AI”神技,帮公司省下百万预算!

还在花冤枉钱做人工标注?掌握这套“AI评AI”神技,帮公司省下百万预算!

AI产品评测正面临革命性转折——当传统跑分榜单与用户体验严重割裂,UC Berkeley提出的“LLM-as-a-Judge”框架给出了破局方案。最新研究证明,GPT-4作为裁判与人类评估一致性超80%,但隐藏的位置偏差、话唠偏好等陷阱同样致命。本文将深度拆解MT-Bench多轮测试设计,揭示AI裁判的四大潜规则,并给出可落地的自动化评估体系搭建指南。
AI,个人随笔
给AI接上专有知识库:RAG的工程化实现

给AI接上专有知识库:RAG的工程化实现

当通用AI在企业内部屡屡‘失明’,RAG架构正成为解决专有知识盲区的关键钥匙。本文将深入拆解这套检索增强生成系统如何为企业AI装上‘内部记忆’,从知识向量化存储到语义检索优化,揭秘如何让大模型真正‘读懂’企业机密文档与实时数据,同时直面知识管理权限混乱、业务术语适配等深层管理挑战。
AI
AI 智能体“失忆”了吗?

AI 智能体“失忆”了吗?

长上下文AI的记忆问题一直是产品设计的痛点,LightMem论文带来革命性解法:模仿人类睡眠机制的三层记忆架构,将Token消耗骤降38倍的同时提升QA准确率。这不仅破解了实时性与成本的悖论,更揭示了异步记忆体验与端云协同的新产品逻辑。
AI
2025年LLM(大模型)年度回顾

2025年LLM(大模型)年度回顾

2025年的大模型领域迎来了一系列颠覆性变革:从RLVR技术带来的推理能力突破,到Claude Code重新定义AI交互范式,再到氛围编程彻底改变软件开发逻辑。这篇文章深度解读了六大技术拐点如何重塑行业格局,揭示了大模型智能独特的'锯齿状'特征,以及GUI交互、垂直应用等前沿趋势的爆发式演进。