"大模型"相关的文章
AI,个人随笔
实测完主流大模型编程与Agent能力,我发现了。。。

实测完主流大模型编程与Agent能力,我发现了。。。

今天,苍何将通过一系列实测案例,带你深入了解这些主流大模型在实际应用中的表现。从可视化欧拉恒等式到设计带有动画效果的天气卡片,从创建《木兰辞》的动态页面到电商产品详情页管理工具的开发,这些测试将全方位展示各模型的能力。你将看到它们在代码质量、UI设计、多模态分析等方面的优劣。
AI
OpenAI的新论文,为什么被业内嘲讽是营销?

OpenAI的新论文,为什么被业内嘲讽是营销?

OpenAI 新论文把“幻觉”甩锅给评测机制:考卷只认“猜对”,不认“不敢说”,逼得模型瞎蒙。业内却集体翻白眼——观点不新鲜、实验太初级,被批像给 GPT-5 低幻觉性能打软广。当学术变成营销话术,真正该回答的问题是:我们到底想要一个“不确定就闭嘴”的保守答案机,还是敢想敢错的智能体?
AI
谁在暗中驯化大模型?

谁在暗中驯化大模型?

当大模型在聚光灯下“口吐莲花”时,很少有人注意到:是谁在暗处拉紧缰绳——让ChatGPT拒绝回答敏感话题,让推荐算法只推送“安全”内容?从RLHF的奖励标签,到平台审核的“黑词库”,再到开源社区的“价值观对齐”补丁,一套隐形驯化机制早已悄然运行。本文带你揭开:谁在定义“正确”?谁在塑造AI的三观?当技术看似中立,真正被训练的,也许是我们所有人。
AI,个人随笔
如何提升大模型LLM回答的准确率

如何提升大模型LLM回答的准确率

随着 LLM 在各类产品中广泛应用,如何提升其输出的准确率,已成为产品经理与技术团队绕不开的核心问题。本文将从提示词设计、系统架构、评估机制等多个维度出发,拆解影响 LLM 准确率的关键因素,并提供可落地的优化策略,帮助你打造更可靠、更可控的 AI 产品体验。
AI
动态知识从RAG到Context Engineering

动态知识从RAG到Context Engineering

RAG(检索增强生成)曾是连接外部知识与模型能力的关键桥梁,但随着业务复杂度提升,它的局限也逐渐显现。Context Engineering 的出现,正在重新定义“知识注入”的方式——从检索到构造,从拼接到理解,让上下文成为真正的生产力。本文将带你梳理从 RAG 到 Context Engineering 的演进路径,揭示背后的技术逻辑与产品思维,帮助你在构建智能应用时少踩坑、快落地。