"大模型"相关的文章
AI,个人随笔
实测完主流大模型编程与Agent能力,我发现了。。。

实测完主流大模型编程与Agent能力,我发现了。。。

今天,苍何将通过一系列实测案例,带你深入了解这些主流大模型在实际应用中的表现。从可视化欧拉恒等式到设计带有动画效果的天气卡片,从创建《木兰辞》的动态页面到电商产品详情页管理工具的开发,这些测试将全方位展示各模型的能力。你将看到它们在代码质量、UI设计、多模态分析等方面的优劣。
AI
OpenAI的新论文,为什么被业内嘲讽是营销?

OpenAI的新论文,为什么被业内嘲讽是营销?

OpenAI 新论文把“幻觉”甩锅给评测机制:考卷只认“猜对”,不认“不敢说”,逼得模型瞎蒙。业内却集体翻白眼——观点不新鲜、实验太初级,被批像给 GPT-5 低幻觉性能打软广。当学术变成营销话术,真正该回答的问题是:我们到底想要一个“不确定就闭嘴”的保守答案机,还是敢想敢错的智能体?
AI
谁在暗中驯化大模型?

谁在暗中驯化大模型?

当大模型在聚光灯下“口吐莲花”时,很少有人注意到:是谁在暗处拉紧缰绳——让ChatGPT拒绝回答敏感话题,让推荐算法只推送“安全”内容?从RLHF的奖励标签,到平台审核的“黑词库”,再到开源社区的“价值观对齐”补丁,一套隐形驯化机制早已悄然运行。本文带你揭开:谁在定义“正确”?谁在塑造AI的三观?当技术看似中立,真正被训练的,也许是我们所有人。