"AI应用"相关的文章
AI,个人随笔
同一个模型,为什么你的 Agent 没有别人的好用?

同一个模型,为什么你的 Agent 没有别人的好用?

同样的基座模型和任务场景,为什么有的团队三个月就能让 Agent 跑真实业务,有的团队却一直在修 Bug?其实差距往往不在模型本身,而在幕后的数据工程。这篇文章聊了聊我们在训练 GUI Agent 时踩过的一些坑,比如数据同质化、忽略异常状态、标注不一致等,并分享了从场景拆解到 Bad Case 复盘的几点实际做法,希望能帮大家在堆数量之外,重新看看数据的设计。