没有功德圆满,没有一步登天,一些提示词撰写的个人体会

Mrs.Data
0 评论 1175 浏览 2 收藏 11 分钟
🔗 B端产品经理需要更多地关注客户的商业需求、痛点、预算、决策流程等,而C端产品经理需要更多地关注用户的个人需求

在大语言模型(LLM)的应用中,提示词的撰写是实现高效人机交互的关键环节。本文作者通过丰富的实践经验和案例分享了关于提示词撰写的深刻体会,强调提示词并非万能,其效果受限于模型能力和业务需求的匹配度。

最近很多项目中都需要用到提示词工程,经过一段时间的实践和验证,总结了一些个人体会比较深刻的感悟。

一、提示词不是万能的,大模型不是万能的

自从deepseek火出圈后,各行各业,不论大公司、小公司似乎都加快了大模型在企业内部的应用。

但是大多数公司由于缺乏专业的数据、算法团队,缺乏前期的技术积累和数据积累,能快速入手满足尝鲜需求的,就只有提示词+通用大模型。

但是不是所有场景都能只通过提示词来实现。面对业务部门提出的需求时,最好仔细判断和验证。

用提示词是事半功倍,还是事倍功半。如果要说服业务不要通过大模型来实现他们的需求,也最好能通俗易懂的告诉他们为什么。

如何通俗易懂的告诉业务,他们的需求模型和提示词不能做,或者仅靠模型和提示词不能做?

可以尝试简单回答下面的这几个问题,基本上能让业务对自己的需求能不能做、以及做出来的最终效果有一些预期。

  • 上下文限制:为什么不能上传多个文件,为什么不能上传超过一定字数的文件
  • 生成速度:为什么回答速度这么慢
  • 模型幻觉:为什么生成的内容和事实不符?能不能保证百分百的精确和准确?
  • 文件解析:为什么不支持pdf\ppt\png\jpg格式的文件识别
  • 多模态:为什么不能处理视频、音频

二、提示词需要不断迭代

提示词的撰写没有功德圆满,没有一步登天。

需要不断的迭代和修改,无限接近,但可能永远无法达到最完美的境地,当然也不需要完美,只需要最适合当前的情景。

在个人的实际应用中,发现提示词的迭代往往遵循这样的规律:

  • 第一版提示词通常是基于对需求的初步理解,能解决80%的简单场景;
  • 第二版提示词会针对测试中发现的问题进行修正,覆盖到90%的场景;
  • 第三版及以后的迭代则是在边缘案例和特殊情况上不断打磨,期望能尽可能多的覆盖更多场景。

有时候,一个看似微小的词语调整,就能让模型的输出从混乱变得井然有序,当然也有可能导致模型输出效果变得更差。

这种迭代不是无休止的,而是要找到一个平衡点——当提示词能够满足业务核心需求,且边际收益开始递减时,就可以暂时告一段落。

记得随时记录每次迭代的变化和效果,这些积累下来的经验,会成为提示词工程能力提升的宝贵资源。

三、提示词撰写是一项科学工程

有效的提示工程需要将其视为科学过程,这需要严格记录实验(提示、设置、结果),以便进行学习、比较和复现 ,从而帮助我们更加系统、理性地应对复杂的业务需求,提高撰写成功率和效率。

提示词撰写虽然看起来只是写几行文字,但实际上它涉及到需求分析、方案设计、实现、测试和优化的完整流程,就像软件开发一样需要遵循工程化的方法。

首先,需求分析阶段要明确业务目标和约束条件。这包括理解用户真正需要解决的问题,以及可能面临的各种边界情况。一个好的提示词工程师会问”为什么需要这个功能”而不仅仅是”需要什么功能”。

其次,方案设计阶段需要考虑提示词的整体结构。这包括角色设定、任务描述、约束条件、输出格式等要素的组织方式。好的提示词结构应该清晰、模块化,便于后续维护和调整。

实现阶段则是根据设计编写具体的提示词内容。需要对自然语言有敏锐的感觉,知道哪些表达方式更容易被模型准确理解,哪些可能导致歧义。(这是我个人比较擅长的领域)

测试阶段尤为重要,需要设计各种测试用例,覆盖正常场景和边缘场景。通过系统性测试,发现提示词的弱点和盲区。

最后是优化阶段,根据测试结果有针对性地调整提示词。这是一个反复试错的过程,需要耐心和细心。

四、提示词撰写门槛低,上限高

门槛低

任何一个普通员工,即使没有技术背景,也可以通过一些简单的培训,快速学会提示词的撰写。

如果能够再投入一定的精力,学会top-k\ top-p等参数的应用、了解COT\TOT\少样本学习等撰写技巧后,就能针对许多业务场景进行探索和实验。

上限高

合适的场景+合适的提示词,能够实现令人眼前一亮的效果,精心设计的提示词可以让模型的输出质量接近专业人士的水平。

提示词的上限取决于对业务领域的理解深度、对模型特性的把握程度以及提示词设计的巧妙程度,当然也受限于当前所使用模型能力的上限。当这些因素结合得当时,即使是通用模型也能表现出接近专家的能力。

正是这种”门槛低、上限高”的特性,使得提示词工程成为当前AI应用落地最具性价比的方式之一。

五、简洁、简洁还是简洁

提示词的撰写要珍惜宝贵的上下文额度。在一些复杂的业务需求中,需要说明的任务较多时,必须在能简洁的地方用最简洁的文字描述,这样才能为核心的说明留下更充足的字数。

当你想要给当前的提示词增加一些内容时,最好同时看看哪里能删减一些内容, 且不影响最终效果。

简洁并不意味着模糊或不完整,而是要用最精准的语言表达最核心的意图。这需要不断练习和打磨,找到每个词存在的价值。

在实践中,我发现一个有效的方法是先写出完整的提示词,然后进行”减法”——删除那些不直接影响输出质量的描述性文字,合并表达相似意思的句子,用更简洁的表达替换冗长的说明。

模型理解能力很强,不需要像对人类那样反复强调或解释。直接、明确、简洁的指令通常比长篇大论更有效。

六、模型能力很重要,提示词能力也有限;但如果选择不多,就需要最大化利用自己手头上已有的。

模型能力的高低,会直接表现在对提示词的回应上。同样的提示词,一个更先进的模型,就是能更好的发挥作用。

如果现在你感觉提示词的效果并不好,可以等一段时间,更强大的模型推出后再试试,许多问题会迎刃而解。

当然,并不是所有公司都有资源支持先进模型的落地,虽然前面说了很多提示词应用的局限。

但是当你所在的公司处于硬件设备、数据、技术、模型、团队资源有限的情况下,提示词确实是最快捷、最低成本落地AI的途径。有时候,限制反而能激发创造力。

在资源有限的情况下,可以采取一些策略来最大化现有模型的效果。例如,将复杂任务拆分成多个简单任务,让模型逐步完成;利用少样本学习,提供几个高质量的示例来引导模型;或者设计巧妙的提示词结构,让模型按照特定的思考路径来解决问题,或者开发一些工具,供模型使用,再下一步就是开发agent应用。

七、总结一下

总的来说,提示词工程是一门融合了语言艺术与科学的实践,它既需要对语言的敏锐感知,也需要系统化的工程思维。在企业应用中,应当既看到它的潜力,也需要认清它的局限。不断通过实践积累经验,在迭代中寻找最佳平衡点。

提示词工程不是终点,而是通向AI应用落地的一条重要路径。随着技术的发展,我们的工具会更强大,但提示词背后的思考方式和方法论,将继续指引我们更好地驾驭AI的力量,为业务创造真正的价值。

本文由 @Mrs.Data 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!
专题
37919人已学习20篇文章
“搜索功能”拆解:小功能,大细节。
专题
13841人已学习12篇文章
本专题的文章分享了CRM的入门知识,分享了CRM是什么。
专题
17690人已学习13篇文章
本专题的文章分享了小程序介绍、小程序搭建、优化设计规范和功能设计指南
专题
36031人已学习14篇文章
原型对于产品经理来说是一门必修课。
专题
18615人已学习14篇文章
智能客服类产品,最根本的价值在于以低成本取代人工客服工作中大量重复性的部分。本专题的文章分享了如何搭建一个智能客服。
专题
14357人已学习12篇文章
4P指产品(Product)、定价(Price)、渠道(Place)、宣传(Promotion)。本专题的文章分享了解读4P营销理论。