AI医疗问答项目系列之提升召回准确率-query改写

0 评论 241 浏览 0 收藏 5 分钟

医疗场景中的Query改写不仅是技术挑战,更是生死攸关的产品设计命题。本文深度拆解医疗Query改写的3条铁律与4类安全操作,揭示如何通过'规则优先+轻量小模型'策略,在零风险前提下解决80%的医疗搜索痛点。从口语标准化到关键词补全,这套方案正在重新定义医疗搜索体验的安全边界。

一、医疗场景为什么不改写,一定会出大问题?

用户真实提问全是口语、模糊、省略、倒装,直接丢给意图识别/关键词匹配,10 个错 6 个:

不改写 = 意图识别失效 = 要么答不出,要么乱答 = 医疗场景致命体验问题

二、医疗 Query 改写的 3 条铁律(绝对不能碰)

你在面试里说这 3 条,直接体现你懂医疗、懂安全、懂落地

1)只做“翻译”,不做“推理”

只把口语→标准词,绝不替用户判断疾病、风险、病因

2)只做“补全”,不做“新增”

只补关键词,不增加医学信息。

3)只做“简化”,不做“联想”

越简单越安全,拒绝复杂思维链改写。

三、我们只做这 4 类改写(80% 问题全覆盖,零风险)

1. 口语 → 标准医学词(最核心)

  • 肚子硬 → 假性宫缩
  • 嗓子疼 → 咽痛
  • 吃咸的 → 高盐饮食
  • 血糖高了 → 血糖异常

2. 省略/模糊 → 补全关键词

  • 胎动多少 → 孕晚期 胎动 正常范围
  • 挂什么科 → 腹痛 科室选择

3. 长句复杂 → 拆成核心词

  • 孕38周又宫缩又见红怎么办
  • → 孕晚期 宫缩 见红 科普

4. 错别字/口语简写 → 修正

  • 孕产捡 → 产检
  • 糖鸟病 → 糖尿病

四、绝对不做的改写(医疗红线)

  • 不做:用户说“不舒服”→ 改写为“可能是感冒”(推理病情)
  • 不做:用户说“头疼”→ 改写为“偏头痛如何治疗”(下诊断)
  • 不做:多轮复杂 Cot、HyDE 改写(容易编内容)

五、改写放在流程图的精确位置(你这套体系的标准位置)

一句话讲清关系:

Query 改写 = 给意图识别“喂干净、标准的问题”,意图识别 = 决定这个问题走哪条路。

六、落地技术方案(产品面试可直接讲,极低成本)

你不用讲复杂算法,就讲这套**「规则优先+轻量小模型兜底」**:

1)80% 问题:规则改写(关键词映射表)

你作为产品经理,直接输出一张表:

口语词 → 标准医疗词

交给开发写正则就能跑,不用大模型、零成本

2)20% 复杂问题:轻量小模型改写

用 1B~3B 小模型(本地可跑),只干一件事:

把口语变成标准关键词组合

Prompt 模板(你可以直接用):

你是医疗Query标准化助手,只做一件事:

把用户口语问题,改成【标准关键词】,不推理、不诊断、不回答。

输出格式:关键词1 关键词2 关键词3

用户问题:{query}

标准关键词:

本文由 @而立与拾遗 原创发布于人人都是产品经理。未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!