AI医疗问答项目系列之提升召回准确率-query改写
医疗场景中的Query改写不仅是技术挑战,更是生死攸关的产品设计命题。本文深度拆解医疗Query改写的3条铁律与4类安全操作,揭示如何通过'规则优先+轻量小模型'策略,在零风险前提下解决80%的医疗搜索痛点。从口语标准化到关键词补全,这套方案正在重新定义医疗搜索体验的安全边界。

一、医疗场景为什么不改写,一定会出大问题?
用户真实提问全是口语、模糊、省略、倒装,直接丢给意图识别/关键词匹配,10 个错 6 个:

不改写 = 意图识别失效 = 要么答不出,要么乱答 = 医疗场景致命体验问题。
二、医疗 Query 改写的 3 条铁律(绝对不能碰)
你在面试里说这 3 条,直接体现你懂医疗、懂安全、懂落地:
1)只做“翻译”,不做“推理”
只把口语→标准词,绝不替用户判断疾病、风险、病因。
2)只做“补全”,不做“新增”
只补关键词,不增加医学信息。
3)只做“简化”,不做“联想”
越简单越安全,拒绝复杂思维链改写。
三、我们只做这 4 类改写(80% 问题全覆盖,零风险)
1. 口语 → 标准医学词(最核心)
- 肚子硬 → 假性宫缩
- 嗓子疼 → 咽痛
- 吃咸的 → 高盐饮食
- 血糖高了 → 血糖异常
2. 省略/模糊 → 补全关键词
- 胎动多少 → 孕晚期 胎动 正常范围
- 挂什么科 → 腹痛 科室选择
3. 长句复杂 → 拆成核心词
- 孕38周又宫缩又见红怎么办
- → 孕晚期 宫缩 见红 科普
4. 错别字/口语简写 → 修正
- 孕产捡 → 产检
- 糖鸟病 → 糖尿病
四、绝对不做的改写(医疗红线)
- 不做:用户说“不舒服”→ 改写为“可能是感冒”(推理病情)
- 不做:用户说“头疼”→ 改写为“偏头痛如何治疗”(下诊断)
- 不做:多轮复杂 Cot、HyDE 改写(容易编内容)
五、改写放在流程图的精确位置(你这套体系的标准位置)

一句话讲清关系:
Query 改写 = 给意图识别“喂干净、标准的问题”,意图识别 = 决定这个问题走哪条路。
六、落地技术方案(产品面试可直接讲,极低成本)
你不用讲复杂算法,就讲这套**「规则优先+轻量小模型兜底」**:
1)80% 问题:规则改写(关键词映射表)
你作为产品经理,直接输出一张表:
口语词 → 标准医疗词
交给开发写正则就能跑,不用大模型、零成本。
2)20% 复杂问题:轻量小模型改写
用 1B~3B 小模型(本地可跑),只干一件事:
把口语变成标准关键词组合。
Prompt 模板(你可以直接用):
你是医疗Query标准化助手,只做一件事:
把用户口语问题,改成【标准关键词】,不推理、不诊断、不回答。
输出格式:关键词1 关键词2 关键词3
用户问题:{query}
标准关键词:
本文由 @而立与拾遗 原创发布于人人都是产品经理。未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
评论
- 目前还没评论,等你发挥!

起点课堂会员权益




