建设中医科研数据库和西医科研数据库,到底差别在哪?(一)

0 评论 321 浏览 0 收藏 14 分钟

中医与西医科研数据库建设的本质差异,远不止于数据格式的不同。从术语标准化、问诊连续性到知识库构建,中医面临的核心挑战是如何将老专家的经验智慧转化为可计算的结构化数据。本文将深入剖析七大关键差异点,揭示中医数据库建设为何既是技术攻坚,更是一场文化遗产的抢救行动。

一、为什么存在区别?

总体来说建设过程类似:都要经过这几个大模块:原始数据采集层—>数据治理层(建索引、结构化、归一化、标准化)—>数据存储(加密脱敏存储)—>数据应用与转化(包括临床科研一体化平台、专科专病数据库、患者随访、AI辅助诊疗等)。

但是由于中西医本身诊疗活动的区别,导致在建设数据库时侧重点难点以及各自的个性化特点不相同:

西医:源数据种类多同时相对规整,有非常多的检查检验手段措施,一般临床程序是基于症状关联到可疑疾病-一项项检查检验排除-最终得到确诊疾病,因此西医的源数据中会有更多的数字和编码比如西医的数据:血糖6.1mmol/L、白细胞计数8.5×10⁹/L、CT显示肺部结节3mm。天然就是数字,电脑直接能算。西医搞科研数据库,比起中医来,更像整理一个巨大的Excel表格,需要按照模型(类似于图书馆的位置区域分类等)作处理规整分类,难点在于”量太大、要整合”。

中医:源数据相对种类少同时存在非常多的自由文本:因为中医的筛诊治等需要的仪器检查类较少,更多依赖名老中医以及古方的经验传承,所以中医搞数据库,就像把一个老中医脑子里的东西“掏出来”变成别人能用的东西,如“舌淡红、苔薄白、脉细沉、脾气虚弱等”——数据本来就是一堆文字、笔记、古书,难的是“怎么变成能分析的格式”。

再举个大白话例子去感受下西医建数据库和中医建的区别:想象两家餐厅要建”菜谱数据库”:

西餐厅(相当于西医):菜谱本来就很标准,200克牛排、煎5分钟、撒3克盐。建数据库就是把所有菜谱录进电脑、分类检索。难点是菜谱太多、要整合不同分店的做法。

中餐厅(相当于中医):大厨的菜谱写的是“盐少许、油适量、火候看感觉、翻炒至断生”。还有一些秘方在大厨脑子里,从来没写下来过。更有一些是师傅口传心授的,“你看我这个手腕怎么抖的”。建数据库不光要录入,还要先把“少许”“适量”翻译成具体克数。大厨还担心:你把我秘方录进去了,别人学走了怎么办?

这就是中医和西医建科研数据库的根本区别。

二、具体区别在哪里?

区别整体来说包括数据源、数据标准化术语、问诊的连续性、知识库、师承、统计分析方法等。

差异一:数据长什么样?

西医的数据:血糖6.1mmol/L、白细胞计数8.5×10⁹/L、CT显示肺部结节3mm。天然就是数字,电脑直接能算。

中医的数据:”舌淡红、苔薄白、脉沉细、面色萎黄、少气懒言””证属脾肾阳虚,治以温补脾肾,方用附子理中汤加减,去干姜加肉桂3克”。全是文字描述,电脑看不懂,必须先”翻译”成结构化信息。

带来的技术侧重点:中医需要花费大量力气做NLP(让电脑读懂中医病历),西医在这部分花费的力气少于中医。

差异二:术语统不统一?

西医:全世界说同一种“语言”,很多时候可用同一套编码,高血压就是I10,糖尿病就是E11。不管哪个医生写,电脑都认识。

中医:虽然也有标准术语,但是标准化通用化程度不如西医高,需要先“统一方言”。张大夫写”气虚”,李大夫写”中气不足”,王大夫写”脾气亏虚”。其实说的可能是一回事,但电脑以为是三种不同的病。必须有人告诉系统”这三个词其实是一个意思”。

差异三:一次看病还是连续看病?

西医科研:很多时候研究关注”这个药有没有效”,要做患者的前后对比,可能患者的几次就诊数据甚至一次就诊的数据打包就够用。

中医科研:一个慢性病患者可能看了20次,每次方子都不一样——上次加了黄芪,这次减了白术,下次又换了个方。这个”调方过程”本身就是科研的重点——老专家为什么这样调?必须把20次看病串成一条线,看到完整的变化过程。所以中医对多次看病的前后对比串联要求更高,需要把多次看病像串糖葫芦一样串起来。

#当然这部分内容西医也是关心的,只不过中医的关注程度会更高。

差异四:知识从哪来?

西医的知识库:像一个规整的图书馆,来源很集中,临床指南、Cochrane综述、药品说明书。格式统一、定期更新、全球共享。直接买个UpToDate账号就解决了大部分问题。

中医的知识库:更像是古墓里挖出来的竹简加上老专家书桌上的便签纸加上最新出版的教材——全混在一起,得整理归类,要看2000年前的《伤寒论》(古文,还得OCR扫描)。要看现代中医临床指南(白话文PDF)。要看张老的个人笔记(手写的,只有他工作室的人能看)。要看药品说明书(中成药、西药都有)。这些东西格式不同、年代不同、权限不同,全得塞进一个系统里。

带来的技术难点:把各种书和笔记变成”能问能答”的知识库。西医买个UpToDate就差不多了。中医得把古书、指南、专家笔记全加工一遍,还得分权限。

差异五:老师怎么教学生?

西医教学:标准化规培,统一教材、统一考试、轮转各个科室。不依赖某个特定名医的个人经验。”不管谁教你,知识点是一样的”。

中医教学:师承为核心,”你跟张老学的和跟李老学的,可能完全不一样”。学习过程是:看师父怎么看病→自己试着开方→师父点评你哪里开错了→慢慢进步。这个过程以前全在脑子里,从来没有被记录和量化过。工作室考核要求”培养了几个合格的学生”,但”合格”怎么衡量?以前没有标准。

西医教学像驾校——统一教材统一考试;中医教学像学手艺——跟着师父一个个带,以前没法量化”学到了几成功力”。

带来的个性化建设点:师承教学数字化。西医科研数据库根本不管教学的事。中医的师承过程本身就是科研数据,必须建在里面。所以这也是为什么比如中国中医科学院会建设名老中医经验数据库,或者有的中医院建设的项目是以某个老中医为名建设的。

差异六:科研分析方法不一样

西医科研常用方法:t检验、卡方检验、生存分析、Cox回归、Meta分析。工具成熟,SPSS、R、SAS随便用。

中医科研特有的方法,举例如下:

  • “这个老专家最爱用哪几味药搭配?”——关联规则分析(世面上有这些方法软件,比如latern5.0,也叫孔明灯软件,也能用python或者r语言实现,经常用来筛选老专家爱用的药物搭配对,比如酸枣仁和远志);
  • “他治失眠的用药网络长什么样?”(世面上也有这些专业软件,比如Cytoscape(免费开源,中医科研标配)、Gephi以及python也能实现。经常用来筛选比如治疗失眠的药物网络,看到哪些的核心常用的药,哪些是辅助用药)——复杂网络图。
  • “他的核心方和教科书方有什么区别?”——方剂相似度对比(世面也有这些在线分析工具比如TCMNPAS 平台、商业软件:中医传承辅助平台(TCMISS)或者用python或者r语言);
  • “他的方子有没有可能变成院内协定方?”——方剂转化评估(常用评估框架与工具这部分偏临床 + 药学综合评估,常用方法包括:处方可行性评估、药味合规性(排查十八反 / 十九畏、毒性药材用量是否超标)、药材可及性(评估药材供应稳定性、道地性)、临床证据等级评估(分析处方在临床中的疗效数据如有效率、不良反应率)、提取工艺可行性(判断处方是否适合制成颗粒剂、合剂等院内制剂)

差异七:数据安全和权限控制:谁的东西?能不能给别人看?

西医科研数据库的安全问题:主要是患者隐私,不能泄露患者信息。脱个敏就基本解决了。

中医科研数据库的安全问题(多了一层):患者隐私要保护(和西医一样)。但还有一个大问题:老专家的经验是他的”知识产权”。张老的核心方是他一辈子的积累,他凭什么让别的工作室免费用?如果专家担心”我的东西被人拿走了”,他就不配合录入,整个项目就完了。所以中医必须有”分层权限”:公共知识大家看,私有经验只有授权的人能看,谁看了有记录。

简单来说:西医主要保护患者隐私,中医除了保护患者,还得保护”老专家的秘方”——不然人家不跟你玩。

带来的技术建设独特点:专家知识产权保护。西医没这个问题,中医不解决这个问题,专家不配合,项目就是空壳。

三、所以中医的建设方案应该把钱花在哪?

最该花钱的(最优先):让电脑能”读懂”中医病历的NLP能力;中医术语标准库(解决”各说各话”的问题);复诊链路自动串联(把多次看病穿成线)。

第二优先:知识库加工流水线(把各种书和文档变成可用的知识);严格的溯源机制(AI回答必须说”我是从哪本书看到的”)。

第三优先:师承教学数字化(跟师记录、师徒对比、能力评估);中医特色科研分析工具。

容易被忽略但不能省的:权限和安全机制(让老专家放心);驾驶舱和成果展示(让领导看到效果)。

四、一句话总结

西医科研数据库是”整理仓库”——东西都有,需要码整齐。

中医科研数据库是”抢救遗产”——东西在老专家脑子里、在古书里、在笔记本里,你得先”挖出来”,再”翻译”成电脑能懂的格式,还得让老专家愿意配合你挖,最后还得让这些东西能被后人用起来做科研。

难度完全不在一个层面。所以报价和工期也不能按西医CDR的经验来估。

本文由 @云 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!