摘要:病案信息是建设医疗健康大数据的核心和基础。医疗健康大数据的运用前景非常广泛,将在辅助卫生政策制定、临床决策支持、药物研发和评价、疫情监测与疾病预防等方面发挥重要作用。分析了在医疗健康大数据视角下,当前病案管理存在病案信息孤岛普遍存在、原有病案管理标准不适应大数据要求、病案隐私和权利保护不够、病案信息的收集统计方法落后、缺乏病案管理复合型人才等方面的不足,并提出建设全国性病案信息共享平台、制定符合大数据要求的病案标准、加强隐私保护、积极采用现代信息技术记录病案材料、调整优化病案管理人员等5个方面的建议。
关键词:医疗健康;大数据;互联网;病案;统计管理
近年来,大数据引起了产业界、科技界和政府部门的高度关注。2008年«Nature»出版专刊“BigDa ̄ta”[1],2011年«Science»也推出关于数据处理的专刊“Dealingwithdata”[2],2012年3月奥巴马宣布美国政府投资2亿美元启动“大数据研究和发展计划”[3],将“大数据研究”上升为国家意志。同样,医疗卫生领域也迎来了“大数据时代”,如在药物研发中使用基因数据、临床实验数据的共享、电子病历系统(EMRs)的广泛使用以及医疗保险、患者登记和社会媒体中的数据使用等[4]。病案是医护人员记录患者疾病诊疗过程的文件。它客观、完整、连续地记录了患者的诊疗经过、病情变化、治疗效果等情况,是医院医疗、教学、科研的基础资料[5],也是建设医疗健康大数据的核心和基础。医疗健康大数据的发展方兴未艾,很多问题还有待深入研究,文章从医疗健康大数据的运用前景出发,分析医疗健康大数据视角下当前病案管理存在的不足,并提出对策建议,为加强医院病案统计及管理、建设医疗健康大数据提供参考。
1医疗健康大数据的运用前景展望
1.1辅助卫生政策制定
美国联邦政府和州级政府自2014年以来制定的32�600余份卫生相关政策文件均使用大数据平台所获取的支持数据[6]。传统的卫生决策与卫生政策制定主要根据下级反馈、上级调研和简单的卫生统计数据。在医疗健康大数据的背景下,通过建立全员人口、健康档案和电子病历三大数据库共享平台和共享机制,建立覆盖全国的基本公共卫生、电子病历共享、新农合结算、卫生监督、免疫规划和预约挂号等业务应用,实现健康医疗领域的数据汇聚、系统互联和信息共享,卫生政策制定时能以卫生信息系统平台和各部门相关卫生数据为基础,同时采集、存储、挖掘、分析和优化全国乃至国际相关卫生决策所需数据,构建基于大数据的卫生政策分析框架:包括卫生筹资、卫生规划、卫生绩效评价、药品使用监测、卫生技术评估等模块,并开展卫生政策理论和应用型研究,促进卫生决策与卫生政策制定的透明度和科学性。
1.2临床决策支持
传统临床决策主要基于患者主诉和即时性检查结果等横断面资料。医疗健康大数据将为临床医生提供患者出生、经历、就业、居住、环境等传统诊疗模式下不易收集的全面资料,帮助医生做出高效、准确、低成本的临床决策。美国哈佛大学的亨利�麦道尔斯博士与IBM公司合作,基于卫生大数据系统来监测早产儿感染情况的发生,这套系统可以为早产儿多争取到16h的治疗时间,即系统可以在感染症状明显发生的16h前发出警示信息[7]。美国西达赛奈(Ce ̄dars-Sinai)医疗中心新开发的信息系统(AllHealthRobotics)通过促进电子健康档案系统(EHRs)和医疗数据的交换,每年可以节省21亿美元的医疗资源[8]。另外,将单个样本数据使用大数据算法进行处理,可以观测到单个样本不能检测出的细小差别,为医生提供更加科学的、符合循证医学原则的临床指导建议。美国杜克大学医学中心借助普惠超级计算机的大数据处理能力,通过吸收325万页病案数据、12万份临床试验和55种医疗杂志报道的12万份数据,开发出了一套肿瘤治疗决策工具。该工具可以根据输入信息自动生成诊断、治疗建议,据统计该工具给出的诊疗建议89%被临床医生采纳[9]。
1.3药物研发和评价
药物研发是医疗健康大数据运用的重要领域。第一,在药物研发立项阶段,通过大数据技术分析大范围的病案资料,综合药物治疗时间、出院结局、治疗费用等信息,判断当前同类产品的效果和性价比,有针对性地进行更有替代产品的研发。诺华公司治疗慢性心衰的药物Entresto在立项阶段即使用了谷歌、拓尔思等40家大数据公司的3000万条数据[10]。另外,药物研发机构还可以以通过收集更大范围的健康大数据,找出社会公众药品需求的“痛点”,以合理配置资源,确立更有市场前景的药物研发项目。第二,在确定药物研发方向阶段,药物研发机构在评估病案资料大数据的基础上,还可以利用临床试验、代谢组学、蛋白质组学、基因组学等数据,来确定拟开发药物个性化的治疗原理。第三,在药物上市阶段,要全面占有文献数据、医疗数据、监测数据和Ⅳ期临床试验数据,并使用大数据技术整合分析以上所有数据,进行全方位、多层次、多角度的分析,以准确评估药物上市后的经济性、有效性和安全性。英国药品监管部门通过大数据技术,来追踪和整合包括促销支出、药房、广告、制造、出版物、消费者和科研人员等信息,每年使用3.2亿条数据以监控药品销售情况、市场分布情况和用药安全情况[4]。
1.4疫情监测与疾病预防
通过连续分析和不断整合疾病疫情信息,能不断提高公共卫生预警和预报能力。常超一等[11]结合各地的航空可达性,并整合多种来源的数据,对甲型H1N1流感的航空旅行扩散、空间分布、流行病学特征进行了探索性的预测估计。法国巴黎瑞尔斯医学中心采用ToDiseases预测模型,有效使区域内的高风险患者急诊就诊率降低了42%,还将这部分高风险患者的月再入院率从29%降到9%[12]。有研究显示,影响健康的因素只有10%左右已被卫生工作者认定,另外90%的影响因素(社会经济状况、自然环境、遗传因素、健康行为等)还未被确认[13]。大数据技术可以将个人和行为数据信息(如娱乐方式、收入、饮食习惯、教育状况等)与医疗健康信息(如既往史、诊疗信息等)统筹起来,对健康危险因素进行比对关联研究,制作特定区域、特定人群的健康危险因素图谱。这种基于社会和医疗数据、直接针对最适宜人群实施的干预措施将会更加直接、有效。
推荐阅读:哪些医学类普刊比较好发
2医疗健康大数据视角下当前病案管理存在的不足
2.1病案信息孤岛普遍存在
现阶段医院病案管理和统计的目的主要是历史档案存储、医学法律证据留存和医疗评价,分析利用的水平还不够高。且由于工作惯性和技术手段的限制,病案资料的共享、整合、利用严重滞后,使得各医疗卫生单位都保存有一定数量的病案资料,但由于互联互通、共享利用的不足,形成了单个数据体量较小(10TB数量级)但机构数量众多(3万余家)的病案信息孤岛。
2.2原有病案管理标准不适应大数据要求
医疗健康大数据的分析、利用需基于统一的信息处理标准之上。建设覆盖大区域、多部门的病案信息共享中心和医疗机构内部信息共享中心也需要基于统一的信息处理标准之上。不同来源、不同维度的病案数据单元需使用统一编码机制,才能使用大数据技术汇总、整合为有序、统一的大数据,而不是杂乱无序的大数据。传统的病案管理核心标准有手术编码(ICD-9-CM-3)和疾病编码(ICD-10),这一基于纸媒的标准已经不适应医疗健康大数据分析的要求。
2.3病案隐私和权利保护不够
我国传统病案信息的外显方式是医务人员借阅和患者复印,做好简单的借阅复印、登记即可满足隐私和权利保护的需要。但大数据技术使得病案信息的流传、分享变得更加便捷和不可控,如果患者的个人信息、病情甚至蛋白、基因等隐私信息遭到泄露,将会使医院病案管理陷入极大的法律风险之中。
2.4病案信息的收集统计方法落后
我国传统的病案收集方法是由临床医生手写、临床科室整理后上报,导致病案信息汇总的时效性不强,也不便于病案信息的后期数字化处理。另外,传统病案数据分析方法主要针对结构化数据展开,即有的病案信息处理流程、分析体系能高效地处理相对较少的结构化数据。在医疗健康大数据时代,非结构化数据和半结构化数据量正在快速增加,给传统的病案统计分析技术带来了巨大的挑战。
2.5缺乏病案管理、大数据方面的复合型人才
医疗健康大数据的汇总和统计分析人员不仅需要具备医学知识、统计学知识,更需要具备互联网、信息化、大数据方面的知识和技能。现阶段病案管理人员以医学、统计学、数学、档案管理学等专业背景为主,其中统计学、数学、档案管理学背景约占80%,医学约占15%,计算机专业背景仅占约5%[14],前两类人才普遍不具有互联网思维和大数据处理能力,使得医疗机构普遍缺乏病案管理、大数据方面的复合型人才。
3医疗健康大数据视角下病案管理对策建议
3.1建设全国性病案信息共享平台
医疗健康大数据之所以“大”,是因为要汇聚、整合海量的电子病案信息。由于电子病案信息的隐私性和敏感性,医疗健康大数据的形成必须反互联网发展“去中心化”而行之,以政府公信力为保障建设全国性病案信息共享平台。国家卫生与健康行政管理部门要以服务民生、发展健康产业为出发点,推进建设区域性、乃至全国性的医疗卫生数据资源库及其“大数据”信息处理与共享平台,以整合、汇聚并开发利用电子病案信息,并在保密的前提下向公众和企业开放。区域性、乃至全国性病案信息共享平台除了电子病案信息和居民健康档案管理系统以外,还应有公共卫生疫情直报系统、卫生突发事件应急处理系统、医院信息管理系统(如PACS、CIS、HIS)等,甚至使用数据挖掘、网络机器人、爬虫技术、云计算等互联网信息技术手段,囊括科学文献数据库、社交网络、患者行为、药物研发、生命科学研究等方面的大量生物医学相关信息,构建一个内涵丰富、外延广泛的病案信息共享平台。
3.2制定符合大数据要求的病案标准
医疗健康大数据汇聚形成的基础是标准化数据和规范化数据。2016年国家标准化管理委员会批准发布了«GB/T14396-2016疾病分类与代码»,手术分类编码国家标准亦在制定中,其目的就是为后期病案大数据管理作准备。对于病案中其他数据项,国家在2011年颁布新版病案首页时,同时发布了相关标准,医疗机构病案统计管理部门应加强与临床医师沟通,定期在全院分专科组织诊断和手术填写培训,针对各临床专科易出现问题进行专项培训,提高临床医生病历书写的标准化能力。病案统计管理人员要尽快学习和掌握上述应标准,推行使用标准编码。另外,新形势下应由国家卫生与健康行政管理部门组织力量,制定新的、符合大数据要求的病案标准,促进病案信息统计工作和医疗健康大数据的建设。
3.3加强隐私保护
目前,很多互联网专家认为在将数据加入到大数据库之前,通过电脑程序将患者能够被识别的信息从医疗记录中去除,可以克服传统病案管理私隐保护不足的问题[9,10,13]。但是,由于缺乏独特的识别信息,可能导致其他数据不能和研究的其他样本整合,也不能进行某类人群的大范围研究。而且去识别化过程本身需要处理可识别的信息,可能使患者信息在没有经过知晓、同意和授权的情况下被其他人使用。此外,在现在的法律框架下,与去识别信息有关的研究也不受人体试验研究相关规定约束、不受政府隐私法规的保护,类似基因信息等一些数据也很难做到合适的去识别化。所以,医疗健康大数据的隐私保护还有赖于在去识别化和加强隐私保护之间寻找到最佳平衡。
3.4积极采用现代信息技术记录病案材料
为了形成对疾病或患者群的整体观,连续收集同一数据(纵向数据)和结合多种类型的数据(如不同患者的医保数据、社会人口学资料、EMRs等)都是非常必要的。而数据的广泛存在性使得数据越来越多地以不同的形式,散布于不同的系统和平台中。医疗大数据除了大数据所具有的“4V”特征外,还具有多态性、不完整性、时间性及冗余性等特征[14]。为了便于进行数据分析,需要解决数据的异构性及数据的质量问题,各方面产生的大数据有待进行有效的整合。因此,要积极采用现代信息技术,如电子扫描、微缩摄影、OCR文字识别、HDFS、大数据Web工具、云计算、Docker技术等,来记录、统计病案材料。
3.5调整优化病案管理人员
面对医疗健康大数据的挑战,要摒弃传统,以大数据统计为基准调整优化病案管理团队,应将统计学、档案学背景人员占比调整到50%左右,并且需经过相关专业培训考核;另外聘任30%计算机、互联网等有关专业人员,解决日常统计相关问题,配合医疗机构、卫生行政部门进行数据管理;其次可以有20%左右的临床、护理相关专业人员。科室内部实行轮转制度,使工作人员熟悉所有岗位流程,了解数据走向,从源头提高数据质量。
* 稍后学术顾问联系您