摘要〕阐述中医诊断学辨证知识图谱构建方法和过程,包括知识梳理、知识图谱结构模型构建、命名实体获取、关系提取、图谱表示、可视化等方面,实现中医诊断学辨证知识地图Web服务,在利用知识图谱技术开展中医智能辅助辨证研究方面进行探索和初步实践。
〔关键词〕中医诊断学;辨证;知识图谱
1、引言
中医药是中华民族的瑰宝,中医认识和治疗疾病的基本原则是辨证论治,辨证知识是中医诊断学的重要内容。中医智能辅助辨证是在中医辨证论治规律的指导下建立辨证过程的智能辅助模型,通过人工智能程序对患者病情资料进行综合分析而得出辨证结果,辅助临床决策[1_3]。知识图谱是人工智能领域重要的支撑技术,可将其应用于中医智能辅助辨证研究,进行辨证知识表示与推理,以推动中医智能辅助辨证应用和发展。
2知识图谱与中医智能辅助辨证研究
2.1知识图谱内涵
知识图谱概念由谷歌公司于2012年正式提出,该公司为提高其搜索引擎查询返回结果质量,为用户提供更加便捷的搜索体验,建立基于知识图谱技术的新型搜索功能[4_5]。知识图谱最基本的组成要素是节点和边,节点代表现实世界中的实体或概念,边代表实体或概念之间的各种语义关系。知识图谱为知识关联、整合与分析提供理想的技术手段,其具有知识语义化、数据易关联、结构友好等优点,已发展成为人工智能领域的重要支撑技术,为智能辅助诊疗相关系统研发奠定技术基础。
2.2中医药领域应用
知识图谱有助于解决中医药学知识在表示、共享和应用等方面存在的问题,得到中医药科研工作者越来越多的关注。从本质上来看,中医药知识图谱是结构化的语义知识库,其以符号形式描述中医药领域中的实体或概念以及它们之间的相互关系,进而以图谱形式对该领域知识进行可视化表示,支持知识关联和扩充,为中医药教学、科研和辅助诊疗等工作提供可靠且高效的知识服务[6]。基于中医药知识图谱的中医智能辅助辨证相关系统可对患者四诊信息等资料进行智能分析,为医生提供智能辅助诊断支持,向医生推荐治疗方药。此外借助知识图谱的可视化功能,系统可以对辅助诊断和方药推荐的推理过程与结果给出直观解释,便于医生理解。
2.3相关研究
目前已有研究者开展中医药知识图谱相关研究工作,取得一些有意义的成果。但总体而言,中医药领域的知识图谱相关研究仍然较为滞后,需要进一步深入。例如在中医智能辅助诊疗领域,可研究开发基于知识图谱的四诊信息采集、诊断、处方用药系统,基于患者的四诊信息等病情资料,借助中医诊断知识图谱,综合运用多种中医辨证方法,进行智能化辨证论治,进而为医生提供诊疗决策支持[7_1°]。通过构建中医辨证知识图谱来开展中医智能辅助辨证研究尚未见报道,但这方面的研究很有意义,因此本文对中医诊断学辨证知识图谱构建进行积极探索。
3中医诊断学辨证知识图谱构建及应用
3.1知识梳理
以《中医诊断学》(全国中医药行业高等教育“十三五”规划教材)中的辨证知识为基础开展知识梳理工作,教材中将辨证方法分为3种:八纲、病性、病位辨证。其中八纲辨证又细分为表里、寒热、虚实、阴阳辨证4种方法;病性辨证又细分为六淫、阴阳虚损、气血、津液辨证4种方法,其中气血辨证包括气病、血病、气血同病辨证3类;病位辨证又细分为脏腑、六经、卫气营血、三焦辨证4种方法,其中脏腑辨证包括心与小肠病、肺与大肠病、脾与胃病、肝与胆病、肾与膀胱病、脏腑兼病辨证6类。根据教材中辨证知识内容,笔者设计中医诊断学辨证知识数据库,数据库包括3张数据表:辨证方法表、证的分类表和证表。
3.2知识图谱结构模型构建
本文以本体作为知识图谱表示的概念模型和逻辑基础,是一种结构化的数据存储结构。本体结构模型(Schema)构建就是对本体框架的搭建,Schema是对本体结构的一种定义。本体Schema构建可分为4部分:类别(Class)、类别层次、对象属性、语义关系的定义。本文构建的是一个中医诊断学辨证知识图谱,根据中医诊断学教材中的辨证知识,首先定义最基本的3个大类,即辨证方法、证的分类和证。接着定义属性:辨证方法类包括定义和英文名属性,证的分类类包括定义和英文名属性,证类包括别名、英文名、定义、证候表现、证候分析和辨证要点属性。由此构建的中医诊断学辨证知识图谱Schema,见图1。
3.3命名实体获取
依照本体Schema定义的基本元素来获取相应的辨证知识命名实体。在命名实体获取环节,本文依据的数据源以教材内容为主,将教材中辨证知识内容转化为表格数据,所获取的3类实体数据情况为:辨证方法类数据15条、证的分类数据9条、证类数据147条。
3.4关系提取
依照知识图谱Schema定义的概念属性、语义关系元素来获取相应的数据和相关实体的上下位关系。在关系获取环节,本文依据的数据源以教材内容为主。以证类中的一个实体—血脱证为例来说明实体属性的提取,提取出的属性有:(1)血脱证—定义—指突然大量出血或长期反复出血,致使血液亡脱,以面色苍白、心悸、脉微或芤为主要表现的证。(2)血脱证—别名—脱血证。(3)血脱证英文名syndromeofblooddepletion。(4)血脱证—证候表现—面色苍白,头晕,眼花,心悸,舌淡或枯白,脉微或芤与血虚症状共见。(4)血脱证—证候分析—大量失血以致血
液突然耗失,或因长期失血,诸如呕血、咯血、便血、崩漏、外伤失血等;或血虚进一步发展,导致血液亡脱。血液亡脱,脉络空虚,不能荣润舌、面,故面色苍白,舌淡或枯白;血液亡失,心脏、清窍失养,则见心悸,头晕,眼花等症,脉微或芤。血脱常伴随气脱、亡阳。(5)血脱证—辨证要点—有血液严重耗失的病史,面色苍白、心悸、脉微或芤等症状共见。此外本文在中医诊断学辨证知识图谱Schema中定义两种语义关系:HaS-FenLei和HasZheng,前者表7K包含分类关系,后者表示包含证关系。
3.5图谱表示
使用本体作为知识图谱的概念模型、承载知识图谱,采用网络本体语言(WebOntologyLanguage,OWL)作为描述语言,OWL格式本体文件则根据已建立的辨证知识Schema构建,使用本体编辑工具Pr〇t6g6将数据生成OWL格式,具体步骤包括:建立类、数据属性、对象属性、实体及定义关系。例如在Prot6g6中建立的部分实体,见图2,对实体“厥阴病证”在Pr〇t6g6中建立的实体关系限定,见图3〇
3.6可视化
在构建中医诊断学辨证知识图谱基础上,利用工具Prot6g6和Graphviz进行辨证知识可视化,清晰展示实体属性与关系。以证实体“厥阴病证”为例,Prot6g6中“厥阴病证”实体关系限定包含“厥阴病证”语义关系(ObjectProperty)与属性关系(DataProperty)。其中语义关系是针对“厥阴病证”与其他命名实体,利用Pr〇t6g6将其语义关系图形化显币。其中“厥阴病证”与"Syndrome”之间的实线加箭头表示“厥阴病证”的父类为"Syn?drome”,“厥阴病证”与“六经辨证”间的虚线加箭头表示其间存在语义关系,注释文本中展示“厥阴病证”的关系声明。借助Pr〇t6g6本体可视化功能可详细地呈现“厥阴病证”语义关系。
3.7中医诊断学辨证知识图谱应用
实现中医诊断学辨证知识地图Web服务,提供便捷的中医诊断学辨证知识浏览服务,主要功能包括:查看辨证知识结构、辨证方法信息、证的基本信息及关系图。
4结语
本文探讨了中医诊断学辨证知识图谱构建方法和过程,实现基于中医诊断学辨证知识图谱的辨证知识地图Web服务。在利用知识图谱技术开展中医智能辅助辨证研究方面做出积极探索和有意义的尝试,具有一定参考价值。——论文作者:周海彭斐灵韦昌法
相关期刊推荐:《现代诊断与治疗》为国家出版署批准国内外公开发行的综合性医学学术性双月刊,本刊以发挥其在植物生态学领域的导向性、权威性和科学性为指导思想,突出反映植物生态学科热点和生长点的研究成果。由中华医学会江西省南昌分会,南昌市医学科学研究所主办。有很强的实用性、先进性、科学性和可读性。辟有专家论坛、中外医学交流、现代临床医学在中国、华夏医学掠影、论著、诊疗新技术、综述、药物与临床、教学查房及基层医生进修园地等十余个栏目。
* 稍后学术顾问联系您