[TOC]
简单介绍
主要技术:GRU+TransR
在临床领域,疾病发病往往存在缓慢或快速的进化过程,这些临时的事实时间序列知识可以根据时间序列转换为时间序列知识图。
将文本数据和临床数据中最初存在的不可计算知识以知识图的形式表示,转化为可通过机器来理解和计算的时间序列数据,利用知识图和知识推理来更准确地揭示实体之间的关系。
主要内容:在临床领域进行知识排序、数据整理、建立时序知识图,提出基于GRU循环神经网络的学习模型,构建临床领域的时序知识图,实现临床领域的时序知识图的推理预测。
为了便于读者的理解,本文以肺栓塞为例,介绍了临床域时间序列知识图辅助诊断和预测模型的总体框架,并在此基础上给出了该模型的具体训练过程
临床领域的时间知识图由数据层、算法层和应用层组成,
其中数据层包含患者的个人信息、家族病史、就诊时间、主诉信息、检测指标、用药等信息,
在算法层,GRU辅助决策推理服务获取电子病历主诉、当前病史、既往史、个人史等信息,并通过电子病历结构分析,输入知识图进行实体匹配。
匹配后,在应用层通过图顺序推理引擎对根据病程长期发展的诊断和治疗路径进行分析和计算,推荐疑似诊断、鉴别诊断、检查项目、评价量表、治疗方案等知识,为医生服务。
模型训练过程
通过TransR 提交三元组Xn进行降维,然后将其向量化的处理结果作为输入。
本文利用TransR模型将医学临床时间序列知识图G中的三元组(Ei、R、Ej)嵌入到低维空间中。由于临床领域存在大量的语义多对多关系,如多个患者实体,多个不同的检测索引实体之间存在检查关系。患者实体定义为多个属性的复杂性,不同关系关注实体的不同属性,不同关系具有不同的语义空间,实体和关系在语义空间Ri中以向量表示,每个关系对应一个特定的关系空间Rj。
当TransR转换每个元组(h,r,t)时,首先用r将实体关系中的实体投影为投影矩阵Mr,然后将实体向量表示为实体投影关系r的子空间,得到hr和tr。
进入GRU层后,根据疾病随时间t−1到t的变化的进化顺序,利用GRU序列特征,计算出在(t + 1)时所需的检查项目或疾病判断,即辅助诊断推断。
我们使用肺栓塞的时间知识图三组序列X (i)作为输入,在辅助决策推理可以预测患者的物理过程后可能需要下一次实体检测项目Y,如超声心电图,Y为输出。具体流程详见表1。
在本文中,我们将TransR处理后的三元组输入GRU,它不仅保持了原始语义,而且还保持了输入数据的时序特性。因此,TransR后的三联体和GRU组合可以利用医学临床序列图序列中历史信息的叠加和增强,充分、准确地推断出序列之间的依赖关系。
对获得的数据使用模式进行手工标注,训练NLP信息提取模型,以构建临床知识图。NLP模型采用深度学习技术,将自由文本的EHR注释自动标注到标准化的字典和临床特征中,以便进一步处理临床信息进行诊断分类。