-
构建中文医疗领域知识图谱的产品描述-中兴netnumen u31 r10(v12.11.40)统一网元管理系统
资源介绍
6.1 工作总结
随着网络信息的爆炸式增长,以及人们对医疗健康问题的逐渐重视,如何从
海量的信息中针对用户的知识获取需求提供精准且高质量的知识,以及清晰的知
识网络展示,成为了研究者热衷的研究方向。知识图谱为解决这一问题提供了强
有力的支撑。本文针对用户这一需求,构建了医疗领域知识图谱,并提供相关的
知识搜索服务。
首先本文介绍了知识图谱的研究现状,并对知识图谱在垂直领域尤其是医疗
领域的发展着重叙述。然后,对知识图谱的相关技术进行了详细介绍,包括知识
图谱的架构、知识图谱的构建方法以及相关研究。其中,知识图谱的构建流程大
致可分为知识抽取、知识融合、知识加工三个步骤,其中重点介绍知识抽取环节
中命名实体识别和命名实体关系识别工作的相关方法和研究工作。此外,还对知
识图谱的存储技术以及检索技术进行了介绍。
然后,本文着重介绍了知识图谱的构建工作。本文在研究众多文献的基础上,
提出了基于双词向量改进的 D-BLSTM 模型,再考虑对特定领域,大量的标注语
料难以获取,因此提出整合半监督方法 Co-Training 方法的 CTD-BLSTM 算法模
型。然后以此进行实体识别和关系识别任务。再通过与其他模型对比,实验验证
该模型在序列标注问题上的有效性。本文介绍了中文医疗知识图谱构建的困难以
及数据源选取,然后针对医疗领域数据的特性,制定相应的策略和识别规则,完
成命名实体和实体关系的识别工作。最后,借助图数据库 neo4j 对抽取得到的实
体和关系进行存储,完成知识图谱的绘制。
最后,本文借助构建的中文医疗知识图谱,设计并实现了一个医疗知识搜索
系统。对于用户输入的自然语言形式的问句,针对用户不同的搜索意图,采用基
于知识图谱的知识搜索和面向社区问答的知识搜索方案,为用户提供更精准、更
直观的知识搜索结果。
本文的贡献在于:
(1)中文医疗领域知识图谱的构建
本文针对医疗领域数据的特性,制定了相关的实体类型和词性标注,在此基