-
产品描述:中兴NetNumen U31 R10(V12.11.40)统一网元管理系统的工作展望
资源介绍
(2)基于知识图谱的语义搜索
本文基于知识图谱,实现了针对自然语言查询语句的知识问答搜索。针对搜
索意图的不同,分别采用了基于知识图谱的知识搜索和面向社区问答的知识搜索
方案,为用户提供更好的搜索质量。
6.2 工作展望
本文还存在很多的不足有待突破和进一步研究。
本文采用 LSTM 神经网络为基础实现了对文本的序列标注工作,首先需要借
助标注语料训练模型,而中文医疗领域标注语料的稀缺成为知识图谱构建工作的
一个难点。因此,本文采用了半监督学习方法 Co-Training,该方法需要两套相
互独立的特征向量训练模型,而在实际的序列标注问题上,可选的特征模板是很
多的,因此进一步可以考虑测试不同特征模板的选择对模型效果的影响。
此外,本文在知识图谱的构建中,并未考虑多个不同数据源抽取实体后的实
体对齐。如何将多个数据源抽取出的同一个实体对齐也是知识图谱构建的一个重
要研究方向。
本文针对用户无结构化的自然语言查询,采用了预定义模板并结合语义抽取
方法生成查询语句。前者虽然匹配精度高,但是需要人工参与定义,代价大,后
者虽然代价小,可以处理任意类型的问句,但是精度和前者相比较低。用自然语
言查询语句和对应的结构化查询语句作为训练集训练模型,用于自动生成查询语
句,是一个可以深入研究的方向。