-
利用同义词林扩展版进行词语相似度计算的深入分析
资源介绍
本例是基于《哈工大信息检索研究中心同义词词林扩展版》做的,其中详细分析了将源文件差拆分成五层结构,并对同义词计算,进行了跟踪分析。
其中根目录下的Synonymy是项目文件|||Synonymy/text-file中的origin.txt其实就是根目录下的:xx词林扩展版.txt |||SliceArrangement.java 是我自己手写的拆分方法,但是比较慢。期待改良。||| CiLin.java ||| 来源于网上的计算方法(具体参照了田久乐先生的论文中所提出的计算方法,详情请参照:基于同义词词林的词语相似度计算方法.pdf)||| AboutCiLin.java ||| 剖析了词林的利弊。