-
Medline--code_v2: 这是sommatlab代码的第二个版本,即Medline--code_v2
资源介绍
som
matlab代码Medline--code_v2
该软件包提供了5个主要模块。
第1单元的知识库创建:
要创建知识库,请使用包MeSH_Vector作为主类的Driver.java在out目录中运行jar文件。
它接受两个参数:参数1:指向包含来自MEDLINE的XML转储的文件夹的路径参数2:将在其中生成所有KB文件的输出导向器。
该程序在每个主要步骤的末尾创建一个日志文件,使您可以从该位置重新启动该程序。
在具有3.6GHz频率的i5机器上,此步骤将花费近一天的时间来完成所有文件的创建。
必须先安装RedSvd-可以在这里找到安装说明:
该程序将完成运行GMM集群所需的所有准备文件,在提供给Driver.java的输出目录中,您将找到名为EmbeddingFiles的文件夹。
在gmm.m中将输入目录设置为指向该目录,将输出目录设置为名为“
cluster”的文件夹。
该MATLAB脚本将创建所需的集群。
按照与之前完全类似的过程,在post_cluster_oper下运行“
PostClusterDriver.java”。
该文件将为集群创建必要的正向和反向索引。
您将需