-
基于条件随机场,为命名实体提取生成 Sumerian 源代码的工具是sumerian-crf
资源介绍
sumerian-crf
通过条件随机场为命名实体提取生成 Sumerian 源。
要使用,请在命令行运行make all 。 将根据需要下载、生成或重新生成以下文件:
cdli_atffull.atf : : //cdli.ucla.edu提供的 CDLI 源。
cdli_atffull_lemma.atf :已被词形还原的 CDLI 源部分提取到单个文件中。 这是进一步处理的中间步骤,但您可能会发现行间引理对您自己的目的很有用。
cdli_atffull_tagged.atf :一个文件,其中每个词形还原片的每个单词都在自己的行上呈现,以及在词形中标记的词性,由制表符分隔。 平板电脑上的行由特殊标记分隔以开始一行和 结束它; 平板电脑由空格分隔。 由于此文件可能相当大(在编写时超过 320MB)并且仅用于将完整语料库划分为训练集和测试集,因此在make过程结束时
- 上一篇: 半监督分类算法源程序
- 下一篇: 半监督LFDA算法MATLAN代码