登录 注册
当前位置:主页 > 资源下载 > 5 > 基于条件随机场,为命名实体提取生成 Sumerian 源代码的工具是sumerian-crf

基于条件随机场,为命名实体提取生成 Sumerian 源代码的工具是sumerian-crf

  • 更新:2024-09-15 13:51:50
  • 大小:18KB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:其它 - 开发技术
  • 格式:ZIP

资源介绍

sumerian-crf 通过条件随机场为命名实体提取生成 Sumerian 源。 要使用,请在命令行运行make all 。 将根据需要下载、生成或重新生成以下文件: cdli_atffull.atf : : //cdli.ucla.edu提供的 CDLI 源。 cdli_atffull_lemma.atf :已被词形还原的 CDLI 源部分提取到单个文件中。 这是进一步处理的中间步骤,但您可能会发现行间引理对您自己的目的很有用。 cdli_atffull_tagged.atf :一个文件,其中每个词形还原片的每个单词都在自己的行上呈现,以及在词形中标记的词性,由制表符分隔。 平板电脑上的行由特殊标记分隔以开始一行和结束它; 平板电脑由空格分隔。 由于此文件可能相当大(在编写时超过 320MB)并且仅用于将完整语料库划分为训练集和测试集,因此在make过程结束时