登录 注册
当前位置:主页 > 资源下载 > 49 > 中文分词训练语料用于中文自然语言处理

中文分词训练语料用于中文自然语言处理

  • 更新:2024-05-24 09:34:56
  • 大小:108.12MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:机器学习 - 人工智能
  • 格式:ZIP

资源介绍

本次提供的中文汉语语料syj_trainCorpus_utf8.txt全网免费,转载需要注明出处,语料是作者通过爬取的短文本和网络上的预料处理、合并生成的。整个语料大小264M,包含1116903条数据,数据用空格隔开,可以用来训练分词模型。