登录 注册
当前位置:主页 > 资源下载 > 43 > *中文文本(已进行分词处理)

*中文文本(已进行分词处理)

  • 更新:2024-05-19 09:13:08
  • 大小:300B
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:机器学习 - 人工智能
  • 格式:TXT

资源介绍

自己用来训练word2vec的,已提取文本,做了分词处理,过滤了大部分的特殊字符。 共包含3273626个段落的文本(一个段落包含了多个语句)。 处理后的语料有1.1G,由于文件较大,提供百度网盘下载地址。