登录 注册
当前位置:主页 > 资源下载 > 32 > 复旦大学中文文本分类语料集(包含训练集和测试集)

复旦大学中文文本分类语料集(包含训练集和测试集)

  • 更新:2024-07-01 08:53:14
  • 大小:12.06MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:算法与数据结构 - 大数据
  • 格式:ZIP

资源介绍

中文文本分类语料(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大,下载时请耐心等待。