首页
资源下载
云计算
人工智能
信息化管理
前端
区块链
后端
大数据
存储
安全技术
开发技术
操作系统
数据库
服务器应用
游戏开发
物联网
硬件开发
移动开发
网络技术
考试认证
行业
行业研究
课程资源
跨平台
音视频
登录
注册
当前位置:
主页
>
资源下载
>
32
> 复旦大学中文文本分类语料集(包含训练集和测试集)
复旦大学中文文本分类语料集(包含训练集和测试集)
更新:
2024-07-01 08:53:14
大小:
12.06MB
推荐:
★★★★★
来源:
网友上传分享
类别:
算法与数据结构 - 大数据
格式:
ZIP
反馈 / 投诉
文件下载
资源介绍
中文文本分类语料(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大,下载时请耐心等待。
上一篇:
Introduction to Linear Algebra 麻省理工线性代数答案
下一篇:
MIT计算机网络笔记
相关推荐
12-02
微软亚洲研究院的语料库包含1089050个字,分别用于训练集和测试集
12-02
复旦大学自然语言处理训练集(中文语料)
12-02
训练集用于中文文本分类
12-02
CUHK Occlusion Dataset数据集同时提供了yolo格式和VOC格式,且已包含预划分的训练集和测试集
12-02
matlab中包含的bp分类数据集包括训练数据和测试数据
12-02
复旦NLP文本分类语料库训练集
12-02
标注了1-5分的中文酒店情感分析语料,包含12000条训练数据和4000条测试数据,采用非utf-8编码格式,适用于多分类任务
12-02
libsvm分类所使用的训练和测试数据集
12-02
复旦中文文本分类-训练集.rar下载
12-02
复旦大学提供的中文文本分类数据集采用utf8编码格式