-
神经网络文本分类数据集:IMDB影评文本
资源介绍
aclIMDB_v1:大型电影评论数据集(来自斯坦福大学),其中包含50,000个电影评论(50%为负,50%为正)。该集合被划分为训练和验证数据集(每个数据集有25000个电影评论,具有相同数量的正面和负面评论),还包括了5000条未标注的影评。其中有已处理好的单词包
rt-polaritydata:也是IDMB整理的数据集,较上一个数据集小,且已经大致地处理过了,标点符号分隔开,全部小写化。包含10,662个电影评论(半正,半负)。此文件中的每一行都是一则短短的电影评论。
- 上一篇: 自然语言处理.zip
- 下一篇: 深度学习v2-pytorch