登录 注册
当前位置:主页 > 资源下载 > 26 > UTF-8编码的酒店评论语料,共10000条

UTF-8编码的酒店评论语料,共10000条

  • 更新:2024-07-27 20:33:44
  • 大小:9.89MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:讲义 - 课程资源
  • 格式:ZIP

资源介绍

现在网上大部分谭松波老师的评论语料资源的编码方式都是gb2312,本资源除了原始编码格式,还具有UTF-8编码格式。 本资源还包含将所有语料分成pos.txt和neg.txt两个文件,每个文件中的一行代表原始数据的一个txt文件,即一篇评论