首页
资源下载
云计算
人工智能
信息化管理
前端
区块链
后端
大数据
存储
安全技术
开发技术
操作系统
数据库
服务器应用
游戏开发
物联网
硬件开发
移动开发
网络技术
考试认证
行业
行业研究
课程资源
跨平台
音视频
登录
注册
当前位置:
主页
>
资源下载
>
26
> UTF-8编码的酒店评论语料,共10000条
UTF-8编码的酒店评论语料,共10000条
更新:
2024-07-27 20:33:44
大小:
9.89MB
推荐:
★★★★★
来源:
网友上传分享
类别:
讲义 - 课程资源
格式:
ZIP
反馈 / 投诉
文件下载
资源介绍
现在网上大部分谭松波老师的评论语料资源的编码方式都是gb2312,本资源除了原始编码格式,还具有UTF-8编码格式。 本资源还包含将所有语料分成pos.txt和neg.txt两个文件,每个文件中的一行代表原始数据的一个txt文件,即一篇评论
上一篇:
Endnote使用指南
下一篇:
来自于NLPCC2013,解析成txt文件 不均衡分类 中文情感分析7类情感.zip
相关推荐
12-02
UTF-8编码的酒店评论语料,共10000条
12-02
酒店数据UTF-8编码的情感分析,已标注正负类,共10000条
12-02
谭松波的酒店评论语料包含utf-8和gb2312编码
12-02
标注了1-5分的中文酒店情感分析语料,包含12000条训练数据和4000条测试数据,采用非utf-8编码格式,适用于多分类任务
12-02
谭松波收集的酒店评论语料库,包含10000条UTF-8编码的数据