-
测试数据涵盖了11款开放的中文分词引擎
资源介绍
11款开放中文分词引擎测试数据
benchmark 人工标注“标准答案”
origin 标注原始数据
news 新闻数据
weibo 微博数据
auto_comments 汽车论坛数据
food_comments 餐饮点评数据
itp_cloud 语言云
jieba 结巴分词
pangu 盘古分词
paoding 庖丁解牛分词器
qcloud 腾讯文智
sina 新浪云
sogou 搜狗分词
- 上一篇: pima印第安人糖尿病数据集
- 下一篇: 基于VSM的中文文本分类系统的设计与实现