首页
资源下载
云计算
人工智能
信息化管理
前端
区块链
后端
大数据
存储
安全技术
开发技术
操作系统
数据库
服务器应用
游戏开发
物联网
硬件开发
移动开发
网络技术
考试认证
行业
行业研究
课程资源
跨平台
音视频
登录
注册
当前位置:
主页
>
资源下载
>
49
> 中文分词训练语料用于中文自然语言处理
中文分词训练语料用于中文自然语言处理
更新:
2024-05-24 09:34:56
大小:
108.12MB
推荐:
★★★★★
来源:
网友上传分享
类别:
机器学习 - 人工智能
格式:
ZIP
反馈 / 投诉
文件下载
资源介绍
本次提供的中文汉语语料syj_trainCorpus_utf8.txt全网免费,转载需要注明出处,语料是作者通过爬取的短文本和网络上的预料处理、合并生成的。整个语料大小264M,包含1116903条数据,数据用空格隔开,可以用来训练分词模型。
上一篇:
Android代码-Java 实现的自然语言处理中文分词
下一篇:
命名实体识别标记语料
相关推荐
12-02
基础的中文自然语言处理依赖于中文分词词典
12-02
复旦大学自然语言处理训练集(中文语料)
12-02
LargeScaleChineseCorpusforNLP是Python支持的大规模中文自然语言处理语料库
12-02
微博平台上的自然语言处理中文预训练模型
12-02
中文预训练模型在自然语言处理领域的知乎应用
12-02
标注了1-5分的中文酒店情感分析语料,包含12000条训练数据和4000条测试数据,采用非utf-8编码格式,适用于多分类任务
12-02
可用于词向量训练的中文*语料
12-02
Java实现的Android代码-自然语言处理中文分词
12-02
中文自然语言处理的Python语料库数据集
12-02
中文自然语言处理所需的文本分类语料