首页
资源下载
云计算
人工智能
信息化管理
前端
区块链
后端
大数据
存储
安全技术
开发技术
操作系统
数据库
服务器应用
游戏开发
物联网
硬件开发
移动开发
网络技术
考试认证
行业
行业研究
课程资源
跨平台
音视频
登录
注册
当前位置:
主页
>
资源下载
>
43
> *中文文本(已进行分词处理)
*中文文本(已进行分词处理)
更新:
2024-05-19 09:13:08
大小:
300B
推荐:
★★★★★
来源:
网友上传分享
类别:
机器学习 - 人工智能
格式:
TXT
反馈 / 投诉
文件下载
资源介绍
自己用来训练word2vec的,已提取文本,做了分词处理,过滤了大部分的特殊字符。 共包含3273626个段落的文本(一个段落包含了多个语句)。 处理后的语料有1.1G,由于文件较大,提供百度网盘下载地址。
上一篇:
windows全局文件搜索工具
下一篇:
基于实例和特征的迁移学习算法研究
相关推荐
12-02
WTL 9.1 5270 ReadMe 中文版已进行汉化处理,并提供了中英文对照,版本号为01d
12-02
对中文文本进行预处理;应用k-means聚类算法
12-02
对三国演义和红楼梦进行中文分词处理,统计各个人物的出场频次,并据此生成词云图
12-02
中文分词字典已进行全面更新,共收录了242764个词语
12-02
中文分词在纯文本词典和文本词典中对分词文本进行处理
12-02
APK Multi-Tool V1.0.10 已进行繁体中文汉化处理
12-02
*中文文本(已进行分词处理)