资源介绍
word2vec训练维基中文语料的三个文件,process.py为处理维基中文保存为wiki.zh.text,然后用opencc把繁体化为简体中文wiki.zh.text.jian.txt,然后用fenci_model.py进行分词生成wiki.zh.seg.text.jian.txt,最后用train_word2vec_model.py进行训练
- 上一篇: word2vec中的数学原理详解
- 下一篇: github 客户端