-
斯洛伐克语词的向量表示由 word2vec-sk 提供,其经过了 word2vec 的训练过程
资源介绍
word2vec 的斯洛伐克语语义向量
版权
版权所有 (c) 2015 基本数据,sro
这项工作可以在 Apache 许可证下使用,版本 2.0,2004 年 1 月
许可证文件中的更多信息。
你对语言工作感兴趣吗? 为我们工作!
Essential Data 适用于语言、数据和有趣的项目。 看看并在一个由技术人员组成的优秀团队中工作。
关于项目
该项目旨在与一起使用。 它包含从语言语料库生成的语义向量,其中包含大约 1.1 亿个单词。 用于生成它们的工具发布在。 但是,此工具不包含所有源数据,因为我们无权发布它。 如果您无法访问足够大的数据语料库,我们建议您使用这些经过训练的向量并且不要再次生成它们,因为纯粹来自斯洛伐克*的向量的质量不如从更大的语料库中训练的数据好。
使用了两种支持的算法(连续词袋,skip-gram)。 找到字符串“引理”的词典在语料库上进行训练,该语
- 上一篇: Titanic数据集.zip
- 下一篇: Titanic生存预测数据集.rar