-
多语言平行语料库及配套文本预处理工具:Multilingual-Parallel-Corpus
资源介绍
对于数据科学家、开发人员及其可能关注的人:
部分文本材料受版权保护,请查看链接到来源的多语言来源部分,请务必遵守作者的限制和限制。 除此之外,repo 是在 CC0(公共领域)许可下的,还请查看。
对于版权所有者:
这里的文本材料用于研究,如果对在此 repo 上放置文本材料有任何,请通过电子邮件与我们联系: , 。
工具:
这是。 : :
当前的多语言语料库:
阿布哈兹俄语平行语料库(约 121k 行)。
材料参考:
每个语言对文件夹都有一个references.md
更多资源
https://github.com/christos-c/bible-corpus
回顾过去的工作和未来的挑战https://arxiv.org/pdf/2006.07264.pdf
开放翻译服务的工具和资源: https : //github.com/Helsinki-NLP/Opus-