登录 注册
当前位置:主页 > 资源下载 > 9 > 多语言平行语料库及配套文本预处理工具:Multilingual-Parallel-Corpus

多语言平行语料库及配套文本预处理工具:Multilingual-Parallel-Corpus

  • 更新:2024-12-13 23:26:50
  • 大小:885.24MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:其它 - 开发技术
  • 格式:ZIP

资源介绍

对于数据科学家、开发人员及其可能关注的人: 部分文本材料受版权保护,请查看链接到来源的多语言来源部分,请务必遵守作者的限制和限制。 除此之外,repo 是在 CC0(公共领域)许可下的,还请查看。 对于版权所有者: 这里的文本材料用于研究,如果对在此 repo 上放置文本材料有任何,请通过电子邮件与我们联系: , 。 工具: 这是。 : : 当前的多语言语料库: 阿布哈兹俄语平行语料库(约 121k 行)。 材料参考: 每个语言对文件夹都有一个references.md 更多资源 https://github.com/christos-c/bible-corpus 回顾过去的工作和未来的挑战https://arxiv.org/pdf/2006.07264.pdf 开放翻译服务的工具和资源: https : //github.com/Helsinki-NLP/Opus-