登录 注册
当前位置:主页 > 资源下载 > 9 > TED Parallel Corpus 数据集

TED Parallel Corpus 数据集

  • 更新:2024-12-13 23:23:08
  • 大小:365.48MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:数据集 - 行业研究
  • 格式:ZIP

资源介绍

TED平行语料库是多语言平行语料库,包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。 多语言的平行语料库包括 12 种语言超过1.2亿 个对齐句子并进行了句子对齐。 所有的预处理都是自动完成。