-
使用平行语料库进行词对齐以实现机器翻译的WordAlignment
资源介绍
机器翻译词对齐的 Python 实现。 以 'python .py > ' 运行选项:-n num_lines 从输入文件中获取更少的行 -d 获取非默认文件,例如:sample
ibm1.py:实施 IBM 模型 1 ibm2.py:实施 IBM 模型 2 hmm.py:实施 HMM 模型进行字对齐 fastAlign.py:实施快速对齐方法,但使用固定的 lambda 参数 alignIntersect.py:使用基于交集的对齐方式Dice 的系数 modelAgreement.py:为 IBM Model2 实现基于交集的对齐
带有 .a 扩展名的相应名称的文件是从这些模型中获得的前 1000 个句子的对齐,这些模型在英语和法语的完整 hansards 数据上进行训练。 它们可以与分数对齐一起运行以进行 AER 评估。
t_
- 上一篇: 平行语料,用于机器翻译等的预处理语料
- 下一篇:没有了