-
NeuralMT:基于深度学习技术的梵文机器翻译系统
资源介绍
神经MT
梵语机器翻译
梵文的语法非常独特,甚至可以用巴克(Naus)形式(BNF)来表达。
MT的最新进展是使用了Seq2Seq模型进行翻译,该模型由Cho, K., Van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., & Bengio, Y. (2014).
该项目旨在为梵文创建这样的模型,并添加包含梵文语法的元素。
使用的数据集
需要梵语-英语平行语料库。 找到2个不同的语料库
一个是圣经的梵文翻译,可在获得。
其次是Valmiki Ramayana的英文翻译,为
两者都已预处理成句子列表形式,可以在Data找到
资料夹结构
主要代码可以在Code/keras_end_to_end.py找到
Data/使用了不同的数据集
地位
工作仍在进行中。 将随着任何进展而更新