-
UrIII时期苏美尔语文本信息提取的Sumerian-Translation-Pipeline,涵盖命名实体识别、部分语音标记及机器翻译功能
资源介绍
翻译整个Ur III语料库(GSoC-2020)
该项目旨在翻译和提供有关150万原始苏美尔文字的详细信息(POS标记,命名实体识别,英文翻译)。 该项目旨在建立一个完整的翻译管道,该管道将使用神经网络技术和基于规则的方法集成NER(命名实体识别),POS(语音标记)和URIII苏美尔语言的机器翻译。
可以从这里查看NER和POS的标签/符号(ORACC版本)-
要求-Python 3.5.2或更高版本-numPy -大熊猫-sklearn -nltk -sklearn_crfsuite -matplotlib -tqdm> = 4.46.1 -喀拉拉邦-张量流-CRF keras(pip3安装git + ) - 点击-OpenNMT-py(使用机器翻译模型)
学分:
开发人员
导师
用法
克隆回购 安装机器翻译模型的需求并下载权重使用ATF / txt输入文件运行pipel
- 上一篇: 微软亚洲研究院语料库
- 下一篇: 卷积神经网络结构原理详细介绍