-
蒙古语语音识别采用PyTorch技术实现
资源介绍
使用蒙古专有数据集(WER 8%)进行培训的在线演示: : 。
在此仓库中,实现了以下论文:
语音识别作为光学字符识别
此仓库部分基于:
来自解码器
Jasper / QuartzNet模块
训练
使用conda安装PyTorch> = 1.3
安装剩余的依赖项: pip install -r requirements.txt
下载蒙古圣经数据集: cd datasets && python dl_mbspeech.py
预先计算Mel频谱图: python preprop_dataset.py --dataset mbspeech
火车: python train.py --model crnn --max-epochs 50 --dataset mbspeech --lr-warmup-steps 100 TensorBoard的日志保存在文件夹logdir
结果
在训