-
Kaldi和Tensorflow集成的vad函数Matlab代码,用于训练基于神经网络的说话者验证系统
资源介绍
vad函数matlab代码更新2020/4/14
我注意到VoxSRC
2020开始了。
该存储库可用作此挑战的基准。
就像我说的,使用ResNet-18
+
softmax可以得到1.8%的EER,这是一个很好的结果(使用〜5900个扬声器训练集并在vox1测试集上进行测试)。
只需使用AMSoftmax损失,尝试更深层次的网络,添加新的合并方法(例如自我注意)并实现高级结构(例如挤压和激励),我希望可以取得更好的结果。
享受培训:-)
更新2019/11/19
添加了多GPU培训。
可以在配置文件中指定GPU的数量。
有关更多详细信息,请参见示例,例如egs
/
voxceleb
/
v3
/
run.sh。
添加一个标准的VoxCeleb示例,该示例使用egs
/
voxceleb
/
v2(使用tdnn)和v3(使用resnet)中的官方培训列表(即VoxCeleb2开发集)。
添加一个简单的ResNet
+
softmax示例,使用官方培训列表,该示例在VoxCeleb1测试集中的EER达到1.8%。
由于我们使用数据并行性,因此每步数据和梯度都会在GPU之间分布。
当使用过
- 上一篇: 论文研究-融合小波变换与贝叶斯LSSVM的网络流量预测.pdf
- 下一篇: DNN实现的VAD