-
多模式语音分离任务在LRS3数据集上的数据生成脚本:LRS3-For-Speech-Separation
资源介绍
生成数据的指令
以下是生成训练和测试数据的步骤。 有几个参数可以更改以匹配不同的目的。
我们将尽快在LRS3数据集上发布语音分离基准。
我们的脚本存储库是为了使多模式语音分离任务在数据集生成方面具有统一的标准。 这样我们就可以跟进多模式语音分离任务。
我们希望LRS3数据集将为诸如WSJ0数据集之类的纯语音分离任务制定统一的生成标准。
:check_box_with_check: 我们的基准模型即将推出!
信噪比
信噪比
基准线
15.08
15.34
要求
ffmpeg 4.2.1
袜14.4.2
numpy的1.17.2
OpenCVPython的4.1.2.30
librosa 0.7.0
dlib 19.19.0
face_recognition 1.3.0
第1步-获取原始数据
在这种方法中,我们使用“数据集作为我们的训练,验证和测试集。
Afouras T,Chung JS,Senior