登录 注册
当前位置:主页 > 资源下载 > 50 > 多模式语音分离任务在LRS3数据集上的数据生成脚本:LRS3-For-Speech-Separation

多模式语音分离任务在LRS3数据集上的数据生成脚本:LRS3-For-Speech-Separation

  • 更新:2024-12-11 17:28:50
  • 大小:3.48MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:数据集 - 行业研究
  • 格式:ZIP

资源介绍

生成数据的指令 以下是生成训练和测试数据的步骤。 有几个参数可以更改以匹配不同的目的。 我们将尽快在LRS3数据集上发布语音分离基准。 我们的脚本存储库是为了使多模式语音分离任务在数据集生成方面具有统一的标准。 这样我们就可以跟进多模式语音分离任务。 我们希望LRS3数据集将为诸如WSJ0数据集之类的纯语音分离任务制定统一的生成标准。 :check_box_with_check: 我们的基准模型即将推出! 信噪比 信噪比 基准线 15.08 15.34 要求 ffmpeg 4.2.1 袜14.4.2 numpy的1.17.2 OpenCVPython的4.1.2.30 librosa 0.7.0 dlib 19.19.0 face_recognition 1.3.0 第1步-获取原始数据 在这种方法中,我们使用“数据集作为我们的训练,验证和测试集。 Afouras T,Chung JS,Senior