登录 注册
当前位置:主页 > 资源下载 > 10 > audio_segmentation MATLAB代码实现-vad函数在audio_segmentation项目中的应用

audio_segmentation MATLAB代码实现-vad函数在audio_segmentation项目中的应用

  • 更新:2024-11-03 14:20:50
  • 大小:768KB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:Matlab - 大数据
  • 格式:ZIP

资源介绍

vad函数matlab代码audio_segmentation 此存储库中有三种不同的细分方法。 Microsoft Azure细分 Microsoft Azure分段使用Microsoft Azure转录过程的输出,其中包括每个转录文本字符串的“偏移”和“持续时间”。 这用于生成段.wav文件和单词计时.npy文件。 注意:此分段将导致较短的段紧紧的单词边界。 不会有只有非语言表达(例如笑声或叹气)的片段。 组合式广告 ComboSAD算法。 原始代码:/nfs/turbo/McInnisLab/gideonjn/SegmentationScript/extractComboSAD.py John Gideon Paper :(纸张中列出的设置最小为700 ms静音) John Gideon :(电子邮件2021-01-22)我最终使用带注释的评估调用子集验证了ComboSAD算法。 #更新/问题: 转换为python3(将LPC函数更新为librosa) 添加了输入检查 分割沉默而不是语音有时会引起问题*** LPC函数抛出“数值错误,输入病态?” 对于一些音频 最大语音输入参数用