-
audio_segmentation MATLAB代码实现-vad函数在audio_segmentation项目中的应用
资源介绍
vad函数matlab代码audio_segmentation
此存储库中有三种不同的细分方法。
Microsoft
Azure细分
Microsoft
Azure分段使用Microsoft
Azure转录过程的输出,其中包括每个转录文本字符串的“偏移”和“持续时间”。
这用于生成段.wav文件和单词计时.npy文件。
注意:此分段将导致较短的段紧紧的单词边界。
不会有只有非语言表达(例如笑声或叹气)的片段。
组合式广告
ComboSAD算法。
原始代码:/nfs/turbo/McInnisLab/gideonjn/SegmentationScript/extractComboSAD.py
John
Gideon
Paper
:(纸张中列出的设置最小为700
ms静音)
John
Gideon
:(电子邮件2021-01-22)我最终使用带注释的评估调用子集验证了ComboSAD算法。
#更新/问题:
转换为python3(将LPC函数更新为librosa)
添加了输入检查
分割沉默而不是语音有时会引起问题***
LPC函数抛出“数值错误,输入病态?”
对于一些音频
最大语音输入参数用