-
Python库py-webrtcvad提供了WebRTC语音活动检测器的接口
资源介绍
py-webrtcvad
这是WebRTC语音活动检测器(VAD)的python接口。 它与Python 2和Python 3兼容。
将一段音频数据分类为有声还是无声。 它对于电话和语音识别很有用。
据报道,谷歌为项目开发的VAD是速度,最现代且免费的最佳版本之一。
如何使用它
安装webrtcvad模块:
pip install webrtcvad
创建一个Vad对象:
import webrtcvad
vad = webrtcvad.Vad()
(可选)设置其攻击性模式,该模式是0到3之间的整数。0是过滤掉非语音的攻击性最低的,3是攻击性最强的。 (您还可以在创建VAD时设置模式,例如vad = webrtcvad.Vad(3) ):
vad.set_mode(1)
给它一小段音频(“帧”)。 WebRTC VAD仅接受16位单声道PCM音频,采样频率为8000、16000
- 上一篇: python处理声音示例程序
- 下一篇: OGG官方文档