-
GStreamer语音识别插件gst-deepspeech,基于Mozilla DeepSpeech模型构建
资源介绍
GStreamer DeepSpeech插件
是创建的语音识别项目。
该项目提供了一个GStreamer元素,可以将其放置到音频管道中,然后它将通过总线消息报告任何已识别的语音。 它根据可配置的静音阈值自动分割音频,使其适合连续听写。
这是使用gst-launch的几个示例管道。
要对文件执行语音识别,请将所有总线消息打印到终端:
gst-launch-1.0 -m filesrc location=/path/to/file.ogg ! decodebin ! audioconvert ! audiorate ! audioresample ! deepspeech ! fakesink
要对默认系统麦克风录制的音频执行语音识别,并更改静音阈值,请执行以下操作:
gst-launch-1.0 -m pulsesrc ! audioconvert ! audiorate ! a