-
用户能够通过Web浏览器利用Mozilla的Deep Speech模型,这是由DeepSpeech-API代码实现的
资源介绍
DeepSpeech-API
项目是一个开放源代码的语音转文本引擎,它使用了经过机器学习技术训练的模型,该模型基于。 DeepSpeech项目使用Google的项目来简化实施过程。
该项目是使用户能够在Web浏览器*问DeepSpeech。 您可以在任何平台(Windows / IOS / Linux)上快速安装依赖项,并开始通过Web(计算机/移动设备)使用它。
安装DeepSpeech Python绑定
$ pip3 install deepspeech
获得预训练的模型
如果您想使用预先训练的英语模型来执行语音转文本,则可以从下载它(以及其他重要的推理材料)。 或者,您可以运行以下命令来下载文件并将其解压缩到当前目录中:
wget -O - https://github.com/mozilla/DeepSpeech/releases/download/v0.3.0/deep