-
PyTorch实现的基于卷积神经网络的文本到语音合成模型:deepvoice3_pytorch
资源介绍
Deepvoice3_pytorch
基于卷积网络的文本到语音合成模型的PyTorch实现:
:深度语音3:通过卷积序列学习将文本转换为语音。
:基于深度卷积网络并具有指导性注意力的高效可训练的文本语音转换系统。
音频示例可从。
民间
:具有WORLD声码器支持的DeepVoice3。
在线TTS演示
可以在上执行的笔记本可用:
强调
卷积序列到序列模型,用于文本到语音合成
DeepVoice3的多扬声器和单扬声器版本
音频样本和预训练模型
用于 , 和数据集以及兼容的自定义数据集(JSON格式)
取决于语言的英语和日语前端文本处理器
样品
预训练模型
注意:预训练的模型与母版不兼容。 即将更新。
网址
模型
数据
超参数
Git提交
脚步
深度语音3
LJSpeech
64万
Nyanko
LJSpeech
builder=nyanko,preset=nyanko_ljspeech
585k
多扬声器DeepVoice3
VCTK
builder=deepvoice3_multispeaker,preset=deepvoice3_vctk
300k