登录 注册
当前位置:主页 > 资源下载 > 48 > PyTorch实现的基于卷积神经网络的文本到语音合成模型:deepvoice3_pytorch

PyTorch实现的基于卷积神经网络的文本到语音合成模型:deepvoice3_pytorch

  • 更新:2024-07-30 09:50:14
  • 大小:6.72MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:数据集 - 行业研究
  • 格式:ZIP

资源介绍

Deepvoice3_pytorch 基于卷积网络的文本到语音合成模型的PyTorch实现: :深度语音3:通过卷积序列学习将文本转换为语音。 :基于深度卷积网络并具有指导性注意力的高效可训练的文本语音转换系统。 音频示例可从。 民间 :具有WORLD声码器支持的DeepVoice3。 在线TTS演示 可以在上执行的笔记本可用: 强调 卷积序列到序列模型,用于文本到语音合成 DeepVoice3的多扬声器和单扬声器版本 音频样本和预训练模型 用于 , 和数据集以及兼容的自定义数据集(JSON格式) 取决于语言的英语和日语前端文本处理器 样品 预训练模型 注意:预训练的模型与母版不兼容。 即将更新。 网址 模型 数据 超参数 Git提交 脚步 深度语音3 LJSpeech 64万 Nyanko LJSpeech builder=nyanko,preset=nyanko_ljspeech 585k 多扬声器DeepVoice3 VCTK builder=deepvoice3_multispeaker,preset=deepvoice3_vctk 300k