当前位置:主页 > 资源下载 > 50 > 通过单调对齐搜索实现文本到语音生成的glow-tts流

通过单调对齐搜索实现文本到语音生成的glow-tts流

更新：2024-10-20 12:40:07
大小：1.62MB
推荐：★★★★★
来源：网友上传分享
类别：其它 - 开发技术
格式：ZIP

反馈 / 投诉

资源介绍

Glow-TTS：通过单调对齐搜索生成文本到语音的生成流金在贤，金成元，江Jung和尹旭在我们最近的，我们提出了Glow-TTS：通过单调对齐搜索从文本到语音的生成流。最近，已经提出了文本到语音（TTS）模型，例如FastSpeech和ParaNet，用于从文本中并行生成梅尔频谱图。尽管具有优势，但是如果没有自回归TTS模型作为其外部调整器的指导，则无法训练并行TTS模型。在这项工作中，我们提出了Glow-TTS，这是一种基于流的并行TTS生成模型，不需要任何外部对准器。通过将流和动态编程的特性相结合，所提出的模型自行搜索文本和语音的潜在表示之间最可能的单调对齐方式。我们证明，强制执行硬单调对齐方式可以使鲁棒的TTS泛化为长话，而使用生成流则可以实现快速，多样化和可控制的语音合成。 Glow-TTS在合成时具有可比较的语音质量，比自回归模型Tacotron 2快了一个数量级

上一篇: 微软语音TTS文本到语音转换系统
下一篇: tts-api:用于多个TTS引擎的文本到语音REST API

相关推荐

12-02 通过单调对齐搜索实现文本到语音生成的glow-tts流

通过单调对齐搜索实现文本到语音生成的glow-tts流

资源介绍

热门标签

资源声明