-
高质量Sinhala数据集sinhala-tts-dataset,旨在为文本到语音算法训练服务,特别适用于深度学习算法
资源介绍
路径涅rv僧伽罗TTS数据集
用于文本到语音算法训练的高质量Sinhala数据集-专为深度学习算法设计
当前,缺乏足够的僧伽罗语长度的sinhala语言公开可用的tts数据集。 该数据集包含3300个句子和7.5小时的录音,将有助于缓解其中的一些问题。 这些单次语音编码是在2021年第一季度完成的。已经进行了一些努力,以捕获僧伽罗语中大多数不常用的音节,尤其是那些梵语和梵语的音节。 可能存在一些错误(记录与提示不匹配)。 虽然应该很少见,但是如果您发现有一些可以随时为该存储库做出贡献的话。
如何使用
split-flac文件夹包含无损flac压缩格式的原始录音
最终文件夹包含wav格式的相同文件,而wav格式是机器学习算法中最常用的格式
file-mappings.json文件包含所有3300条记录的提示,记录的文件名和记录的长度
请参阅LICENSE.txt文件以获取许可证信息。 GPL