-
Automatic-Speech-Sequence-Segmentation的Matlab代码实现,具有细节增强功能:自动语音序列分割
资源介绍
细节增强的matlab代码自动语音序列分割
该项目的主要目的是在事先不知道说话者人数的情况下,根据说话者对音频样本进行细分和聚类。
说话人识别过程中的主要挑战是分割基于说话人的音频,通过将音频流组织为说话人转弯,以及与说话人识别系统一起使用时,可以提供说话人的真实身份,从而增强自动语音转录的可读性。其他挑战是由于瞬间有多个发言人在场
有关项目访问的更多详细信息
在执行代码之前,请确保输入“
wav”和代码位于同一文件夹中
执行代码;
导航到在Matlab中打开abcd.m的代码文件夹。。替换[data,fs]
=
audioread('merge.wav');
merge.wav与您输入的wav文件。
您可以在第2行中确定扬声器数量,或者可以计算最合适的扬声器数量,执行kmean_un。
- 上一篇: 应用预测模型+R语言
- 下一篇: 短期负荷预测中实时气象因素的影响分析及其处理策略.pdf