-
SincNet是一种神经网络架构,旨在高效处理原始音频样本
资源介绍
SincNet
SincNet是用于处理原始音频样本的神经体系结构。 这是一种新颖的卷积神经网络(CNN),它鼓励第一个卷积层发现更多有意义的滤波器。 SincNet基于参数化的Sinc函数,这些函数实现了带通滤波器。
与学习每个滤波器的所有元素的标准CNN相比,所提出的方法只能从数据中直接学习低和高截止频率。 这提供了一种非常紧凑而有效的方式来导出专门针对所需应用进行了调整的定制滤波器组。
该项目发布了一系列代码和实用程序,可通过SincNet进行说话人识别。 使用TIMIT数据库提供了说话人识别的示例。 如果您对应用于语音识别的SincNet感兴趣,可以查看PyTorch-Kaldi