-
MATLAB代码实现从RAVDESS数据库中提取Speech-Emotion-Classification(SEC)的均值信号特征
资源介绍
提取均值信号特征的matlab代码#语音分析##要求
Python
3.6+
Python
包
librosa==0.8.0
optuna==2.7.0
numpy==1.19.5
pandas
soundfile==0.9.0
wave
sklearn
tqdm==4.28.1
matplotlib==2.2.3
pyaudio==0.2.11
通过以下命令安装这些库:
pip3
install
-r
requirements.txt
在colab中逐个单元地顺序运行所有代码
#抽象
该笔记本包含用于读取音频数据、特征提取、使用
Optuna
进行超参数调整的代码,以及包括
KNN、逻辑回归、装袋、多层感知器在内的模型。
Python
库
libROSA
提供了从该项目中使用的音频文件中处理和提取特征的主要工具。
从从音频文件中提取
MFCC、色度和
Mel
频谱图开始,建模是使用来自
Sci-kit
Learn
和其他
Python
包的现成模型完成的。
这些模型的超参数调整是使用
Optuna
框架完成的。
介绍
由于其主观性质,将音频分类为情感具有挑战性。
这项任务对人类来说可