pyAudioAnalysis-用于音频特征提取，分类，分段和应用的python库

2022-03-14 07:30:15

pyAudioAnalysis是一个开放的Python库，提供了许多与音频相关的功能，着重于特征提取，分类，分段和可视化问题。

功能

pyAudioAnalysis是一个Python库，涵盖了广泛的音频分析任务。

通过pyAudioAnalysis您可以：

提取音频特征和表示形式（例如，mfccs, spectrogram, chromagram）
训练，参数调整和评估音频片段的分类器
分类未知声音
检测音频事件并从长时间录音中排除静音期
执行监督性细分（联合细分-分类）
执行无监督的分段（例如，说话者二值化）并提取音频缩略图
训练和使用音频回归模型（示例应用程序：情感识别）
应用降维以可视化音频数据和内容相似性

实用功能

将Mp3批量转换为Wav
函数使用提供的采样率（第二个参数）和通道数（第三个参数）convertDirMP3ToWav(dirName, Fs, nC, useMp3TagsAsName = False) 将文件夹的所有MP3文件转换dirName为WAV文件。如果将最后一个参数（useMp3TagsAsName）设置为True，则输出的WAV文件将通过MP3标签（歌手和歌曲名）命名，否则将使用MP3文件名（当然，扩展名为.wav）

命令行使用示例
python audioAnalysis.py dirMp3toWav -i MusicData/ -r 16000 -c 1

另外，convertFsDirWavToWav()可以使用函数将存储在特定文件夹中的WAV列表转换为另一个采样率的相同信号的新列表（再次是WAV文件）。交流示例：

python audioAnalysis.py dirWavResample -i MusicData/ -r 8000 -c 1

新文件存储在名为Fs_Nc的新文件夹下，例如Fs8000_NC1
pyAudioAnalysis - Theodoros Giannakopoulos

下载安装

下载文件包： pyAudioAnalysis模块下载
安装依赖：pip install -r ./requirements.txt
使用pip安装： pip install -e

音频分类示例

pyAudioAnalysis提供了易于调用的包装器来执行音频分析任务。例如，给定存储在文件夹（每个文件夹代表一个不同的类别）中的一组WAV文件，此代码首先训练一个音频片段分类器，然后使用经过训练的分类器对未知的音频WAV文件进行分类：

aT.extract_features_and_train(["classifierData/music","classifierData/speech"], 1.0, 1.0, aT.shortTermWindow, aT.shortTermStep, "svm", "svmSMtemp", False)aT.file_classification("data/doremi.wav", "svmSMtemp","svm")```

码农公寓

功能

实用功能

下载安装

音频分类示例

相关文章