pyAudioAnalysis-用于音频特征提取,分类,分段和应用的python库
pyAudioAnalysis是一个开放的Python库,提供了许多与音频相关的功能,着重于特征提取,分类,分段和可视化问题。
功能
pyAudioAnalysis是一个Python库,涵盖了广泛的音频分析任务。
通过pyAudioAnalysis您可以:
提取音频特征和表示形式(例如,mfccs, spectrogram, chromagram)
训练,参数调整和评估音频片段的分类器
分类未知声音
检测音频事件并从长时间录音中排除静音期
执行监督性细分(联合细分-分类)
执行无监督的分段(例如,说话者二值化)并提取音频缩略图
训练和使用音频回归模型(示例应用程序:情感识别)
应用降维以可视化音频数据和内容相似性
实用功能
将Mp3批量转换为Wav
函数使用提供的采样率(第二个参数)和通道数(第三个参数)convertDirMP3ToWav(dirName, Fs, nC, useMp3TagsAsName = False) 将文件夹的所有MP3文件转换dirName为WAV文件。如果将最后一个参数(useMp3TagsAsName)设置为True,则输出的WAV文件将通过MP3标签(歌手和歌曲名)命名,否则将使用MP3文件名(当然,扩展名为.wav)
命令行使用示例
python audioAnalysis.py dirMp3toWav -i MusicData/ -r 16000 -c 1
另外,convertFsDirWavToWav()可以使用函数将存储在特定文件夹中的WAV列表转换为另一个采样率的相同信号的新列表(再次是WAV文件)。交流示例:
python audioAnalysis.py dirWavResample -i MusicData/ -r 8000 -c 1
新文件存储在名为Fs_Nc的新文件夹下,例如Fs8000_NC1
pyAudioAnalysis - Theodoros Giannakopoulos
下载安装
下载文件包: pyAudioAnalysis模块下载
安装依赖:pip install -r ./requirements.txt
使用pip安装: pip install -e
音频分类示例
pyAudioAnalysis提供了易于调用的包装器来执行音频分析任务。例如,给定存储在文件夹(每个文件夹代表一个不同的类别)中的一组WAV文件,此代码首先训练一个音频片段分类器,然后使用经过训练的分类器对未知的音频WAV文件进行分类:
from pyAudioAnalysis import audioTrainTest as aTaT.extract_features_and_train(["classifierData/music","classifierData/speech"], 1.0, 1.0, aT.shortTermWindow, aT.shortTermStep, "svm", "svmSMtemp", False)aT.file_classification("data/doremi.wav", "svmSMtemp","svm")