kapre- Keras音频预处理python库
kapre是Keras音频预处理器,用于在GPU上实时计算STFT,ISTFT,Melspectrogram。
在Python 3.6和3.7上通过测试。
为什么选择Kapre?
与预计算
您可以优化DSP参数
您的模型部署变得更加简单和一致。
您的代码和模型具有更少的依赖性
与您自己的实现
快捷方便!
与1D / 2D张量流批处理形状一致
数据格式不可知(channels_first和channels_last)
更少的错误倾向-Kapre层针对Librosa(stft,decibel等)进行了测试-(请相信我)这比您想象的要棘手。
Kapre层具有一些默认tf.signals实现的扩展API,例如:
一个完全可逆的STFT和InverseSTFT对
梅尔频谱图具有更多选择
可再现性-Kapre可在带有版本控制的pip上使用
Kapre的工作流程
预处理音频数据集。以正确的采样率重新采样音频并存储音频信号(波形)
在您的ML模型中,添加Kapre层,例如kapre.time_frequency.STFT()作为模型的第一层。
数据加载器只需加载音频信号并将其输入模型
在您的超参数搜索中,包括DSP参数n_fft以提高性能
部署最终模型时,您只需要记住信号的采样率即可。没有依赖关系或预处理!
安装
pip install kapre 或者下载我们备份的kapre库文件包。
API文档
请参阅 kapre.readthedocs.io上的Kapre API文档。
示例
赞 (0)