kapre- Keras音频预处理python库

kapre是Keras音频预处理器,用于在GPU上实时计算STFT,ISTFT,Melspectrogram。

在Python 3.6和3.7上通过测试。

为什么选择Kapre?

与预计算

  • 您可以优化DSP参数

  • 您的模型部署变得更加简单和一致。

  • 您的代码和模型具有更少的依赖性

与您自己的实现

  • 快捷方便!

  • 与1D / 2D张量流批处理形状一致

  • 数据格式不可知(channels_first和channels_last)

  • 更少的错误倾向-Kapre层针对Librosa(stft,decibel等)进行了测试-(请相信我)这比您想象的要棘手。

  • Kapre层具有一些默认tf.signals实现的扩展API,例如:

一个完全可逆的STFT和InverseSTFT对

梅尔频谱图具有更多选择

  • 可再现性-Kapre可在带有版本控制的pip上使用

Kapre的工作流程

  • 预处理音频数据集。以正确的采样率重新采样音频并存储音频信号(波形)

  • 在您的ML模型中,添加Kapre层,例如kapre.time_frequency.STFT()作为模型的第一层。

  • 数据加载器只需加载音频信号并将其输入模型

  • 在您的超参数搜索中,包括DSP参数n_fft以提高性能

  • 部署最终模型时,您只需要记住信号的采样率即可。没有依赖关系或预处理!

安装

pip install kapre 或者下载我们备份的kapre库文件包

API文档

请参阅 kapre.readthedocs.io上的Kapre API文档。

示例

(0)

相关推荐