deep-listening, 音频分类的深度学习实验

分享于 

3分钟阅读

GitHub

  繁體
Deep Learning experiments for audio classification
  • 源代码名称:deep-listening
  • 源代码网址:http://www.github.com/jaron/deep-listening
  • deep-listening源代码文档
  • deep-listening源代码下载
  • Git URL:
    git://www.github.com/jaron/deep-listening.git
    Git Clone代码到本地:
    git clone http://www.github.com/jaron/deep-listening
    Subversion代码到本地:
    $ svn co --depth empty http://www.github.com/jaron/deep-listening
    Checked out revision 1.
    $ cd repo
    $ svn up trunk
    
    deep-listening

    深度学习音频分类实验。

    完整的文章,包括技术说明和设计决策,以及成果总结,可以在项目报告中得到。

    这个项目由几个Jupyter notebook组成,它们实现了深度学习音频分类器。

    1 -us8k-ffn-extract-explore.ipynb
    • 包含从 UrbanSound8K 数据集中提取和可视化音频文件的代码
    • 特征提取过程使用来自 librosa 库的音频处理标准,将每个记录减少到 193个数据点。
    • 由于音频信息高度抽象,因此这些功能旨在馈入前馈神经网络(FFN)
    2 -us8k-ffn-train-predict.ipynb
    • 包含加载以前提取的特性,并将它的放入 3-layer FFN中的代码,使用 TensorflowKeras实现。
    • 还包括一些评估模型性能,并生成来自单个样本的预测,演示如何识别录音的代码。
    3 -us8k-cnn-extract-train.ipynb
    • 提取适合输入到经典 2层卷积神经网络( CNN )的音频特征
    • 在这种方法中,音频数据更多,因为保存的numpy特征数据超过了 2GB,所以你可以使用这里的代码从原始的 UrbanSound8K数据集中提取它
    4 -us8k-cnn-salamon.ipynb
    • 这个notebook实现了一个替代的CNN,类似于由 Salamon和 Bello 描述的。
    5 -ffbird-cnn.ipynb
    • notebook使用Salamon和 Bello CNN来处理 FreeField1010 数据集,目的是识别鸟和鸟鸣。
    • 数据集不是这个存储库的一部分,所以如果你想要运行这个代码,你需要自己下载数据。
    7 -us8k-rnn-extract-train.ipynb

    如果你有任何问题,请联系我(@ jaroncollis. com )


    EXP    learn  音频  DEEP  深度学习