eesen, Eesen项目的正式存储库

分享于 

2分钟阅读

GitHub

  繁體 雙語
End-to-End Speech Recognition using Deep RNNs (Models), CTC (Training) and WFSTs (Decoding)
  • 源代码名称:eesen
  • 源代码网址:http://www.github.com/srvk/eesen
  • eesen源代码文档
  • eesen源代码下载
  • Git URL:
    git://www.github.com/srvk/eesen.git
    Git Clone代码到本地:
    git clone http://www.github.com/srvk/eesen
    Subversion代码到本地:
    $ svn co --depth empty http://www.github.com/srvk/eesen
    Checked out revision 1.
    $ cd repo
    $ svn up trunk
    

    Eesen

    Eesen 简化现有复杂。专业的ASR管道,使它的成为一个简单的顺序学习问题。 声学建模涉及到训练单个递归神经网络,对从语音到文本的映射进行建模。 Eesen放弃现有ASR管道所需的下列元素:

    • 隐藏 马尔可夫 模型( HMMs )
    • 高斯混合模型( GMMs )
    • 决策树和语音问题
    • 字典,如果将字符用作建模单位

    Eesen是由 Yajie Miao创建的,来自Kaldi 工具包的灵感。 谢谢你,Yajie

    关键组件

    Eesen包含 4个用于启用 end-to-end ASR的关键组件:

    Eesen的亮点

    实验结果

    参考每个示例设置下的结果。

    引用

    有关详细信息,请参阅以下 paper(s):

    Yajie,Mohammad,Mohammad,and,", EESEN:: 基于RNN模型和WFST解码的End-to-End语音识别 Proc。 自动识别和理解 workshop ( ASRU ),Scottsdale,AZ,U.S.A,2015年12月。 IEEE。


    rep  proj  REPO  Repository  
    相关文章