lstm-parser, 基于堆栈LSTMs的基于转换的依赖解析器

分享于 

4分钟阅读

GitHub

  繁體 雙語
Transition-based dependency parser based on stack LSTMs
  • 源代码名称:lstm-parser
  • 源代码网址:http://www.github.com/clab/lstm-parser
  • lstm-parser源代码文档
  • lstm-parser源代码下载
  • Git URL:
    git://www.github.com/clab/lstm-parser.git
    Git Clone代码到本地:
    git clone http://www.github.com/clab/lstm-parser
    Subversion代码到本地:
    $ svn co --depth empty http://www.github.com/clab/lstm-parser
    Checked out revision 1.
    $ cd repo
    $ svn up trunk
    
    lstm解析器

    基于 LSTM RNNs状态嵌套计算的基于转换的依赖

    请遵循 CL文章的完整描述来了解解析器的完整描述。

    对于基于 EMNLP字符模型,请从分支"基于字符"中签出,并按照新分支的readme文件中显示的说明进行操作。 在这里,分支。

    在这里,使用 duncanka插件可以更轻松地使用版本1,它可以在不使用oracle转换的数据上使用。

    这里有一个版本 ,它包含形态特征,也允许它在基于字符的嵌入( 选项) 中运行

    需要的软件生成指令
    
    mkdir build
    
    
    cd build
    
    
    cmake.. -DEIGEN3_INCLUDE_DIR=/path/to/eigen
    
    
    make -j2
    
    
    
    
    训练解析模型

    使用 training.conll 文件和根据 CoNLL数据格式格式化的development.conll,用LSTM解析器训练解析模型,在 命令行 提示符下键入以下命令:

    
    java -jar ParserOracleArcStdWithSwap.jar -t -1 -l 1 -c training.conll> trainingOracle.txt
    
    
    java -jar ParserOracleArcStdWithSwap.jar -t -1 -l 1 -c development.conll> devOracle.txt
    
    
    
    parser/lstm-parse -T trainingOracle.txt -d devOracle.txt --hidden_dim 100 --lstm_input_dim 100 -w sskip.100.vectors --pretrained_dim 100 --rel_dim 20 --action_dim 20 -t -P
    
    
    
    

    链接到我们在 ACL 2015纸张中使用的单词矢量: sskip.100.vectors

    Note-1: 你也可以通过删除-w选项来运行它,而不需要使用 for。

    Note-2: 在开发结果没有显著改善的情况下,应该停止培训过程。 通常,在 5500次迭代之后。

    Note-3: 解析器报告( 每次迭代之后) 结果,包括标点符号,在 ACL-15 报告中报告结果包含的( 在这些数据集中是常见的做法)。 你可以从conll的共享任务中找到 eval.pl 脚本来获得正确的数字。

    使用解析模型分析数据

    根据CoNLL数据格式设置设置了一个 test.conll 文件。

    
    java -jar ParserOracleArcStdWithSwap.jar -t -1 -l 1 -c test.conll> testOracle.txt
    
    
    
    parser/lstm-parse -T trainingOracle.txt -d testOracle.txt --hidden_dim 100 --lstm_input_dim 100 -w sskip.100.vectors --pretrained_dim 100 --rel_dim 20 --action_dim 20 -P -m parser_pos_2_32_100_20_100_12_20-pidXXXX.params
    
    
    
    

    模型名/id存储在解析器已经被训练的地方。 解析器将使用解析结果输出conll文件。

    Pretrained模型

    待办事项

    引用

    如果你使用这里软件,请引用以下内容:

    
    @inproceedings{dyer:2015acl,
    
    
     author={Chris Dyer and Miguel Ballesteros and Wang Ling and Austin Matthews and Noah A. Smith},
    
    
     title={Transition-based Dependency Parsing with Stack Long Short-Term Memory},
    
    
     booktitle={Proc. ACL},
    
    
     year=2015,
    
    
    }
    
    
    
    
    许可证

    这个软件是根据许可协议terms版本 2.0版本发布的。

    联系人

    有关问题和用法问题,请联系 cdyer@cs.cmu.edumiguel.ballesteros@upf.edu。


    BASE  STA  PAR  DEP  parse  parser  
    相关文章