AMR解析：序列到图转换入门指南-优快云博客

AMR解析：序列到图转换入门指南

stog 项目地址: https://gitcode.com/gh_mirrors/st/stog

项目介绍

AMR Parsing as Sequence-to-Graph Transduction 是一个基于PyTorch实现的AMR（抽象意义表示）解析器，该解析器以论文《AMR Parsing as Sequence-to-Graph Transduction》为核心，发表于ACL 2019年会议。项目由Sheng Zhang等人开发，采用序列到图的转换方法来处理AMR解析任务，提供了一个高效且可扩展的框架。

该项目支持在Python 3.6环境下运行，并依赖于PyTorch 0.4.1及其他特定库，通过预训练模型和详尽的数据处理步骤，使研究者和开发者能够快速部署AMR解析能力到自己的应用程序中。

项目快速启动

要快速启动并使用此项目，遵循以下步骤：

环境准备

首先，确保你的系统已安装Python 3.6，并配置好conda环境或虚拟环境。接着创建并激活名为stog的环境：

conda create -n stog python=3.6
source activate stog
pip install -r requirements.txt

数据下载及准备

获取必要的数据集，这里以AMR 2.0为例（LDC2017T10），并进行相应的解压和准备：

cd scripts
./download_artifacts.sh
unzip LDC2017T10.zip -d data/AMR/
./prepare_data.sh -v 2 -p data/AMR/LDC2017T10

核心功能快速试跑

安装完所有依赖并准备数据后，可以尝试训练模型，但请注意至少需要两块GeForce GTX TITAN X GPU。如果条件允许，执行以下命令开始训练过程：

python -u -m stog.commands.train params/stog_amr_2_0_yaml

或者，如果你只是想进行预测，可以使用预训练模型：

python -u -m stog.commands.predict \
       --archive-file ckpt-amr-2_0 \
       --weights-file ckpt-amr-2_0/best.th \
       --input-file data/AMR/amr_2_0/test.txt features preproc \
       --batch-size 32 \
       --use-dataset-reader \
       --cuda-device 0 \
       --output-file test_pred.txt \
       --silent \
       --beam-size 5 \
       --predictor STOG