复现ReaLiSe模型时遇到的错误:【died with <Signals.SIGSEGV: 11>】
ReaLiSe模型介绍及仓库
https://github.com/DaDaMrX/ReaLiSe
产生原因
使用分布式训练而产生。
在训练的执行脚本中,python启动时使用了"-m"参数
python -m torch.distributed.launch --master_port=453$(($RANDOM%90+10)) --nproc_per_node=2 src/run.py \
--略
解决办法
删除分布式相关代码
python src/run.py \
--略