复现论文ChineseBERT(ONTONOTES数据集)

作者详细记录了复现ChineseBERT论文过程中遇到的环境配置问题,包括CUDA版本、Pytorch版本、numpy版本的匹配,以及数据集下载、路径设置、脚本修改等步骤。在解决了一系列错误后,最终成功运行模型并得到测试结果。

记录一下自己复现论文《ChineseBERT: Chinese Pretraining Enhanced by Glyph and Pinyin Information》的过程,最近感觉老在调包,一天下来感觉什么也没干,就直播记录一下跑模型的过程吧

事前说明,这是跑项目的实况,如果是想当教程看,建议跳着看

自己电脑环境如下:

  • 显卡:3060TI
  • CUDA : 11.0
  • CUDAToolkit : 8.0.2
  • tensorflow : 2.4.0
  • pytorch : 1.7.0

首先使用Conda创建一下项目的虚拟环境

conda create -n ChineseBERT python=3.8

进入环境

 conda activate ChineseBERT

Pycharm打开项目并切换到刚刚新建的环境

在这里插入图片描述

找到requirements.txt文件,在环境中一个一个安装

在这里插入图片描述

安装的时候,发现torch版本装不到这么低的

在这里插入图片描述

然后就装了项目简介中的版本,(发现自己要跑的OntoNotes 4.0数据集正好也需要装这个版本,nice)

在这里插入图片描述

pip install torch==1.7.1+cu101 torchvision==0.8.2+cu101 torchaudio==0.7.2 -f https://download.pytorch.org/whl/torch_stable.html

然后打开作者的文档OntoNotes NER task,下载对应的数据集

在这里插入图片描述

然后新建一个名为ONTONOTES_DATA_PATH的文件夹,把解压后的文件放进去

在这里插入图片描述

找到tasks/OntoNotes/OntoNotes_trainer.py文件,尝试第一次运行

在这里插入图片描述

果不其然会报错,好像是numpy版本不匹配的问题,搜一下

在这里插入图片描述

看了一眼自己装的numpy版本,果然高一点

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Otto_1027

蟹蟹你,我会继续努力的~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值