2021年CVPR自制适应手写体识别MetaHTR: Towards Writer-Adaptive Handwritten Text Recognition复现

MetaHTR: Towards Writer-Adaptive Handwritten Text Recognition复现

注意:先安装git,后面要用到,先创建环境python=3.8
一.下载项目(建议使用git下载,直接下载压缩包会影响后续操作)

二.下载数据集
https://fki.tic.heia-fr.ch/databases/download-the-iam-handwriting-database
数据集下载好后进行解压(这里是我的路径)

三.按照readme执行这三个指令

第一个指令:pip install -r requirements.txt # install requirements
使用这个指令,会根据requirements.txt安装所需要的依赖,注意安装qpth==0.0.15时会报错(链接),点击链接,下载这个文件解压后修改setup.py文件,将里面的numpy>=1<2改为numpy>=1。
然后在当前环境下切换目录到setup.py所在文件夹下,执行pip install .(注意.也是指令的一部分)如果您是cpu用户,直接看第二个指令。如果您是gpu用户,根据您的系统在torch官网,找到torch==1.11.0的gpu指令。并执行

第二个指令:pip install -e . # install this repo as a package

第三个指令:pip install -e htr # install submodule containing base models
如果您使用了git下载本项目这两个指令可以直接执行,如果是下载了压缩包,请点击这里,将下载的htr项目解压到当前项目下


执行所有指令后,项目结构如下


四.运行子模型(需要配置运行环境)
①gpu的用户请在,main.py文件下自行添加
accelerator='gpu'

②修改各文件的targets变量类型为long
在这两个文件夹下修改targets=targets.long()

htr/htr/sar/sar.py文件下

htr/htr/lit_models.py文件下

③htr/htr/main.py(记得配置运行环境),运行后会生成checkpoint

④根据效果,选择效果最好的checkpoint并添加入配置文件,运行后得到子模型效果


五.metahtr整体模型
运行metahtr/train.py
gpu的用户请自行添加
accelerator='gpu'
需要配置运行环境,并将--trained_model_path设置为checkpoint(可以选择刚才的checkpoint)路径

六.训练中

七.训练结束后评估结果(本人的模型正在训练中,最终效果待确认)
运行matehtr/eval.py(配置运行参数)


总结:metahtr的整个模型是基于htr子模型提出的。metahtr的训练同样也是在htr训练的基础上完善的,可以看到metahtr的损失是低于htr大概5个点左右(前提是htr已经训练的很好了,建议将htr的max_epochs设置为100以上)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值