最近在用mmocr修改模型,下面是一些踩坑记录:
1.opencv版本问题
File “/home/mmocr/models/textdet/postprocess/wrapper.py”, line 451, in fcenet_decode
cv2.CHAIN_APPROX_SIMPLE) # opencv4
ValueError: too many values to unpack (expected 2)
出现这个错误就是你的opencv版本要改成4以上的,
pip install opencv-python==4.0.0.21
2.骨干网络
注册表里发现没有SwinTransformer,
1.应该是configs里的backbone里的type写错了,写成这个格式: type=‘mmdet.SwinTransformer’,
因为mmcv里没有SwinTransformer,SwinTransformer只属于mmdet。
2.或者自己创建一个骨干网络,独属于mmocr,
在mmocr/models/textdet/backbones里创建,记得要注册到mmocr的backbones中。
3.AttributeError: ‘NoneType’ object has no attribute ‘shape’
mlt2017数据集进行转换的时候出现了上述问题。原因是数据集中有的照片没有进行转码,只是更改了后缀,所以在模型加载的时候会报错,用PIL工具将所有的gif图片转换成为png图片就可以了
训练集是img_401.gif、img_478.gif、img_1187.gif、img_1188.gif出错
验证集我错的也是这几个序号,???
全部转换
<