最近看到CTPN,想自己跑通下代码,但是windows系统再加上没有gpu,额,好多坑。只为记录一下,后期方便自己学习。加油!
本机环境:win10+tensorflow1.14-cpu
代码来自于:https://github.com/eragonruan/text-detection-ctpn
源码是在Linux下,用gpu进行的训练,所以需要调整代码才能在win环境下跑。遇到的问题有:
一、先跑通demo.py
1.windows中如何进行这步操作??
.so是Linux下动态库文件,在windows下会生成.pyd文件,进行如下几个步骤的操作:
2.修改代码,使用cpu
3.下载预训练的ctpn模型文件,并放到指定目录下,选几张测试图像放到指定文件下,执行demo.py文件,可以看到:
二、跑训练代码train.py
1.改代码,不使用gpu,而是使用cpu
2.关于多线程的问题,windows下需要都设置为1才能跑,具体原因,我也不知道~~
注意,这两张图分别是train.py和data_provider.py中的
3.准备好数据集,并放到指定文件夹下,这里我们是从源码github中链接里下载的,可以直接用于训练
执行train.py,可以得到:
因为我电脑是8G内存,所以会有内存不足的问题。除此之外,这里会存在如图中指示的问题,目前没有解决,仅仅是把代码先跑通,下一步仔细看下所有代码,再来解决这个问题。加油!!!
推荐一个看过的,讲解CTPN很详细的博客:https://blog.youkuaiyun.com/sxlsxl119/article/details/102767725