最近做自然场下的OCR识别,使用的是CRNN模型,因为需要训练数据,所以从github上找来了一个造数据的项目。
项目的地址为:https://github.com/Sanster/text_renderer
这个项目功能很强大,各种数据都很容易伪造,我记录下搭建它所需要的Docker环境。
FROM vastai/pytorch
COPY sources.list /etc/apt/
RUN mv /etc/apt/sources.list.d/cuda.list /tmp/ && mv /etc/apt/sources.list.d/nvidia-ml.list /tmp/
RUN apt-get update && apt-get install vim -y && pip install opencv-python -i https://pypi.doubanio.com/simple \
&& apt-get install cython -y \
&& apt-get install python3-tk -y\
&& pip install Pillow \
&& pip install fonttools -i https://pypi.doubani