睿洛医疗
目标:OCR非结构化图像文字识别 支持:中文、英文 流程: 输入图像 》》 图像预处理 》》 文字监测 》》 文字识别 》》 输出结构文本 补充安装模块: pip install paddlehub TODO: 1,大模型识别不到; 2,小模型置信度调到 0.2,大段文本也存在很大程度的丢失。
引入包:
import paddlehub as hub
import cv2
预测:
def ocr_action(model_name,in_img_dir,in_filelist_txt,out_path):
ocr = hub.Module(name=model_name)
with open(in_filelist_txt, 'r') as f:
img_path = []
for line in f:
filename = line.strip()
img_path.append(filename)
np_images = [cv2.imread(in_img_dir + image_