我们在使用easyocr时,经常会碰到格式识别错误的问题,比如":"识别成".",或者":"识别漏掉的现象;对于这个问题,我们一方面可以通过灰度处理、二值化处理等图片预处理来提高识别率,另外一方面,我们可以通过patch函数来进行后处理。
下面这个函数就可以处理碰到的大部分情况:
def PatchTimeString(time_str):
time_str = time_str.replace(".", ":")
if time_str.count(":") == 1:
parts = time_str.split(":")
if len(parts[0]) == 4: # ex: 0941:10
time_str = parts[0][:2] + ":" + parts[0][-2:] + ":" + parts[1]
elif len(parts[1]) == 4: # ex: 09:4110
time_str = parts[0] + ":" + parts[1][:2] + ":" + parts[1][-2:]
# endif
elif ":" not in time_str:
if len(time_str) == 6: # ex: 094110
time_str = time_str[:2] + ":" + time_str[2:4] + ":" + time_str[-2:]
# endif
else:
pass
# endif
return time_str
#end def
可以处理的问题格式示例:
print(PatchTimeString("094110")) # 输出: 09:41:10
print(PatchTimeString("0941:10")) # 输出: 09:41:10
print(PatchTimeString("09.4110")) # 输出: 09:41:10
print(PatchTimeString("09.41.10")) # 输出: 09:41:10
print(PatchTimeString("09:41:10")) # 输出: 09:41:10 (不变)