
OCR学习
文章平均质量分 74
MIngo的成长
这个作者很懒,什么都没留下…
展开
-
视觉文档问答/文档关键信息提取
NLP相关知识命名实体识别(NER)序列标注(Sequence Tagging)是NLP中最基础的任务,应用十分广泛,如分词、词性标注(POS tagging)、命名实体识别(Named Entity Recognition,NER)、关键词抽取、语义角色标注(Semantic Role Labeling)、槽位抽取(Slot Filling)等实质上都属于序列标注的范畴。命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义原创 2022-05-18 14:11:51 · 1009 阅读 · 0 评论 -
Paddle 飞浆模型压缩 针对于OCR模型压缩
文章目录前言一、判断是否需要模型压缩二、OCR模型压缩1.应用场景2.PaddleSlim剪裁卷积通道剪裁剪裁建议代码示例量化前言AI快车道-PaddleCV系列课程-第五课模型压缩观后感一、判断是否需要模型压缩二、OCR模型压缩1.应用场景2.PaddleSlim剪裁卷积通道剪裁卷积通道剪裁是通过调整卷积核的数量来达到输出特征图的通道数很主要的点 :如何对卷积核重要性排序 卷积内的卷积核进行一个重要性排序,比如l0_norm 查一下每一个卷积中非零值的个数多个卷积进原创 2021-08-27 14:19:23 · 407 阅读 · 0 评论 -
中文手写数据生成基于paddleocr和textrenderer-大幅提高中文识别准确率
文章目录参考一、textrenderer更多参数解释二、准备手写字体文件效果展示参考主要是参考了这位大佬的工作 ,大佬说生成都是灰度图,因为考虑样本多样性,主要介绍如何生成彩色图片,字典文件和其他参数都类似PaddleOCR数字仪表识别——2(New). textrenderer使用及修改使之符合PaddleOCR数据标准一、textrenderer更多参数解释在我做的时候自己摸索了一些比较有用的可以实现更多效果的参数代码如下(示例):chn_data = GeneratorCfg(原创 2021-07-06 15:14:26 · 1952 阅读 · 0 评论 -
CTC blank 理解
项目场景:提示:PaddleOCR源码阅读ppocr/data/postprocess/rec_postpocess.py使用ctclabeldecode问题描述:当时面试时问CTC是如何解码的,回答有点模糊,就大概理解是一个序列话,跟字典去一一对应解决方案:1、ctcblank机制现在的理解是这样的。一张图片要映射到一个字符序列,识别的基础还是单字符的识别(如果不考虑直接把图片映射为一个单词的方法)。单字符的识别就涉及到图片切分的问题了,切分有显示切分和隐式切分两...原创 2021-05-27 10:45:53 · 1127 阅读 · 3 评论 -
场景文字的两类检测算法综述---基于回归和分割的方法
系列文章目录文章目录系列文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言# 引言自然场景文本检测识别(Scene Text Recognition, STR)是计算机视觉中的一个重要领域。它在图像搜索,即时翻译和机器人导航等应用中有着至关重要的作用:例如识别照片和视频中的标志、路牌、商店名称等。相比于发展成熟的文档文本识别技术(OCR),STR显然更具挑战性。OCR善于识别平面上的白纸黑字,而自然场景中的文本具有复杂的光照、遮挡、角度、字体和3D阴影。一、pan原创 2021-01-21 13:37:41 · 5296 阅读 · 0 评论 -
PaddleOCR 识别数据制作
PaddleOCR 识别数据制作OCR 常见数据集准备生成PaddleOCR识别数据集Python常见转义符号ChineseOCR 数据集转PaddleOCR 数据集训练格式以PaddleOCR 为基础OCR 常见数据集准备OCR数据集整理通用中英文OCR数据集手写数据集垂类多语言生成PaddleOCR识别数据集根据描述,街景数据集根据真值图crop 下载数据集后打开标注,会发现有illegibility和difficult这个字段,根据这个字段的真值去crop图,point是相对应的坐标原创 2021-01-20 14:40:46 · 1900 阅读 · 0 评论