
OCR
songyuc
这个作者很懒,什么都没留下…
展开
-
数字公式识别的学习笔记
6 随笔6.1 Word Embedding在南溪看来,Word Embedding是一项很好的技术;它将单词用embedding进行表示,从而使得embedding具有了(在距离上的)语义信息;那么Word-Embedding技术如何用于数字公式识别呢?其实这里是使用了一种类似于self-supervised的思想,首先我们假设:我们可以从单词的one-hot编码,映射出一种多维度的特征,这里有点像“转置卷积”中的“补绘”的思想!所以我们的目标就是学习出这样的embedding,这里我们原创 2020-10-07 17:10:53 · 705 阅读 · 0 评论 -
Transformer的学习笔记
1 前言Transformer是一个很厉害的模型呀~2 Self-AttentionNote:这里的WqW^qWq、WkW^kWk和WvW^vWv的权值是不共享的,也就是独立的;我感觉原因可能是因为,不同时刻的序列aia^iai的特征可能不太一样,所以这里没有用相同的kernel来提取特征;(CNN中,所有loc的region都是使用的相同的卷积kernel,这样的特点给CNN带来了平移不变性的优点;于是特征的数量主要由channel的维度来确定,也就是,channel数决定了特征的丰富程原创 2020-10-07 12:14:09 · 446 阅读 · 1 评论 -
OCR——PaddleOCR之文字识别的学习笔记
1 前言在南溪看来,PaddleOCR是现在开源的最厉害的OCR识别库~2 PaddleOCR中目前最强的英文&数字识别模型我们需要知道PaddleOCR中现在针对“英文&数字识别”任务最强的识别模型;我们先来看看PaddleOCR模型库的说明文档可以看到,现在最好的识别模型是这个,3 主干网络的学习...原创 2020-09-24 13:37:32 · 4285 阅读 · 2 评论 -
OCR的学习笔记
1 致谢感谢Python中提供的difflib的函数库~2 前言我们希望可以打造一个属于自己的OCR模型~3 后处理在经过OCR的识别过程之后,识别出来的文字可能会出现错误,所以还需要进行后处理;3.1 相似度匹配——difflib我们使用相似度来找出词表中相似度最高的名字,使用的函数库是difflib,3.1.1 使用set_seq1()和set_seq2()进行性能的优化在difflib的文档中,他们给出了这样的优化建议:SequenceMatcher 计算并缓原创 2020-07-02 12:35:00 · 319 阅读 · 0 评论