- 博客(63)
- 收藏
- 关注
原创 sdmgr
sdmgr论文关键字Key information extractionDocument imagesGraph reasoningDual modality相关论文方法关键信息提取建模为命名实体识别问题。通过将文本连接为字符串,这些字符串被分类为预定义的类别,如订单ID、发票号码等。一种鲁棒的关键信息提取方法应该针对图像视图鲁棒,并利用空间邻域内的所有上下文,而不仅仅是同一条水平线。Cloudscan-a configuration-free invoice analysis
2021-07-13 20:04:39
1538
原创 ANSI 编码格式与 UTF-8 不兼容问题
ANSI 编码格式与 UTF-8 不兼容,格式转换后任会出现空格行检测和去除不掉问题。解决方案(定位,手动清除):with open(r"D:\pythonProject\xxxxx-pytorch-master\data\char_dict.txt", 'rb') as file: #读取文件,检测实际非空行数 #char_dict = {char.strip().decode('gbk','ignore'):num for num, char in enume
2021-01-06 14:21:49
1346
原创 OCR——阿里OCR方案
1. 文字定位定位⽂字在图像中的位置并表征成⾏(1)特征问题 :背景等特征⼲干扰问题 深度学习可以较好的解决特征问题(2)scale问题 : 物体定位的共性问题(3)成⾏行行问题 :⽂文字定位特有问题2. 文字识别3.通用结构化4.系统效率...
2020-12-21 14:18:30
953
1
原创 OCR——论文分享
2020-12-12/星期六《CharacterRegionAwarenessforTextDetection》发表于CVPR(2019)。论文利用分割的思想,对单字符实例和字符间的连接关系进行检测,通过连接字符实例实现不规则(变形、弯曲)文本检测。链接:https://ieeexplore.ieee.org/document/89538462020-12-16/星期三《DeepRelationalReasoningGraphNetworkforArbitrary...
2020-12-18 11:09:23
387
原创 OCR——视觉会议调研
视觉会议:icpr2020:Challenge: 1EndoTect: A Competition on Automatic Disease Detection in the Gastrointestinal TractChallenge: 2The 2nd Grand Challenge of 106-Point Facial Landmark LocalizationChallenge: 3AcTiVComp20Competition on Superimposed Text De..
2020-12-16 19:18:17
4862
原创 OCR——数据集调研
2020-12-14调研数据集:icdar—— ic2015,2017,2019 CTW—— 1500https://zhuanlan.zhihu.com/p/60459597
2020-12-14 11:03:07
4563
原创 OpenCV计算机视觉(5)——直方图和傅里叶变换
直方图cv2.calcHist(images,channels,mask,histSize,ranges)images:原图像格式为uint8或float32,当传入函数时应用括号 [] 同一样括住表示,例如[img] channels:同样用[]括,它会告诉函数,我们统幅图像的直方图。如果传入图像是灰度图,它的值就是 [0] 如果是彩色图像的传入参数可以是 [0] [1] [2] 它们分别对应着R G B mask:掩膜图像。统整幅图像的直方图就把它为None。但是如果你想统图像某..
2020-12-14 10:10:09
815
原创 OpenCV计算机视觉(4)——卷积原理与操作
卷积(每次卷积完之后+Relu(非线性))卷积核的深度和输入图像深度一致,有多少个卷积核,就得到多少张特征图,也就是得到的特征图的深度。1个卷积核的卷积过程:stride越小得到的特征越丰富/多,但是考虑效率的问题,stride一般不会设置为1,stride太大会损失很多信心。padding能更好得利用边缘信息,特征图大小计算:权重共享,一个特征图,参数数量=filter大小+b,多个特征图=n*(filter+b)大小池化Pooling layer(对特征图压缩)(下
2020-12-12 14:44:00
425
原创 OpenCV计算机视觉(3)——opencv--文档扫描OCR识别
检测流程:边缘检测 -> 获得轮廓 -> 透视变换(即放平,包括平移旋转反转等) -> OCR识别一、边缘检测if __name__ == "__main__": # 读取输入 image = cv2.imread(args["image"]) # resize 坐标也会相同变化 ratio = image.shape[0] / 500.0 orig = image.copy() image = resize(orig, height = 500) # 同比
2020-12-11 11:43:44
2482
3
原创 OpenCV计算机视觉(2)——信用卡数字识别
信用卡数字识别-流程预览一、基础配置# 导入工具包from imutils import contoursimport numpy as npimport argparseimport cv2import myutils# 设置参数ap = argparse.ArgumentParser()ap.add_argument("-i","--image",default='./images/credit_card_01.png',help="path to input image
2020-12-10 17:02:17
2519
1
原创 OpenCV计算机视觉(1)——opencv 基础
环境配置Anaconda:https://www.anaconda.com/download/ Python:https://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv 快速安装opencv: pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv
2020-12-10 11:20:37
905
原创 序列标注
自然语言处理中的序列标注问题在目前, 比较主流的技术是语言模型(如LSTM, BERT)+CRF(条件随机场)。想要了解CRF(条件随机场), 首先了解一下隐马尔可夫模型(Hidden Markov Model), 是一种概率图模型(CRF也是), 只要理解了HMM模型和维特比解码算法(viterbi algorothm), 理解条件随机场就成了分分钟的事.1.NER(命名实体识别)问题概述;命名实体识别(英语:Named Entity Recognition,简称NER), 是指识别文本中具有特定
2020-09-19 21:56:30
375
转载 中文自然语言处理的完整流程
第一步:获取语料语料,即语言材料。语料是语言学研究的内容。语料是构成语料库的基本单元。所以,人们简单地用文本作为替代,并把文本中的上下文关系作为现实世界中语言的上下文关系的替代品。我们把一个文本集合称为语料库(Corpus),当有几个这样的文本集合的时候,我们称之为语料库集合(Corpora)。(定义来源:百度百科)按语料来源,我们将语料分为以下两种:1.已有语料很多业务部门、公司等组织随着业务发展都会积累有大量的纸质或者电子文本资料。那么,对于这些资料,在允许的条件下我们稍加整合,把纸质的文本
2020-09-19 20:10:43
4075
原创 VMware虚拟机下的Linux操作系统安装(Ubuntu)
->1.文件->新建虚拟机向导->自定义2.下一步3.安装程序光盘映像文件(选择已经下载好的Ubuntu文件地址)操作系统镜像4.选择存放 位置和命名5.下一步6.7.内存推荐4G8.下一步9.下一步10.下一步11.下一步12.逻辑上划分200个g,实际用多少分多少。注意:立即分配所有磁盘空间不要选。13.下一步14.取消创建后开启此虚拟机。完成15.完成界面。点击...
2020-07-08 21:46:33
268
原创 运行apt-get update后出现错误(failed to fetch ppa )
类似错误:W: Failed to fetch http://ppa.launchpad.net/venerix/pkg/ubuntu/dists/raring/main/binary-i386/Packages 404 Not FoundE: Some index files failed to download. They have been ignored, or old one...
2019-04-20 17:44:18
2646
原创 LabelImg安装 Windows + Anaconda
https://blog.youkuaiyun.com/qq_32799915/article/details/790816591.先下载安装anaconda:https://www.anaconda.com/download/选择适合自己Python版本的。2.进入anaconda prompt创建环境conda create --name=labelImg python=3....
2019-04-18 17:06:44
1876
原创 一些软件的安装教程
PyCharm 安装教程(Windows)http://www.runoob.com/w3cnote/pycharm-windows-install.htmlAnaconda安装教程(Windows)https://blog.youkuaiyun.com/ITLearnHall/article/details/81708148配置环境:我的安装路径为D:\Aconda3配置环境变量:...
2019-04-17 20:46:06
421
原创 ROS 编写简单的Service和Client (C++ catkin)
一.编写service节点这里,我们将创建一个简单的service节点("add_two_ints_server"),该节点将接收到两个整形数字,并返回它们的和。 进入先前你在catkin workspace教程中所创建的beginner_tutorials包所在的目录:cd ~/catkin_ws/src/beginner_tutorials请确保已经按照creating th...
2019-03-19 22:21:43
609
原创 roscd beginner_tutorials(包) 不用每次进终端都配置(一劳永逸)的办法
locate .bashrc(首先查找.bashrc文件)vim /home/用户名/.bashrc 在最后一行加入:source ~/catkin_ws/devel/setup.bash...
2019-03-19 20:43:06
277
原创 ROS 编写消息发布器和订阅器 &测试(Python catkin)
一.编写发布器节点talker进入之前创建的beginner_tutorials包//如果roscd进不了包export ROS_PACKAGE_PATH=~/catkin_ws/src:$ROS_PACKAGE_PATH$ roscd beginner_tutorials首先创建scripts目录存放Python代码:$ mkdir scripts$ cd scr...
2019-03-18 21:35:45
366
原创 ROS 编写消息发布器和订阅器 &测试(C++ catkin)
ROS入门教程-1.1.11 编写简单的消息发布器和订阅器 (C++ catkin)一.编写发布器节点talker "节点(Node)" 是ROS中指代连接到ROS网络的可执行文件的术语。 1.在beginner_tutorials package路径下创建src目录:mkdir -p ~/catkin_ws/src/beginner_tutorials/src 这个...
2019-03-18 17:12:05
444
原创 ROS 创建msgs srv 具体步骤
ROS入门教程-1.1.10 创建ROS消息和ROS服务消息(msg)和服务(srv)介绍 msg文件存放在package的msg目录下,srv文件则存放在srv目录下。 在ROS中有一个特殊的数据类型:Header,它含有时间戳和坐标系信息。 下面是一个msg文件的样例,它使用了Header,string,和其他另外两个消息类型。 Header header...
2019-03-18 11:42:55
886
3
原创 3ds-Max2016 安装 无法正常打开win10
DirectX修复工具3.8 官方标准版http://www.onlinedown.net/soft/120082.htmwin10无法成功完成操作文件包含病毒解决办法解决:https://jingyan.baidu.com/article/84b4f565a6304560f6da321a.html3ds MAX中文语言怎么设置https://jingyan.baidu...
2019-03-17 02:37:01
1845
原创 Blender 下载&设置
https://www.blender.org/参考:https://www.jianshu.com/p/c52605b4b8e8energy(能量)主题:原作者:https://studiollb.wordpress.com/download/(https://www.3d66.com/popsoft_1.html)(3dsmax的不知道能不能行,试一下再告诉你们)1....
2019-03-16 20:26:37
3412
原创 rqt_graph工具报错 ROS学习
ROS使用过程中出现的问题:由于Anaconda的Python路径问题造成rqt_graph报错运行rosrun rqt_graph rqt_graph报错最近由于方向的需要,开始学习ros,载装ros_graph的时候遇到报错,没有catkin_pkg包啥的.经过咨询各路大牛,最终发现是由于自己的电脑安装了anaconda3的原因,解决方法也比较简单.首先:vi ~/.bas...
2019-03-11 20:54:58
2184
原创 ros 编译 节点 话题 服务 参数
编译ROS程序包(使用catkin_make)按照之前的创建一个ROS程序包教程,你应该已经创建好了一个catkin 工作空间 和一个名为beginner_tutorials的catkin 程序包。 现在切换到catkin workspace 并查看src文件夹:$ cd ~/catkin_ws/$ ls src效果:beginner_tutorials/ CMakeList...
2019-03-11 16:14:53
978
原创 ros tf tree 基础
tf(机器人坐标系变换) tree把啤酒瓶的xyz的坐标相对于眼睛的坐标转换到手上,在Ros里面,用URDF文件来定义它的各个联感和关节。URDF(统一机器人描述格式,定义了机器人模型,关节,长度,连接方式.....)例如,摄像头的关节连在底座上,相对这个底座有个transform,需要把坐标回溯到底盘,然后再相对于胳膊,再相对于夹子(关节可能定义不止这么多,传导了很多层),t...
2019-03-04 09:39:56
5017
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人