
CV
文章平均质量分 95
樱缘之梦
这个作者很懒,什么都没留下…
展开
-
OCR系列——文本检测任务
1. 简介文本检测任务是找出图像或视频中的文字位置。不同于目标检测任务,目标检测不仅要解决定位问题,还要解决目标分类问题。目标检测和文本检测同属于“定位”问题。但是文本检测无需对目标分类,并且文本形状复杂多样。当前所说的文本检测一般是自然场景文本检测,其难点在于:自然场景中文本具有多样性:文本检测受到文字颜色、大小、字体、形状、方向、语言、以及文本长度的影响; 复杂的背景和干扰;文本检测受到图像失真,模糊,低分辨率,阴影,亮度等因素的影响; 文本密集甚至重叠会影响文字的检测; 文字存在原创 2022-01-18 11:43:14 · 4048 阅读 · 2 评论 -
OCR系列——总体概述
最近参加了百度Paddle的动手学OCR课程,特此做一个学习总结。1. 简介OCR(Optical Character Recognition,光学字符识别)是计算机视觉重要方向,传统的OCR一般面向扫描文档类对象,现在的OCR是指场景文字识别(Scene Text Recogntion,STR)主要面向自然场景。2. 前沿算法2.1 文本检测文本检测是定位出输入图像中的文字区域。可以将文本检测作为目标检测中的一个特定场景,基于通用目标检测算法进行改进适配,如TextBoxes基于SSD原创 2022-01-13 17:59:33 · 2885 阅读 · 0 评论 -
目标检测模型——One stage(YOLO v5的模型解析及应用)
1. 简介2. 原理3. 模型解析下载地址:https://github.com/ultralytics/yolov3该地址中已包含简单调用,可作为简单参考。3.1.文件内容解析从上述地址下载文件,解压之后,获得如下文件:data:数据文件夹 ————hyps:超参数文件 ————images:yolo v5测试的两张图片,zidian.jpg,bus.jpg ————各项数据集的yaml文件,里边包括存储路径path、train、val、...原创 2021-12-30 11:50:06 · 8389 阅读 · 0 评论 -
目标检测发展路程(一)——Two stage
目标检测是计算机视觉领域中非常重要的一个研究方向,它是将图像或者视频中目标与其他不感兴趣的部分进行区分,判断是否存在目标,确定目标位置,识别目标种类的任务,即定位+分类。传统的目标检测模型有VJ.Det[1,2],HOG.Det[3],DPM[4,5,6],直到2012年,CNN模型日益成熟化,以深度学习为基础的目标检测模型开始发展,主要分为单阶段模型(One stage)和两阶段模型(Two stage),发展路径如下:目标检测也面临许多挑战:环境影响 密集 遮挡 重叠 多尺度:大目标原创 2021-12-28 16:09:41 · 5013 阅读 · 0 评论