
特征提取与图像处理笔记
猫猫与橙子
这个作者很懒,什么都没留下…
展开
-
ocr数据不够,怎么造数据
造字符识别数据原创 2024-06-20 10:48:41 · 424 阅读 · 0 评论 -
图像样本不平衡问题的处理
样本不平衡问题的解决办法原创 2023-11-29 13:52:33 · 1078 阅读 · 0 评论 -
*.rgb转换为*.jpg的操作
'*.rgb'文件转换为‘*.jpg'原创 2022-12-27 16:18:20 · 972 阅读 · 0 评论 -
图像增强:椒盐噪声
椒盐噪声的原理和生成原创 2022-09-08 11:30:58 · 2956 阅读 · 0 评论 -
使用fillPoly函数将目标贴入背景图
将需要的检测的目标融合到背景图片中,用于丰富目标检测中的负样本和均衡各个类别,效果较好;原创 2022-05-14 13:46:19 · 1143 阅读 · 0 评论 -
泊松融合进行数据拼接报错
泊松融合进行数据拼接报错原创 2022-05-14 13:10:10 · 656 阅读 · 0 评论 -
关于图片的多标签分类(1)
最近还在处理人脸附件(眼镜,刘海,口罩,帽子)的multi-label分类。给自己普及一下常识性问题:1)什么是multi-label分类?multi-label分类,常见一张图片中可以存在多个目标,如猫,狗,人。这样这张图片就有三个标签;2)multi-label分类和multi-class 分类?multi-class 分类,就是将多种类别的图片进行类别分类,与multi-la...原创 2019-04-23 14:33:01 · 10666 阅读 · 0 评论 -
数据增强常用方式
信息來源:http://lamda.nju.edu.cn/weixs/project/CNNTricks/CNNTricks.html用途:由於深度學習的發展,爲了加強深度學習的性能以及滿足深度學習的大數據量要求,所以需要對數據進行增強。數據增強常用方法:1)horizontally flipping(圖像水平鏡像)2)random crops(剪切图像)3)color jit...原创 2017-06-07 16:30:01 · 911 阅读 · 0 评论 -
分类任务中常用的Label smoothing
分类任务中常用的Label smoothing,以及pytorch中的调用代码;原创 2022-03-25 14:22:50 · 3043 阅读 · 0 评论 -
数据增强:随机擦除Random erasing
数据增强之随机擦除Random erasing原创 2022-03-25 17:08:51 · 5064 阅读 · 0 评论 -
目标检测YOLOv5:数据增强
yolov5的数据增强代码来自两个地方:1.albumentations源码在utils/augmentations.py中,使用了albumentations这个库来处理数据增强,其中处理的细节可以自行搜索使用细节,要是环境中没有安装albumentations库,那么执行时就会跳过这块的数据增强,附源码查看:class Albumentations: # YOLOv5 Albumentations class (optional, only used if package is i原创 2021-11-18 13:45:40 · 10672 阅读 · 2 评论 -
数据增强工具
albumentations 是一个给予 OpenCV的快速训练数据增强库,拥有非常简单且强大的可以用于多种任务(分割、检测)的接口,易于定制且添加其他框架非常方便。原创 2021-11-17 11:44:53 · 1032 阅读 · 0 评论 -
数据增强:贴图
做目标检测时,当类别数量不均衡时,就会用到背景贴上目标的方法来均衡类别样本;当你的标签是多坐标点标注的多边形标签(类似ocr中的文字区域检测标签)def get_polygon_point(point_str): #point_str类似'1,2,3,4,5,6'转换为[[1,2],[3,4],[5,6]] point_str_list = list(map(int, point_str.split(','))) point_list = [] for i in r原创 2021-11-10 10:47:03 · 2789 阅读 · 0 评论 -
场景数据的增强方法
解决太阳光反射的数据增强;原创 2021-11-05 14:10:45 · 434 阅读 · 0 评论 -
图片的透视变换
目录1.透视变换结果溢出原图边界2.相应的图片标签(box)怎样在透视变换后找到对应的坐标点网上关于透视变换的文章很多,特别是对于原理解析的文章,所以我只记录下使用过程中遇到的问题;1.透视变换结果溢出原图边界本人的处理方法:step1:根据原始的四个坐标点和目标的四个坐标点得到变换矩阵;#p1:原图中的四个坐标点,p2:目标图中的四个坐标点M = cv2.getPerspectiveTransform(p1, p2)step2:将图片的边界的四个顶点输入到变换矩阵,得到原创 2021-11-05 10:55:43 · 1035 阅读 · 2 评论 -
仿射变换和透视变换
最近对场景图片做一些研究和矫正,所以对仿射变换和透视变换有些了解,然后把自己的使用过程分享如下1.仿射变换作用:提高识别的效果;如:在ocr字符识别的第一步会将文字区域进行矫正;实施该方法的前提:有外接四边形的四个坐标点,如果标签是矩形,那么就没有办法进行矫正了;样例图片:目标是将车厢上边缘处理为水平原图,知道车厢的四个坐标点:实施代码:方法一:找到合适的角度将车厢上边缘放平:def dumpRotateImage(self, img, degree).原创 2021-10-21 14:52:35 · 434 阅读 · 0 评论 -
一堆图片文件的读取/处理后进行顺序存储
今天又遇到了同样的问题,所以将代码贴出来,以后遇到同样问题省时省力首先是读取一堆某种类型的图片文件:#include#include#include#include#include"windows.h"using namespace std;/*****************用于批量处理的程序**************************//************原创 2016-08-26 15:29:05 · 1621 阅读 · 0 评论 -
图片清晰度“测量” 算法
检测原理:聚焦图像确实比离焦图像含有更多的信息,边缘更加锐利,细节信息更加丰富,同时高频信号变化也更加强烈;聚焦评价算法的标准:•单峰性•无偏性•抗噪性•适应性•实时性 目前常用的聚焦评价算法:1.梯度函数;2.非梯度函数;梯度函数的依据: 在图像处理中,梯度函原创 2016-09-26 19:30:04 · 9595 阅读 · 0 评论 -
怎样利用控制台cmd生成后缀为csv的文件
首先要知道:cmd下进入指定路径文件夹下1) cd是用来进去目录,或退出目录的2) cd\是回到根目录3) cd.. 是回到上级目录4) cd 子目录名,进入下级目录5) CD绝对路径,进入你的绝对路径的目录里如可以在 C:\WINDOWS\SYSTEM32下输入cd d:\program\f原创 2016-08-05 13:05:23 · 2759 阅读 · 1 评论 -
计算机视觉、机器学习相关领域论文和源代码大集合
注:下面有project网站的大部分都有paper和相应的code。Code一般是C/C++或者Matlab代码。转载地址:http://blog.youkuaiyun.com/think_embed/article/details/17112005一、特征提取Feature Extraction:· SIFT [1] [Demo program][SIFT Lib转载 2015-12-23 19:15:33 · 527 阅读 · 0 评论