- 博客(30)
- 收藏
- 关注
原创 python+opencv 实现文字分割(横板-小票文字分割/竖版-古文文字分割)
图片文字分割的时候,常用的方法有两种。一种是投影法,适用于排版工整,字间距行间距比较宽裕的图像;还有一种是用OpenCV的轮廓检测,适用于文字不规则排列的图像。
2021-06-02 11:20:19
7503
18
原创 python判断图片长宽后删除数据集中的小图片
import osfrom PIL import Imagepath = r'C:\study_he\Nestle45'#数据集的地址for root, dirs, files in os.walk(path): for name in files: fileName =os.path.join(root, name) fp = open(fileName, 'rb') im = Image.open(fp) fp.close()
2021-04-23 11:29:29
359
1
原创 目标检测:python实现多种图像数据增强的方法(光照,对比度,遮挡,模糊)
图像数据增强的内容(可根据需要自定义选择):1.直方图均衡化2.clahe自适应对比度直方图均衡化3.白平衡4.亮度增强5.亮度,饱和度,对比度增强6.去除图像上的高光部分7.自适应亮度增强8.随机遮挡9.图像高斯模糊10.压缩图像# -*- coding: utf-8 -*-"""******不改变原始xml的一些数据增强方法 type 1-10*******把增强后的图像和xml一起放入新的文件夹rootpath:picture_xml原始路径savepath:pict
2021-01-09 11:04:48
8695
6
原创 python检测空白文档(无内容)图片
# coding: utf-8#python检测“无内容”图片#通过图像熵检测,无内容图像熵较小,可通过设置阈值检测无内容图像import cv2import numpy as npimport mathimport timeimport osimport shutildef get_entropy(img_): x, y = img_.shape[0:2] img_ = cv2.resize(img_, (100, 100)) # 缩小的目的是加快计算速度 tmp
2021-01-09 10:57:05
1748
2
原创 解决C盘存储空间不够用的问题(C盘中Pycharm缓存文件过大)
由于Pycharm会生成大量缓存文件,而这些缓存文件默认存储在C盘,导致C盘空间被占用。如何查看:进入c盘-》用户目录,找到pycharm缓存文件夹(类似以下文件夹)。解决办法:1.找到pycharm安装目录bin文件夹下的idea.properties文件,用notepad++打开。2.修改idea.properties文件的以下四个部分:把缓存、log、插件等文件的存储位置直接指定为你的路径3.剪切c盘的缓存文件到你指定的位置。4.重启pycharm即可生效。...
2020-12-31 10:20:39
14017
3
原创 anaconda安装出现conda.execute(700): An error occurred while installing package ‘defaults::qt-5.9解决办法.7-
用anaconda 安装模块,出现以下错误:解决办法:换成pip方式安装即可。pip install 安装包
2020-12-26 16:59:01
3983
原创 低光照论文LIME:Low-light Image Enhancement via Illumination Map Estimation的代码
c++版本:https://github.com/zj611/LIME_Processingpython版本:https://github.com/pvnieo/Low-light-Image-Enhancement
2020-12-25 11:15:45
3014
原创 win10下用yolov3训练WiderFace数据集来实现人脸检测(TensorFlow版本,darkface作为测试集)
数据集准备工作 训练集 Wider Face格式转换下载人脸数据集wider face,解压到同一个文件夹下在同一个目录下,新建convert.py文件(把下面程序放入)运行程序得到图像和其对应的xml文件。# -*- coding: utf-8 -*-import shutilimport randomimport osimport stringfrom skimage import ioheadstr = """\<annotation> <fo
2020-12-18 17:10:40
1666
4
原创 低光照增强论文阅读:ZERO-SHOT RESTORATION OF UNDEREXPOSED IMAGES VIA ROBUST RETINEX DECOMPOSITION
ABSTRACT未曝光的图像往往受到严重的质量退化,如能见度差和潜在的噪音。 以往大多数低曝光图像恢复方法都忽略了噪声,并在拉伸对比过程中放大了噪声。 我们显式地预测噪声,以达到去噪的目的,同时恢复曝光不足的图像。 具体地,提出了一种新的三支卷积神经网络,即RRDNet(简称RobustRetinex分解网络),将输入图像分解为光照、反射率和噪声三个分量。 作为一个特定于图像的网络,RRDNet不需要任何先验图像示例或先验培训。 相反,RRDNet的权重将通过迭代最小化一个特殊设计的损失函数的零镜头方案来
2020-12-11 20:17:58
2219
3
原创 有参考图像的图像质量评估方法及代码(PSNR,SSIM,RMSE,NRMSE,ENTROPY)
1.峰值信噪比PSNRPSNR(Peak Signal to Noise Ratio),峰值信噪比,即峰值信号的能量与噪声的平均能量之比,通常表示的时候取log 变成分贝(dB),由于 MSE 为真实图像与含噪图像之差的能量均值,而两者的差即为噪声,因此 PSNR 即峰值信号能量与 MSE之比。2.结构相似性SSIM作为结构相似性理论的实现,结构相似度指数从图像组成的角度将结构信息定义为独立于亮度、对比度的,反映场景中物体结构的属性,并将失真建模为亮度、对比度和结构三个不同因素的组合。用均
2020-12-10 17:37:58
11490
1
原创 数据集扩充方法(图像分割成几部分)
解决图像数据集不足将数据集每个图像分割成几部分(下面例子是把一张图像分为9部分,根据自己需要修改参数)from PIL import Imageimport sysimport osdef cut_image(image): width, height = image.size item_width = int(width /3)#修改这里的参数 item_height=int(height / 3)#修改这里的参数 box_list = [] coun
2020-12-10 17:20:45
1093
原创 低光照增强论文阅读:Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement
特点:1.将亮度增强作为一个利用深度网络进行图像曲线估计的任务.它将这个任务转换为了一个image-specific曲线估计问题(图像作为输入曲线作为输出),这类曲线对在输入的动态范围内进行像素级调整,从而获得增强图像。2.提出了新的loss function.通过设置一系列non-reference的损失函数(空间一致性损失、曝光控制损失、色彩稳定性损失和照明平滑损失,可以间接反映增强质量),使得网络在没有任何参考图像的情况下能够进行end-to-end训练,训练时不需要任何配对或未配对的数据(避免了
2020-12-10 17:03:46
1368
原创 夜间(低光照)目标检测数据集整理:人脸检测,行人检测
2020:When Pedestrian Detection Meets Nighttime Surveillance: A New Benchmark
2020-12-10 16:35:24
12510
2
原创 python: ccf考试202006-1,202006-2 题解(100分)
##2020601n,m=map(int,input().split())a=[]b=[]for i in range(n): a.append(list(input().split()))for _ in range(m): b.append(list(map(int,input().split())))for i in range(m): l_list=[] r_list=[] for j in range(n): if b[i][0]
2020-12-10 16:05:53
250
原创 目标检测:把标注文件txt格式转换为xml格式
txt_to_xml程序如下:# -*- coding: utf-8 -*-import os,shutilimport cv2from lxml.etree import Element, SubElement, tostringdef txt_xml(img_path,img_name,txt_path,img_txt,xml_path,img_xml): #读取txt的信息 clas=[] img=cv2.imread(os.path.join(img_path,im
2020-07-25 11:48:44
10142
8
原创 python:将图片切割成4份扩充数据集
有时候图像过大,或者是图像的数量不够,可以把原始图像切割成四份扩充数据集。import cv2import osif __name__ == "__main__": #图像文件原始路径 path = r"C:\study_he\exp_result\high\train\high_image" listdir = os.listdir(path) # 新建split文件夹用于保存 newdir = os.path.join(path, 'split')
2020-07-16 10:53:29
1893
1
原创 论文阅读:曝光过度,曝光不足增强算法Learning to Correct Overexposed and Underexposed Photos
论文阅读:Learning to Correct Overexposed and Underexposed Photos需要解决的问题:曝光误差可能是由多种因素造成的,例如TTL测光的测量误差、硬照明条件(例如,非常低的照明和背光)、场景亮度水平的剧烈变化,或用户在手动模式下的错误。在基于相机的成像中,拍摄错误曝光的照片仍然是一个主要的错误来源。曝光问题可分为以下两类:•(i)曝光过度,相机曝光时间过长,导致图像区域变亮和褪色;•(ii)曝光不足,曝光时间太短,导致图像区域变暗。论文方法:提出
2020-07-13 11:06:29
5476
原创 目标检测:图像根据xml里的boundingbox信息画框
根据xml boundingbox信息画框import osimport os.pathimport xml.etree.cElementTree as ETimport cv2def draw(image_path, root_saved_path): """ 图片根据标注画框 """ src_img_path = image_path for ...
2019-12-23 10:10:43
2402
原创 目标检测tricks:Bag of Freebies for Training Object Detection Neural Networks
BagofFreebiesforTrainingObjectDetectionNeuralNetworksTricks:1、Mixup 数据增强2、Classification Head Label Smoothing3、数据预处理4、learning rate 设置------warm up + Cosine schedule5、 Synchronized Batch Normali...
2019-12-17 11:27:42
265
原创 目标检测:数据增强方法及代码实现
数据增强 :生成数据增强后的图像和对应的xml高斯模糊调整亮度平移cutout裁剪# -*- coding=utf-8 -*-import osimport timeimport randomimport cv2import numpy as npfrom skimage import exposureimport xml.etree.ElementTree as ...
2019-12-17 11:26:39
2492
原创 用TensorLayer随机裁剪图片并修改对应的xml
随机裁剪图像# -*- coding: utf-8 -*-import osimport tensorlayer as tlimport xml.etree.cElementTree as ETfrom lxml.etree import Element, SubElement, tostringfrom xml.dom.minidom import parseStringfrom ...
2019-11-13 19:18:39
646
4
原创 论文笔记DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations
DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations服装识别,检索的难点:1.变形,遮挡,缩放,视角的变化2.样式纹理的多样性3.背景不纯创新点:创建了一个服装数据集DeepFashion,包含80万张服装图像,有类别,属性,特征点以及服饰框的标注。提出一个深度学习模...
2019-11-06 16:02:21
389
原创 论文笔记:The Effectiveness of Data Augmentation in Image Classification using Deep Learning
摘要论文探索并比较了多种解决方案用来解决图像分类中的数据增强问题,旨在研究数据扩充的有效性。它将通过使用传统数据扩充技术(比如裁剪、旋转)或者现代意义上讲得GAN(CycleGAN),还提出了一种通过神经网络学习改进分类器的增强的方法,称之为神经增强。前言深度学习和机器学习的有效性离不开数据,神经网络可以从数据中获益,基于文本的模型因谷歌语料库的发布而受益。作者认为对于如此庞大的非结构化数据...
2019-11-06 16:01:11
703
原创 深度学习模型过拟合问题解决办法
模型过拟合如上图所示拟合曲线(1)图一的拟合较为简单,不能很好的反应出变化关系 ,欠拟合(2)图二的拟合较好,可以很好的表达变化关系(3)图三的拟合较为复杂,常用不能很好的预测以后的变化趋势),为过拟合情况产生过拟合的原因:观察值与真实值存在偏差训练样本的获取,本身就是一种抽样。抽样操作就会存在误差, 也就是你的训练样本 取值 X, X = x(真值) + u(随机误差),机器学...
2019-10-24 19:59:34
3036
1
原创 AttributeError: module ‘tensorflow’ has no attribute ‘python_io’ tf.python_io
TensorFlow2.0 出现错误 AttributeError: module ‘tensorflow’ has no attribute ‘python_io’ tf.python_io解决办法1.把TensorFlow2.0版本改为原来的1.xx版本,例如改为TensorFlow 1.12.02.TensorFlow 2.0 中使用 Python_io 暂时使用如下指令:tf.co...
2019-10-23 10:24:12
13605
2
原创 面向深度学习的图像数据增强综述A survey on Image Data Augmentation for Deep Learning
深度学习在计算机视觉任务许多方面都表现得非常好。然而,这些网络严重依赖大数据以避免过度传输,不幸的是,许多应用领域无法访问大数据,如医学图像分析。这项调查的重点是数据扩充,一种解决有限数据问题的数据空间解决方案。数据增强这一技术,可以提高训练数据集的大小和质量,从而可以使用它们构建更好的深度学习模型。这篇论文讨论的图像增强算法包括几何变换、颜色空间增强、核函数、混合图像、随机删除、特征空间增强、对抗训练、生成对抗网络、神经风格转换和元学习等。
2019-10-15 17:40:42
3294
原创 图像增强:opencv去除图片的高光
1.算法原理: 对高光部位应该先检测,后用图像增强的办法去除高光,想办法用周围的色素值代替,本文采用图像修复的方法。2. 算法步骤:1.图像阈分割生成mask掩膜2.opencv自带的图像修复函数,如下:cv2.inpaint(src, inpaintMask, 3, cv2.INPAINT_TELEA)src:目标修复图像;inpaintMask:蒙版图(定位修复区域);3:选取...
2019-10-11 21:26:55
21994
13
原创 论文笔记DeepFashion2:A Versatile Benchmark for Detection, Pose Estimation Segmentation ,Re-Identification
DeepFashion2: A Versatile Benchmark for Detection, Pose Estimation Segmentation and Re-Identification of Clothing Images
2019-09-20 08:40:45
1770
6
原创 服装检索相关论文阅读
服装检索相关论文阅读########Where to Buy It: Matching Street Clothing Photos in Online Shops论文链接:https://ieeexplore.ieee.org/document/7410739论文目标:跨域问题,根据街拍图准确找出卖家图.创新点:1.开源了一个street2shop数据集。2.训练了一个计算相似度...
2019-09-12 10:01:22
654
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人