
图像与视频处理
文章平均质量分 55
基础的图像和视频处理方法
Wanderer001
AR/VR软件与硬件技术:图像增强、图像分类、语义分割、目标检测、目标跟踪、风格迁移、强化学习、三维重建、SLAM
展开
-
Physics-based Iterative Projection Complex Neural Network for Phase Retrievalin Lensless Microscopy
人脑识别图像: 人脑:大脑视觉皮层V1, 包含140,000,000神经元;数百亿个连接, 还有V2,V3,V4,V5,但是人脑进化几千年。 计算机识别图像: 神经元: 今天去不去...原创 2022-02-18 12:05:23 · 1130 阅读 · 0 评论 -
Python的Albumentations库
基于高度优化的 OpenCV 库实现图像快速数据增强. 针对不同图像任务,如分割,检测等,超级简单的 API 接口. 易于个性化定制. 易于添加到其它框架,比如 PyTorch.1. Albumentations 的 pip 安装sudo pip install albumentations # 或 sudo pip install -U git+https://github.com/albu/albumentations2. 不同图片数据增强库对比albumentation.原创 2022-02-28 10:44:01 · 3557 阅读 · 0 评论 -
Imgaug之导入和增强图像
在机器视觉领域,想将深度学习应用于实际工程项目,并最终落地,会遇到很多问题:光照、遮挡等。而采集到的数据通常难以满足各种现实环境,需要进行数据增强操作。 imgaug是一个基于OpenCV的更高级的API,包含很多集成好的图像增强的方法。安装方式:conda config --add channels conda-forgeconda install imgaug导入和增强图像输入的图像需要符合以下两种规格之一: 可以是4D的numpy数组,形状需要满足“NHWC”原则,即(N,原创 2022-03-07 14:24:01 · 3162 阅读 · 1 评论 -
引导图滤波(Guided Image Filtering)原理以及OpenCV实现
引导图滤波器是一种自适应权重滤波器,能够在平滑图像的同时起到保持边界的作用,具体公式推导请查阅原文献《Guided Image Filtering》以及matlab源码:http://kaiminghe.com/eccv10/index.html。这里只说一下自适应权重原理、C++实现灰度图像以及彩色图像的引导图滤波、验证结果。自适应权重原理 引导图滤波作为一种线性滤波器,可以简单定义为如下形式:其中I是引导图像(guided Image),P是输入的待滤波图像,Q是滤波后的输出图像,W是根据引导图.原创 2022-03-17 09:12:20 · 3455 阅读 · 0 评论 -
图片格式:JPG;RAW ;TIFF;PNG;GIF的解析
相信大家平时在拍摄照片的时候,一定遇到过各种各样纷繁复杂的图片格式。同时在后期处理的时候,存储图像也面临着各种不同选择。这期我们就来给大家全方位解析常用的图片格式:JPG;RAW ;TIFF;PNG;GIF干货易懂,速存哦!1、JPG关键词:常用JPG全名是JPEG,是图片的常见一种格式。支持最高级别的压缩,不过,这种压缩是有损耗的。通常来说JPG因为经过压缩,其图片体积较小,所以能得以在各大平台进行高效传播。我们平时所接触的网页浏览图基本都是JPG格式。▲JPG格式原创 2022-03-08 12:48:03 · 7506 阅读 · 0 评论 -
积分图像(Integral image)
1 问题起源给定一幅灰度图像,其灰度值如下图所示,要计算图中深色区域的所有像素点的灰度值之和。最直接,简单的方法就是将这9个像素值直接相加。如果深色区域扩大,里面包含成千上万个像素,这种算法的时间复杂度也会呈线性增加。积分图像的提出正好解决了这个问题。2 积分图像积分图像顾名思义,就是求和,完整的意思是每一个像素点的灰度值等于在该像素点之前所有像素点灰度值之和。从上方图中抽取4个像素:这4个像素点对应的在积分图像中的值为:其关系为:将.原创 2022-03-27 09:58:56 · 1633 阅读 · 0 评论 -
python PIL 打开\显示\保存图像
使用python进行数字图片处理,还得安装Pillow包。虽然python里面自带一个PIL(python images library), 但这个库现在已经停止更新了,所以使用Pillow, 它是由PIL发展而来的。pip install Pillow一、图片的打开与显示from PIL import Imageimg=Image.open('d:/dog.png')img.show()虽然使用的是Pillow,但它是由PIL fork而来,因此还是要从PIL中进行import.原创 2022-04-07 10:56:54 · 14506 阅读 · 0 评论 -
Python图像灰度变换及图像数组操作
使用python以及numpy通过直接操作图像数组完成一系列基本的图像处理numpy简介:NumPy是一个非常有名的 Python 科学计算工具包,其中包含了大量有用的工具,比如数组对象(用来表示向量、矩阵、图像等)以及线性代数函数。数组对象可以实现数组中重要的操作,比如矩阵乘积、转置、解方程系统、向量乘积和归一化。这为图像变形、对变化进行建模、图像分类、图像聚类等提供了基础。在上一篇python基本图像操作中,当载入图像时,通过调用 array() 方法将图像转换成NumPy的数组对象。N原创 2022-04-13 11:55:48 · 3495 阅读 · 0 评论 -
Python 图像拼接
import PIL.Image as Imageimport osfor i in range(2965): IMAGES_PATH = r'D:\paper\5derain\CIR\CIR_delete\pairimages\\' + str(i+427) + "\\" IMAGES_FORMAT = ['.jpg', '.JPG'] # 图片格式 IMAGE_SIZE = 1000 # 每张小图片的大小 IMAGE_ROW = 1 # 图片间隔,也就.原创 2022-04-14 09:45:33 · 1607 阅读 · 0 评论 -
python 用opencv接口把视频逐帧转化为图片
好了,接下来我要做一个实际的深度学习图像分割的小项目,项目内容是从一堆拍摄海面的图片中将白浪花分割出来,这个项目的分割只对白浪花感兴趣,所以最后应该是01分割,非黑即白。目前收到800G左右的数据,视频格式,每段大约50分钟。首先要做的就是从这些视频中把每一帧的图片导出来,变成图片。这里首先有一个小插曲,我发现我的视频格式一开始虽然是mp4,但是用普通的播放器播放不了,这就很诡异。于是我下载了完美解码,果然可以播放了。不过还是很诡异,于是我用格式工厂无损的转换成mp4格式,800G的数据也跑了整整一天时原创 2022-04-19 18:13:05 · 3152 阅读 · 0 评论 -
python 获取图片的尺寸宽高信息
# coding: utf8 from PIL import Image img = Image.open("img.jpg") print img.sizeprint img.format原创 2022-04-18 13:12:22 · 3833 阅读 · 0 评论 -
将png格式的图像转换为jpg
import osfrom PIL import Imagedirname_read="D:\dataset\cityscapes\cityscape_voc_clean\JPEGImages_png\\"dirname_write="D:\dataset\cityscapes\cityscape_voc_clean\JPEGImages_jpg\\"names=os.listdir(dirname_read)count=0for name in names: img=Image.o.原创 2022-04-23 08:17:34 · 988 阅读 · 0 评论 -
什么是棋盘效应
假设反卷积生成的图像中,包含1只黑猫,黑猫身体部分的像素颜色应该是平滑过渡的。或者极端的说,身体部分应该全部都是黑色的。而在实际生成的图像中,该部分却是由深深浅浅的近黑方块组成的,很像棋盘的网络。这就是所谓的棋盘效应。现在显著性检测还存在的一个问题就是,在像素级的视觉任务中,会出现这个棋盘效应。这个效应在深度卷积神经网络中的影响是很大的。比如:如果在FCN的输出中出现这个效应,那么这个网络的训练就...原创 2022-05-12 10:51:16 · 2053 阅读 · 0 评论 -
OpenCV使用BGR而非RGB格式
日常开发和交流时,我们习惯将图片的颜色通道按照RGB(red, green, blue)进行排列。闲来无聊,在把玩卷积神经网络模型时发现OpenCV并没有按照这个顺序读入图片。好奇地搜索一下OpenCV为什么使用BGR而非RGB。看到这篇博文:Why does OpenCV use BGR color format。仔细阅读这篇博文,作者在使用matplotlib显式OpenCV读入的图片,发...原创 2022-05-15 13:01:05 · 1328 阅读 · 0 评论 -
cv2.COLOR_BGR2RGB()
使用 cv2.cvtColor(image,cv2.COLOR_RGB2BGR)转换gif图片,但是处理完变成黑白图片。import cv2from PIL import Imageimport numpy as npimport matplotlib.pyplot as pltimage = Image.open('34f1.gif')plt.imshow(image)plt....原创 2022-06-09 23:45:28 · 20501 阅读 · 1 评论 -
PIL库、、
目录一、安装命令二、Image模块三、format类四、Mode类五、convert类六、size类七、Palette类八、Info类九、new类十、Copy 类十一、Crop类十二、Paste类十三、Filter类十四、Blend类十五、Split十六、Composite类十七、Eval类十八、Merge类十九、......原创 2022-08-15 19:57:35 · 718 阅读 · 0 评论 -
双线性插值法
双线性插值,又称为双线性内插。在数学上,双线性插值是有两个变量的插值函数的线性插值扩展,其核心思想是在两个方向分别进行一次线性插值。单线性插值法已知数据 (x0, y0) 与 (x1, y1),要计算 [x0, x1] 区间内某一位置 x 在直线上的y值。 上面比较好理解吧,......原创 2022-06-10 20:37:15 · 8652 阅读 · 0 评论 -
视频编码格式、视频码率、视频帧率、分辨率的概念
视频在我们生活中应用越来越广了,不可避免的,我们在使用视频时,会遇到一些最常见的专业术语:视频编码格式、视频码率、视频帧率、视频分辨率,这些专业术语在一个视频文件中,到底是指的什么呢?听阿酷来说说吧。编码格式:一个视频文件本身,通常由音频和视频两部分组成。例如上图的视频文件,就是由avc视频编码+AAC音频编码组成的,常见的视频编码格式有Xvid,AVC/H.264,MPEG1,MPEG2 等...原创 2022-09-02 10:23:46 · 6128 阅读 · 0 评论 -
高分二号卫星介绍及参数
高分二号卫星是我国自主研制的首颗空间分辨优于1米的民用光学遥感卫星可在遥感集市平台中查询到,搭载有两台高分辨率1米全色、4米多光谱相机,具有亚米级空间分辨率、高定位精度和快速姿态机动能力等特点,有效地提升了卫星综合观测效能,达到了国际先进水平。 高分二号卫星于8月19日成功发射,8月21日首次开机成像并下传数据。这是我国目前分辨率最高的民用陆地观测卫星,星下点空间分辨率可...原创 2022-11-18 14:13:33 · 16342 阅读 · 0 评论 -
python的skimage模块
目录一、图片信息二、skimage包的子模块三、图像像素的访问与裁剪四、图像数据类型及颜色空间转换1、unit8转float2、float转uint8五、图像的绘制六、图像的批量处理七、图像的形变与缩放1、改变图片尺寸resize2、按比例缩放rescale3、旋转rotate4、图像金字塔八、对比度与亮度调整1、gamma调整2、l...原创 2022-09-22 16:12:50 · 6092 阅读 · 1 评论 -
LANDSAT卫星的主要波段
由于电磁波谱可见光波段在所有波段中是我们最熟悉的,因此,在这一波段的车昂想应用领域远远超过其他波段。红外波段常用与与可见光相结合成像。可见光处理的另一个主要应用领域是航天遥感,通常包括可见光和红外波谱范围的一些波段。从空间获得并传送地球图像,其目的是检测星星的环境条件。波段用波长来表示,1m等于m。 ...原创 2022-12-06 17:31:07 · 9798 阅读 · 0 评论 -
什么是图像特征
常用的图像特征有:颜色特征、纹理特征、形状特征、空间关系特征。一 、颜色特征(一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不...原创 2022-12-09 00:56:19 · 7923 阅读 · 2 评论