工作中的图像处理实践_乔木mq的博客-优快云博客

工作中的图像处理实践

更新中

文章平均质量分 60

工作中的图像处理实践

文章数：13 文章阅读量：53064 文章收藏量：244

作者: 乔木mq

计算机硕士|算法专家|10+经验

展开

专栏收录文章

keras-yolo3遇到的一些注意点与解决思路

最近在使用yolo3（参考源码：https://github.com/qqwweee/keras-yolo3）做目标检测，在此记录下遇到的若干问题。（keras-yolo3源码分析已经满天飞，不重复解读）问题1：原始的yolo3源码，data_generator过程和模型train过程是阻塞式的，模型train速度会受到data产生的影响解决思路：单独开一个thread，将data_g...

原创 2018-11-02 10:43:39 · 7809 阅读 · 8 评论
深度学习图像处理deep_dream算法总结

深度学习（正向传播即分类，反向传播即生成）：1、经过训练后每一层都会逐步提取图像的更高层次特征，直到最后一层基本上决定图像显示的内容。2、特征变化趋势：边缘和拐角（轮廓） => 整体的特征（文理和笔触等） => 越来越多的复杂特征deep_drean的整体思想：输入任务无关的图片，通过网络提取特征，反向传播更新图片中的像素点（非新网络参数），不断迭代让网络越来越相信...

原创 2018-11-25 12:16:46 · 2367 阅读 · 0 评论
图卷积网络的理解

最近工作涉及到图像识别，属于轮廓式的图像（非猫狗这些丰富色彩的的object，而是类似建筑图这种），恰好用到GCN。图像识别是目前的一个研究热点，基于CNN模型在很多图像识别领域有比较好的效果，但在非二维方格或三维方格、轮廓式的图像领域也可以尝试其他方法，比如GCN（graph convolution network）。这里汇总下GCN所涉及的相关知识点，做一个总结！A：代表邻接矩阵，...

原创 2019-05-03 09:58:21 · 2028 阅读 · 0 评论
python库PIL抛出No space left on device和Too many open files

使用Python PIL Image.open读取大量图片时候，遇到“OSError: [Errno 28] No space left on device”等问题，总结下问题：1、“Too many open files”问题原因：PIL的Image.open操作是lazy operation（类似Spark的tranform操作，即只是保存操作流程，需要调用action操作后才真正执行...

原创 2019-07-05 11:45:50 · 1962 阅读 · 0 评论
Spatial Transformer Network (STN)原文解读

最近在研究attention机制，这篇是发表于16年的一篇涉及Attention机制的paper。提出的原因：（1）现有的CNN结构对空间不变形的处理能力较弱（2）希望根据文理和形状就可以区分object的方位和部分变形（3）max-pooling具有一定的空间不变形能力，但是局部的，而且只限制在高层次的cnn和max-pooling层，中间层无法获取空间转换能力。（某种程度来说，...

原创 2019-07-08 23:00:42 · 668 阅读 · 0 评论
mobilenet_v1总结

陆陆续续学习深度学习已经快1年，接下来总结各个模型的优缺点~1、目的：1）大多数图像识别模型精度很高，但参数较大，模型较大，不适合在嵌入式设备中使用。2）小数的小模型还不够小（参数小、运算量少、精度高），而且不关注speed。2、现有方法1）实现小模型的方法：压缩预训练模型、直接设计小模型结构2）直接设计小模型结构：Flattened network、Xception...

原创 2019-07-31 15:43:19 · 2313 阅读 · 0 评论
图片像素、尺寸、位深度、图像色深

1、概念解释图像像素：图像的分辨力，也就是图像的宽和高分别有多少个像素。图像尺度（图像的输出尺寸）：图像的物理单位，比如宽和高是多少英寸或者厘米。位深度：存储图片一个像素需要消耗多少个bit位。图像色深：图像的一个像素可以表示多少个bit的颜色。通道：不同格式图片存储像素的方式，RGB图像的通道为3，灰度图像的通道为1.dpi：dots per inch，每英寸点数目（每英...

原创 2019-12-01 21:40:31 · 16288 阅读 · 1 评论
傅里叶变换的几个概念

时域和频域卷积定理：提供了时域和频域的转换方式，卷积是一种复杂运算，在一个域的卷积转为另一个域的乘法，简化运算。什么是卷积：时不变系统在t时刻的输出，和t时刻之前的历史输入s（s<t）有关，且各个历史时刻s输入对t时刻输出的影响力衰减。傅里叶变换相关的几种变换的关系：FT、DTFT、DFT、FFT、IDFT、DFS。FT作用于模拟信号（连续信号）DTFT作用于离散信号（采样于模拟信号），输出仍是连续DFT作用于离散信号，但输出是离散，即输入和输出都是离散的，适合..

原创 2021-02-18 15:33:08 · 744 阅读 · 2 评论
图像风格迁移总结

图像分割迁移总体上分类2大类：基于优化的方法和基于decoder的方法。下面按照发展阶段梳理：文理合成的第一篇论文《Texture Synthesis by Non-parametric Sampling》非参数化的暴力求解法-------------------------------------------------------------------------------------------《Image style transfer using convolutional ne

原创 2021-03-29 09:08:58 · 3786 阅读 · 1 评论
Pillow和OpenCV的Python图像处理库你都用过了吗？

说到Pillow就不得不提到一个更早的Python图像库PIL（Python Imaging Library），PIL由于各种原因停止研发，Pillow作为PIL的派生分支、衍生品，功能更加强大，已经成为深度学习图像处理的标配之一。2、一般而言，使用2个元素的(x, y)元组表示坐标，使用4个元素的(x1, y1, x2, y2)元组表示矩形，其中(x1, y1)为矩阵的左上角，(x2, y2)为矩阵的右下角。1、Pillow使用笛卡尔像素坐标系统，图像的坐标原点(0,0)为左上角。

原创 2023-12-29 14:24:29 · 1036 阅读 · 0 评论
深度学习图像处理：图像处理易错点

低频：颜色缓慢的变化，一般为非图像边缘部分，构成图像的主要成分。低频信息是图像的近似信息，形成图像的基本灰度等级，对图像结构的决定作用较小。1）PIL.Image、OpenCV处理图像时，原点为左上角，向左/右方向分别对x执行加/减操作，向上/下方向分别对y执行加/减操作。此外，通过对图像进行傅里叶变换，可以将图像的高频和低频分量分离出来，再对分量分别进行傅里叶逆变换得到对应分量图像。高频图像：像素值在不同位置变化很大的图像，像素值从一个值快速变化到下一个值。低频图像：像素值相对均匀或变化非常缓慢的图像。

原创 2024-01-09 09:15:08 · 614 阅读 · 0 评论
高斯模糊原理和python实现

高斯模糊是一种常见的模糊技术，相关知识点有：高斯函数、二维卷积。（一）一维高斯分布函数一维（连续变量）高斯函数形式如下，高斯函数又称“正态分布函数”：μ是分布函数的均值（或者期望），sigma是标准差。一维高斯分布函数的图形：从图可知，以x=0为中心，x取值距离中心越近，概率密度函数值越大，距离中心越远，密度函数值越小。（二）二维高斯分布函数二维高斯分布函数的形式：特别说明，当变量x和y相互独立时，则相关系数ρ=0，二维高斯分布函数可以简化为...

原创 2021-05-12 21:37:32 · 10727 阅读 · 16 评论
图像旋转python和numpy实现

给定一张图片，如何在不使用PIL、OpenCV这些库的情况下，单独使用Numpy库实现图片旋转。“talk is easy, show me the code!”常见旋转有：上下翻转、左右翻转、旋转180度、逆时针旋转90度、顺时针旋转90度。（1）上下翻转图片沿着图片中心的水平线，上下翻转，第一行调换到倒数第一行，第二行调换到倒数第二行，以此类推。python实现：# 上下翻转 = 颠倒各个行的顺序arr_up = arr[::-1, ...] # ...

原创 2021-05-09 09:35:02 · 2725 阅读 · 0 评论

工作中的图像处理实践

作者: 乔木mq

keras-yolo3遇到的一些注意点与解决思路

深度学习图像处理deep_dream算法总结

图卷积网络的理解

python库PIL抛出No space left on device和Too many open files

Spatial Transformer Network (STN)原文解读

mobilenet_v1总结

图片像素、尺寸、位深度、图像色深

傅里叶变换的几个概念

图像风格迁移总结

Pillow和OpenCV的Python图像处理库你都用过了吗？

深度学习图像处理：图像处理易错点

高斯模糊原理和python实现

图像旋转python和numpy实现