乔木mq
计算机硕士|算法专家|10+经验
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
keras-yolo3遇到的一些注意点与解决思路
最近在使用yolo3(参考源码:https://github.com/qqwweee/keras-yolo3)做目标检测,在此记录下遇到的若干问题。(keras-yolo3源码分析已经满天飞,不重复解读)问题1:原始的yolo3源码,data_generator过程和模型train过程是阻塞式的,模型train速度会受到data产生的影响解决思路:单独开一个thread,将data_g...原创 2018-11-02 10:43:39 · 7809 阅读 · 8 评论 -
深度学习图像处理deep_dream算法总结
深度学习(正向传播即分类,反向传播即生成):1、经过训练后每一层都会逐步提取图像的更高层次特征,直到最后一层基本上决定图像显示的内容。2、特征变化趋势:边缘和拐角(轮廓) => 整体的特征(文理和笔触等) => 越来越多的复杂特征deep_drean的整体思想: 输入任务无关的图片,通过网络提取特征,反向传播更新图片中的像素点(非新网络参数),不断迭代让网络越来越相信...原创 2018-11-25 12:16:46 · 2367 阅读 · 0 评论 -
图卷积网络的理解
最近工作涉及到图像识别,属于轮廓式的图像(非猫狗这些丰富色彩的的object,而是类似建筑图这种),恰好用到GCN。图像识别是目前的一个研究热点,基于CNN模型在很多图像识别领域有比较好的效果,但在非二维方格或三维方格、轮廓式的图像领域也可以尝试其他方法,比如GCN(graph convolution network)。这里汇总下GCN所涉及的相关知识点,做一个总结!A:代表邻接矩阵,...原创 2019-05-03 09:58:21 · 2028 阅读 · 0 评论 -
python库PIL抛出No space left on device和Too many open files
使用Python PIL Image.open读取大量图片时候,遇到“OSError: [Errno 28] No space left on device”等问题,总结下问题:1、“Too many open files”问题原因:PIL的Image.open操作是lazy operation(类似Spark的tranform操作,即只是保存操作流程,需要调用action操作后才真正执行...原创 2019-07-05 11:45:50 · 1962 阅读 · 0 评论 -
Spatial Transformer Network (STN)原文解读
最近在研究attention机制,这篇是发表于16年的一篇涉及Attention机制的paper。提出的原因:(1)现有的CNN结构对空间不变形的处理能力较弱(2)希望根据文理和形状就可以区分object的方位和部分变形(3)max-pooling具有一定的空间不变形能力,但是局部的,而且只限制在高层次的cnn和max-pooling层,中间层无法获取空间转换能力。(某种程度来说,...原创 2019-07-08 23:00:42 · 668 阅读 · 0 评论 -
mobilenet_v1总结
陆陆续续学习深度学习已经快1年,接下来总结各个模型的优缺点~1、目的:1)大多数图像识别模型精度很高,但参数较大,模型较大,不适合在嵌入式设备中使用。2)小数的小模型还不够小(参数小、运算量少、精度高),而且不关注speed。2、现有方法1)实现小模型的方法:压缩预训练模型、直接设计小模型结构2)直接设计小模型结构:Flattened network、Xception...原创 2019-07-31 15:43:19 · 2313 阅读 · 0 评论 -
图片像素、尺寸、位深度、图像色深
1、概念解释图像像素:图像的分辨力,也就是图像的宽和高分别有多少个像素。图像尺度(图像的输出尺寸):图像的物理单位,比如宽和高是多少英寸或者厘米。位深度:存储图片一个像素需要消耗多少个bit位。图像色深:图像的一个像素可以表示多少个bit的颜色。通道:不同格式图片存储像素的方式,RGB图像的通道为3,灰度图像的通道为1.dpi:dots per inch,每英寸点数目(每英...原创 2019-12-01 21:40:31 · 16288 阅读 · 1 评论 -
傅里叶变换的几个概念
时域和频域卷积定理:提供了时域和频域的转换方式,卷积是一种复杂运算,在一个域的卷积转为另一个域的乘法,简化运算。什么是卷积:时不变系统在t时刻的输出,和t时刻之前的历史输入s(s<t)有关,且各个历史时刻s输入对t时刻输出的影响力衰减。傅里叶变换相关的几种变换的关系:FT、DTFT、DFT、FFT、IDFT、DFS。FT作用于模拟信号(连续信号)DTFT作用于离散信号(采样于模拟信号),输出仍是连续DFT作用于离散信号,但输出是离散,即输入和输出都是离散的,适合..原创 2021-02-18 15:33:08 · 744 阅读 · 2 评论 -
图像风格迁移总结
图像分割迁移总体上分类2大类:基于优化的方法和基于decoder的方法。下面按照发展阶段梳理:文理合成的第一篇论文《Texture Synthesis by Non-parametric Sampling》非参数化的暴力求解法-------------------------------------------------------------------------------------------《Image style transfer using convolutional ne原创 2021-03-29 09:08:58 · 3786 阅读 · 1 评论 -
Pillow和OpenCV的Python图像处理库你都用过了吗?
说到Pillow就不得不提到一个更早的Python图像库PIL(Python Imaging Library),PIL由于各种原因停止研发,Pillow作为PIL的派生分支、衍生品,功能更加强大,已经成为深度学习图像处理的标配之一。2、一般而言,使用2个元素的(x, y)元组表示坐标,使用4个元素的(x1, y1, x2, y2)元组表示矩形,其中(x1, y1)为矩阵的左上角,(x2, y2)为矩阵的右下角。1、Pillow使用笛卡尔像素坐标系统,图像的坐标原点(0,0)为左上角。原创 2023-12-29 14:24:29 · 1036 阅读 · 0 评论 -
深度学习图像处理:图像处理易错点
低频:颜色缓慢的变化,一般为非图像边缘部分,构成图像的主要成分。低频信息是图像的近似信息,形成图像的基本灰度等级,对图像结构的决定作用较小。1)PIL.Image、OpenCV处理图像时,原点为左上角,向左/右方向分别对x执行加/减操作,向上/下方向分别对y执行加/减操作。此外,通过对图像进行傅里叶变换,可以将图像的高频和低频分量分离出来,再对分量分别进行傅里叶逆变换得到对应分量图像。高频图像:像素值在不同位置变化很大的图像,像素值从一个值快速变化到下一个值。低频图像:像素值相对均匀或变化非常缓慢的图像。原创 2024-01-09 09:15:08 · 614 阅读 · 0 评论 -
高斯模糊原理和python实现
高斯模糊是一种常见的模糊技术,相关知识点有:高斯函数、二维卷积。(一)一维高斯分布函数一维(连续变量)高斯函数形式如下,高斯函数又称“正态分布函数”:μ是分布函数的均值(或者期望),sigma是标准差。一维高斯分布函数的图形:从图可知,以x=0为中心,x取值距离中心越近,概率密度函数值越大,距离中心越远,密度函数值越小。(二)二维高斯分布函数二维高斯分布函数的形式:特别说明,当变量x和y相互独立时,则相关系数ρ=0,二维高斯分布函数可以简化为...原创 2021-05-12 21:37:32 · 10727 阅读 · 16 评论 -
图像旋转python和numpy实现
给定一张图片,如何在不使用PIL、OpenCV这些库的情况下,单独使用Numpy库实现图片旋转。“talk is easy, show me the code!”常见旋转有:上下翻转、左右翻转、旋转180度、逆时针旋转90度、顺时针旋转90度。(1)上下翻转图片沿着图片中心的水平线,上下翻转,第一行调换到倒数第一行,第二行调换到倒数第二行,以此类推。python实现:# 上下翻转 = 颠倒各个行的顺序arr_up = arr[::-1, ...] # ...原创 2021-05-09 09:35:02 · 2725 阅读 · 0 评论
分享