
图像处理和deeplearning
zj360202
这个作者很懒,什么都没留下…
展开
-
图像处理(一)图像及其表达与性质
名词连续,离散和数字图像原创 2014-07-14 10:10:24 · 1775 阅读 · 0 评论 -
【Tensorflow slim】slim losses包
损失函数定义了我们想要最小化的数量。 对于分类问题,这通常是跨分类的真实分布和预测概率分布之间的交叉熵。 对于回归问题,这通常是预测值和真值之间的平方和差异。某些模型(如多任务学习模型)需要同时使用多个损失函数。 换句话说,最终被最小化的损失函数是各种其他损失函数的总和。 例如,考虑预测图像中的场景类型以及每个像素的相机深度的模型。 这个模型的损失函数将是分类损失和深度预测损失的总和。原创 2017-11-21 17:27:30 · 6577 阅读 · 0 评论 -
【Tensorflow slim】slim layers包
tensorflow的操作符集合是十分广泛的,神经网络开发者通常会以更高层的概念,比如"layers", "losses", "metrics", and "networks"去考虑模型。一个层,比如卷积层、全连接层或bn层,要比一个单独的tensorflow操作符更抽象,并且通常会包含若干操作符。此外,和原始操作符不同,一个层经常(不总是)有一些与自己相关的变量(可调参数)。例如,在神经网络原创 2017-11-21 16:13:41 · 2478 阅读 · 0 评论 -
ROI Pooling层解析_代码原理详细解释和存在目的
ROIs Pooling顾名思义,是pooling层的一种,而且是针对ROIs的pooling;整个 ROI 的过程,就是将这些 proposal 抠出来的过程,得到大小统一的 feature map。什么是ROI呢?ROI是Region of interest的简写,指的是faster rcnn结构中,经过rpn层后,产生的proposal对应的box框。原创 2017-12-19 18:59:40 · 10447 阅读 · 3 评论 -
深入浅出——网络模型中Inceptionv1到 v4 的作用与结构全解析
深入浅出——网络模型中Inception的作用与结构全解析转载地址http://blog.youkuaiyun.com/u010402786目录(?)[+]一 论文下载 本文涉及到的网络模型的相关论文以及下载地址: [v1] Going Deeper with Convolutions, 6.67%转载 2017-11-24 15:51:35 · 1710 阅读 · 0 评论 -
【人脸检测】学界 | 中科院自动化研究所提出 FaceBoxes:实时、高准确率的 CPU 面部检测器
选自 arXiv机器之心编译参与:Panda要想用神经网络有效地进行面部检测等操作,往往需要 GPU 等高速并行的计算设备。如果仅使用 CPU,往往会遇到速度与准确度不能兼得的困境。为了解决这个问题,中国科学院自动化研究所和中国科学院大学的研究者提出了一种名叫 FaceBoxes 的新方法,在保证了 CPU 面部识别的准确度的同时,还做到了实时处理。机器之心对该研究进行了摘转载 2017-12-28 10:18:20 · 2211 阅读 · 0 评论 -
【人脸检测】SSH: Single Stage Headless Face Detector
SSH: Single Stage Headless Face Detector ICCV2017 https://github.com/mahyarnajibi/SSH本文的人脸检测算法走的是又快又好的路子,类似于目标检测中的 SSD算法思路。时间上面用GPU 800x1200 100ms/f SSH is designed to decrease infer转载 2017-12-28 10:26:48 · 1785 阅读 · 0 评论 -
pygal输出png问题:dlopen() failed to load a library: cairo / cairo-2
背景最近一个比较棘手的问题,需要python程序可以直接根据数据生成图片。而之前做数据可视化,无论是echart还是其他和js相关的可视化库,都是通过js在浏览器中生成交互图像的。都不能直接生成图片,而py最常用的Matplotlib虽然数据图像准确度够了,但是美化太麻烦……最后找了一圈,发现了pygal这个,能生成本地图片美化程度也不错的库……然后又坑了pygal的坑py转载 2018-01-17 17:20:17 · 1331 阅读 · 2 评论 -
利用 TensorFlow 高级 API Keras 实现 MLP,CNN,LSTM
TensorFlow 代码长,不好读,不好理解,这可能是很多初学者的痛。在一些开发者努力下基于 TF 构建了更高级的 API,无需再用冗长难记的底层 API 构建模型。在众多高级 API 中,Keras 和 TFLearn 较为流行。我们前面文章《利用 TFLearn 快速搭建经典深度学习模型》介绍了 TFLearn 高级 API,今天内容可以作为对照进行学习。转载 2018-01-17 17:21:18 · 2253 阅读 · 0 评论 -
如何用 TensorFlow 实现 OCR
OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息转载 2018-01-17 17:21:59 · 13654 阅读 · 1 评论 -
【opencv】图像的二值化之python+opencv
定义:图像的二值化,就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。 一幅图像包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群。这是研究灰度变换的最特殊的方法,称为图像的二值化(Binarization)。转载 2018-01-25 19:42:12 · 9012 阅读 · 2 评论 -
【opencv】Opencv(Python) 教程-轮廓(1)查找与绘制轮廓
目标:1.理解什么是轮廓2.学习找轮廓,绘制轮廓等3.学习函数:cv2.findContours(),cv2.drawContours()什么是轮廓轮廓可以简单认为成将连续的点(连着边界)连在一起的曲线,具有相同的颜色或者灰度。轮廓在形状分析和物体的检测和识别中很有用。 为了更加准确,要使用二值化图像。在寻找轮廓之前,要进行阈值化处理或者 Canny转载 2018-01-26 11:18:41 · 1700 阅读 · 0 评论 -
【opencv】Opencv(Python) 教程-轮廓(2)轮廓特征求取
目标查找轮廓的不同特征,例如面积,周长,重心,边界框等,这些特征在未来的图像识别中,会大量的用到。矩的概念图像识别的一个核心问题是图像的特征提取,简单描述即为用一组简单的数据(图像描述量)来描述整个图像,这组数据越简单越有代表性越好。良好的特征不受光线、噪点、几何形变的干扰。图像识别发展几十年,不断有新的特征提出,而图像不变矩就是其中一个。矩是概率与转载 2018-01-26 11:19:49 · 4429 阅读 · 0 评论 -
【opencv】Opencv(Python) 教程-轮廓(3)轮廓的性质
边界矩形的宽高比在上一小节中,我们提到利用下面函数能够得到轮廓的直边界矩形 x,y,w,h = cv2.boundingRect(cnt) 对于某一轮廓要求取其边界矩形的宽高比,则可通过下面代码实现x,y,w,h = cv2.boundingRect(cnt)aspect_ratio = float(w)/h #注意要转化成浮点型12轮廓面积与边界矩形面积的比ar转载 2018-01-26 11:20:55 · 971 阅读 · 0 评论 -
【opencv】Opencv(Python) 教程-轮廓(4)凹缺陷(凸缺陷)/点与轮廓关系/形状匹配
凹缺陷/凸缺陷前面我们已经学习了轮廓的凸包,对象上的任何凹陷都被成为凸缺陷。OpenCV 中有一个函数 cv.convexityDefect() 可以帮助我们找到凸缺陷。函数调用如下:[python] view plain copyimport cv2 import numpy as np img = cv2.imread转载 2018-01-26 11:21:55 · 7359 阅读 · 0 评论 -
【opencv】opencv-OpenCV中的图像处理 [2]-OpenCV中的轮廓
参考:1、http://docs.opencv.org/3.3.0/ 官方文档api2、http://docs.opencv.org/3.3.0/d6/d00/tutorial_py_root.html 官方英文教程3、https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_tutor转载 2018-01-26 11:34:55 · 857 阅读 · 0 评论 -
【keras】Keras 之父讲解 Keras:几行代码就能在分布式环境训练模型 | Google I/O 2017
雷锋网按:在上周的谷歌开发者大会 I/O 2017 的讲座中,Keras 之父 Francois Chollet 被请出来向全世界的机器学习开发者进行一场对 Keras 的综合介绍以及实战示例。说起来,这个子小小的男人不但是畅销书 《Deep learning with Python》的作者,更在 Kaggle 的数据科学家中世界排名第 17 位(最高),堪称是青年 AI 工程师中的翘楚。也因此,转载 2018-02-06 10:33:56 · 2637 阅读 · 0 评论 -
YOLOv2论文理解
YOLO9000:Better, Faster, Stronger论文YOLO9000: Better, Faster, Stronger的主要内容有三点: 1、作者提出了YOLOv2。 YOLOv2在YOLOv1的基础上,使用新的网络结构(darknet19)和技巧(Batch Normalization、High Resolution Classifier、Convolutional With...转载 2018-02-11 16:15:20 · 879 阅读 · 0 评论 -
【Tensorflow slim】slim learning包
TF-Slim在learning.py中的训练模型提供了一套简单但功能强大的工具。 这些功能包括一个训练函数可以反复测量损失,计算梯度并将模型保存到磁盘,以及用于操纵梯度的几个便利函数。 例如,一旦我们指定了模型,损失函数和优化方案,我们可以调用slim.learning.create_train_op和slim.learning.train来执行优化:g = tf.Graph()#原创 2017-11-21 16:39:09 · 8667 阅读 · 0 评论 -
【Tensorflow slim】slim evaluation 函数
TF-Slim提供一个评估模块(evaluation.py),其中包含用于使用metric_ops.py模块中的指标编写模型评估脚本的帮助函数。 这些功能包括定期运行评估,评估各批数据的指标以及打印和汇总度量结果。 例如:import tensorflow as tfslim = tf.contrib.slim# Load the dataimages, labels = load_原创 2017-11-21 15:48:23 · 4701 阅读 · 0 评论 -
VS2013 编译程序时报无法加载PDB文件错误解决方案
vs2013运行c++出现:无法查找或打开 PDB 文件。“ConsoleApplication1.exe”(Win32): 已加载“C:\Users\hp\Documents\Visual Studio 2013\Projects\ConsoleApplication1\Debug\ConsoleApplication1.exe”。已加载符号。“ConsoleApplication原创 2014-08-19 10:37:01 · 22093 阅读 · 0 评论 -
OpenCV 2.4.9 +VS2013 开发环境配置
OpenCV的全称是:Open Source Computer Vision Library。OpenCV是一个基于(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。现本教程,是在w原创 2014-08-19 10:00:50 · 2268 阅读 · 0 评论 -
三大物体识别算法--SIFT/SURF、haar特征、广义hough变换的特性深入剖析
(参考优快云博主cy513的分析内容)首先,介绍一下人类是如何识别物体的:人类是如何识别一个物体的呢,当然要对面前的这个物体为何物要有一个概念,人类一生下来就开始通过视觉获取世间万物的信息,包括一种物体形状、颜色、成分等,以及通过学习认识到这种物体的其他信息比如物理的、化学的特性,这些信息是不能通过观察得到的;就这样人对一种新物就有了把握,并且物体的各种特征形成了数据存放转载 2014-11-26 16:51:06 · 4672 阅读 · 0 评论 -
图像处理中各种边缘检测的微分算子简单比较(Sobel,Robert, Prewitt,Laplacian,Canny)
不同图像灰度不同,边界处一般会有明显的边缘,利用此特征可以分割图像。需要说明的是:边缘和物体间的边界并不等同,边缘指的是图像中像素的值有突变的地方,而物体间的边界指的是现实场景中的存在于物体之间的边界。有可能有边缘的地方并非边界,也有可能边界的地方并无边缘,因为现实世界中的物体是三维的,而图像只具有二维信息,从三维到二维的投影成像不可避免的会丢失一部分信息;另外,成像过程中的光照和噪声也是不可避免转载 2014-11-26 16:48:47 · 2107 阅读 · 0 评论 -
【数字图像处理】Canny边缘检测详解及编程实现
Canny边缘检测算法一直是边缘检测的经典算法。下面详细介绍Canny边缘检测算法的原理以及编程实现。Canny边缘检测基本原理:(1)图象边缘检测必须满足两个条件:一能有效地抑制噪声;二必须尽量精确确定边缘的位置。 (2)根据对信噪比与定位乘积进行测度,得到最优化逼近算子。这就是Canny边缘检测算子。 (3)类似与Marr(LoG)边缘检测方法,也属于先平滑后求导数的方法。转载 2014-11-26 16:46:44 · 3296 阅读 · 0 评论 -
neuraltalk2将eval.lua改成一个服务 不断的增量分析图像
require 'torch'require 'nn'require 'nngraph'-- exoticsrequire 'loadcaffe'-- local importslocal utils = require 'misc.utils'require 'misc.DataLoader'require 'misc.DataLoaderRaw'require 'misc.L原创 2017-03-04 16:34:28 · 726 阅读 · 0 评论 -
python2.7+opencv2.4.10安装及对mp4的操作
准备文件:python2.7.12,下载链接https://www.python.org/downloads/pip8.1.1,下载链接https://pypi.python.org/packages/41/27/9a8d24e1b55bd8c85e4d022da2922cb206f183e2d18fee4e320c9547e751/pip-8.1.1.tar.gz#md5=6b8原创 2017-03-13 18:41:04 · 5874 阅读 · 0 评论 -
mac 安装 neuraltalk2 无gpu
网上有一些安装的说明,不过都或多或少有些遗漏,特此在这里总结一些,也许有一些步骤也是多余的,不过应该不少先上一个成果th eval.lua -model model_id1-501-1448236541.t7_cpu.t7 -image_folder ./images/ -gpuid -1 #gpuid具体步骤1.下载git clone --recursive原创 2017-03-04 16:13:42 · 974 阅读 · 2 评论 -
海康sdk运行java环境
如果系统是64位的就是64位的sdk,如果是32位就用32位的,和是什么系统没有关系,只是系统位数有关我这边是win7 64位的环境有intellij和netbeans,都调试成功了下载海康sdk就自己去官网上面下载然后解压,我的解压路径是:F:\appsoft\CH-HCNetSDK(Windows64)V5.2.3.3_build20160623一.inte原创 2017-03-30 16:37:14 · 7991 阅读 · 14 评论 -
Selective Search for Object Recognition
Selective Search for Object Recoginitionsurgewong@gmail.comhttp://blog.youkuaiyun.com/surgewong 在前一段时间在看论文相关的工作,没有时间整理对这篇论文的理解。在前面的一篇博客【1】中有提到Selective Search【2】,其前期工作利用图像分割的方转载 2017-04-27 11:28:21 · 544 阅读 · 0 评论 -
将非RGB图片转换为RGB图片
有很多场景对图片的要求是RGB 3通道的,但是在网上抓的图片或是微信得到的图片,很多不是,这样就需要将他们转换一下在caffe的应用中,可能会报OpenCV Error: Assertion failed ((scn == 3 || scn == 4) && (depth == CV_8U || depth == CV_32F)) in cvtColor, file /ssda/softw原创 2017-11-15 11:34:06 · 6169 阅读 · 0 评论 -
【Opencv】 于仕琪 人脸68个特征点分布情况
// 鼻尖 30// 鼻根 27// 下巴 8// 左眼外角 36// 左眼内角 39// 右眼外角 46// 右眼内角 42// 嘴中心 66// 嘴左角 48// 嘴右角 54// 左脸最外 0// 右脸最外 16原创 2017-11-30 12:19:47 · 9288 阅读 · 0 评论 -
【TensorFlow】tf.nn.softmax_cross_entropy_with_logits的用法
在计算loss的时候,最常见的一句话就是tf.nn.softmax_cross_entropy_with_logits,那么它到底是怎么做的呢?首先明确一点,loss是代价值,也就是我们要最小化的值tf.nn.softmax_cross_entropy_with_logits(logits, labels, name=None)除去name参数用以指定该操作的name,转载 2017-11-20 15:45:08 · 16270 阅读 · 11 评论 -
【Tensorflow】tensorflow.contrib.slim 包
TF-Slim 是Tensorflow为了定义,训练和评估复杂模型的一个轻量级工具, tf-slim的组件可以与本地tensorflow以及其他框架(如tf.contrib.learn)自由混合。github:Tersorflow/contrib/slimUsageimport tensorflow.contrib.slim as slim原创 2017-11-20 18:39:36 · 8592 阅读 · 1 评论 -
【Tensorflow slim】 slim.arg_scope的用法
arg_scope(list_ops_or_scope,**kwargs)list_ops_or_scope: 操作列表或作用域列表kwargs: 参数,以keyword=value方式显示使用实例net = slim.conv2d(inputs, 64, [11, 11], 4, padding='SAME', we原创 2017-11-21 11:11:45 · 9157 阅读 · 2 评论 -
【Tensorflow slim】slim.data包
slim.data包下面有很多对数据的操作方法;在slim.__init__种有如下几种:from tensorflow.contrib.slim.python.slim.data import data_decoderfrom tensorflow.contrib.slim.python.slim.data import data_providerfrom tensorflow.co原创 2017-11-21 12:35:58 · 3307 阅读 · 1 评论 -
【图像处理】faster-rcnn原理及相应概念解释
R-CNN --> FAST-RCNN --> FASTER-RCNN R-CNN:(1)输入测试图像;(2)利用selective search 算法在图像中从上到下提取2000个左右的Region Proposal;(3)将每个Region Proposal缩放(warp)成227*227的大小并输入到CNN,将CNN的fc7层的输出作为特征;(转载 2018-02-07 17:45:00 · 2799 阅读 · 0 评论