gxiaoyaya-优快云博客

转载 opencv几何形状提取

几何形状识别（识别三角形、四边形/矩形、多边形、圆）计算几何形状面积与周长、中心位置提取几何形状的颜色在具体代码实现与程序演示之前，我们先要搞清楚一些概念。一：基本概念与函数介绍1. 轮廓(contours)什么是轮廓，简单说轮廓就是一些列点相连组成形状、它们拥有同样的颜色、轮廓发现在图像的对象分析、对象检测等方面是非常有用的工具，在OpenCV中使用轮廓发现相关函数...

2019-06-10 10:40:05 5287 1

原创 python 语音加窗分帧

from__future__importdivisionfromscikits.talkboximportsegment_axisimportnumpy as npimportsoundfile as sfdefreadwav(fn):signal, sampleRate=sf.read(fn)signal-=np.mean(...

2019-04-28 20:22:44 2408

转载 GAN 中Loss函数精讲

GANs有生成器Generator和辨别器Discriminator组成，基本的结构图如下：GANs结构示意图工作原理　　我们通常使用两个优化算法来训练GANs。判别器是一个普通的神经网络分类器，训练的过程中，我们使用辨别器 (discriminator) 学习引导生成器。　　判别器：　　在训练的过程中，我们向辨别器discriminator输入的数据一...

2019-04-28 16:20:53 20884 4

原创 tf.squared_difference和tf.reduce_mean

tf.squared_difference是两个张量之间的差，tf.squared_differencesquared_difference( x, y, name=None)功能说明：计算张量 x、y 对应元素差平方参数列表：参数名必选类型说明 x 是张量是 half, float32, float64, int32, ...

2019-04-04 10:27:48 1961

转载 tf.ConfigProto()函数的用法

tf.ConfigProto()函数用在创建session的时候，用来对session进行参数配置：config = tf.ConfigProto(allow_soft_placement=True, allow_soft_placement=True)config.gpu_options.per_process_gpu_memory_fraction = 0.4 #占用40%...

2019-04-03 17:04:20 7255

转载有趣的深度学习项目

karpathy/char-rnn · GitHub ：一个基于RNN的文本生成器。可以自动生成莎士比亚的剧本或者shell代码。https://github.com/karpathy/char-rnnphunterlau/wangfeng-rnn · GitHub ：基于char-rnn的汪峰歌词生成器https://github.com/phunterlau/wangfeng-rnn...

2019-04-02 16:46:06 2939

要说最近几年在深度学习领域最火的莫过于生成对抗网络，即 Generative Adversarial Networks(GANs)了。它是 Ian Goodfellow 在 2014 年发表的，也是这四年来出现的各种 GAN 的变种的开山鼻祖了，下图表示这四年来有关 GAN 的论文的每个月发表数量，可以看出在 2014 年提出后到 2016 年相关的论文是比较少的，但是从 2016 年，或者是 2...

2019-03-22 10:16:22 322

转载 python处理语音，批量加噪声。

#coding=gbkimport osimport waveimport librosaimport numpy as np def add_noise(data): wn = np.random.normal(0,1,len(data)) data_noise = np.where(data != 0.0, data.astype('float64...

2018-12-22 19:33:58 6097 4

转载 tensorflow中的卷积和反卷积

介绍惯例先展示函数：tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)除去name参数用以指定该操作的name，与方法有关的一共五个参数：input：指需要做卷积的输入图像，它要求是一个Tensor，具有[batch, in_height, in_width, in_chan...

2018-12-19 16:40:10 348

转载 tensorflow中的sess线程

TensorFlow的Session对象是支持多线程的，可以在同一个会话（Session）中创建多个线程，并行执行。在Session中的所有线程都必须能被同步终止，异常必须能被正确捕获并报告，会话终止的时候，队列必须能被正确地关闭。TensorFlow提供了两个类来实现对Session中多线程的管理：tf.Coordinator和 tf.QueueRunner，这两个类往往一起使用。 C...

2018-12-17 22:25:23 1293

转载 tfrecord的生成和读取

概述关于Tensorflow读取数据，官网给出了三种方法：供给数据(Feeding)：在TensorFlow程序运行的每一步，让Python代码来供给数据。从文件读取数据：在TensorFlow图的起始，让一个输入管线从文件中读取数据。预加载数据：在TensorFlow图中定义常量或变量来保存所有数据(仅适用于数据量比较小的情况)。对于数据量较小而言，可能一般选择直接将...

2018-12-14 16:46:30 487

转载 Python命令行解析argparse常用语法

python中的命令行解析最简单最原始的方法是使用sys.argv来实现，更高级的可以使用argparse这个模块。argparse从python 2.7开始被加入到标准库中，所以如果你的python版本还在2.7以下，那么需要先手动安装。基本使用import argparseparser=argparse.ArgumentParser()parser.add_argument("e...

2018-12-14 10:16:54 298

转载 Python 音频相关处理和运算

1、批量读取.wav文件名： 1 2 3 4 5 6 import os filepath = "./data/" #添加路径 filename= os.listdir(filepath) #得到文件夹下的所有文件名称 for file in filename: print...

2018-12-07 17:33:50 4145 3

转载人脸识别--训练一个认识我的神经网络

这段时间正在学习tensorflow的卷积神经网络部分，为了对卷积神经网络能够有一个更深的了解，自己动手实现一个例程是比较好的方式，所以就选了一个这样比较有点意思的项目。项目的github地址:github 喜欢的话就给个Star吧。想要她认得我，就需要给她一些我的照片，让她记住我的人脸特征，为了让她区分我和其他人，还需要给她一些其他人的照片做参照，所以就需要两组数据集来让她学习，如果想让...

2018-11-05 14:35:34 2162

原创怎么样下载和使用VS的帮助文档

VS的帮助使用方法

2017-11-27 14:44:15 7316

转载 window10+tensorflow+Faster-RCNN

（1）基本的配置，可以去百度，包括tensorflow numpy scipy Image什么的，注意安装顺序，和包的安装方式，最好都pip install 从这里下载相应的wel，http://www.lfd.uci.edu/~gohlke/pythonlibs/，然后安装（2）在https://github.com/dBeker/Faster-RCNN-

2017-10-27 12:03:42 2723 1

转载 windows10编译 Pycocotools出错解决方案

2017-10-27 11:58:19 47228 31

转载 glViewport()函数和glOrtho()函数的理解

在OpenGL中有两个比较重要的投影变换函数，glViewport和glOrtho.glOrtho是创建一个正交平行的视景体。一般用于物体不会因为离屏幕的远近而产生大小的变换的情况。比如，常用的工程中的制图等。需要比较精确的显示。而作为它的对立情况, glFrustum则产生一个透视投影。这是一种模拟真是生活中，人们视野观测物体的真实情况。例如：观察两条平行的火车到，在过了很远之后，这两条

2017-07-14 16:28:54 404

转载 opengl坐标系

了解坐标系是绘制图形的基础。在使用openGL的场景中，有世界坐标，局部坐标，纹理坐标，和屏幕坐标几种。openGL 坐标系：分3个轴，x,y,z 中心点为o, 箭头方向为正方向，最大与最小值为1和-1，这是经过归一化处理的。这样设计是为了显卡计算方便。屏幕坐标系，就是应用在设备屏幕上的坐标系。也就是图形最终绘制的地方。左上

2017-07-14 15:54:04 554

原创 qt鼠标如何控制和响应

//鼠标按下事件void QWidget::mousePressEvent(QMouseEvent *event){QString str="("+QString::number(event->x())+","+QString::number(event->y())+")";// ui->lineEdit->setText(tr("鼠标按下")+str);if(event->b

2017-07-14 15:51:30 1508

转载加密问题一步接一步

随着电子商务的迅速发展，信息安全已成为焦点问题之一，尤其是网上支付和网络银行对信息安全的要求显得更为突出。为了能在因特网上开展安全的电子商务活动，公开密钥基础设施（ PKI, Public Key Infrastructure ）逐步在国内外得到广泛应用。我们是否真的需要 PKI ， PKI 究竟有什么用？下面通过一个案例一步步地来剖析这个问题 : 甲想将一份合同文件通过 Internet 发给远

2017-06-29 15:14:06 417

原创语音识别之——mfcc什么是汉明窗，为什么加汉明窗

为什么要加汉明窗？什么叫加窗？在信号处理中，可以说加窗处理是一个必经的过程，因为我们的计算机只能处理有限长度的信号，因此原始信号X(t)要以T（采样时间）截断，即有限化，成为XT(t)后再进一步处理，这个过程序就是加窗处理，但什么时候用什么窗呢？这时我们就要对所需用到的函数窗做一定的了解。在平时，我们用得最多的是矩形窗，这个也很容易理解，好像我们屋子里的窗口一样，透过窗口我们可以看到外面

2017-06-21 21:08:58 16417 4

原创语音识别之----什么是语音识别中的mfcc（包括代码）

最近研究语音识别，我说的语音识别不包括语意的识别，是针对说话人的识别，即利用语音进行身份认证，说话人识别力求将语音信号中语意信息平均化，突出个性。但不论是何种第一步所需要做的工作是获得语音中包含的特征。比较常用的特征包括mfcc。所以这一节讲一下什么是mfcc特征，如何提取mfcc特征。mfcc特征全称为Mel频率倒谱系数（Mel-Frequency Ceptral

2017-06-21 20:01:31 14459 1

转载说话人识别概述

又称为话者识别，通过对说话人语音信号的分析处理，自动确认是别人是否在所记录的话者集合中，以及进一步确认说话人是谁。和语音识别技术很相似，都是在提取原始语音信号中某些特征参数的基础上，建立相应的参考模板或模型，然后按照一定的判决规则进行识别。语音识别中，尽可能将不同人说话的差异归一化；说话人识别中，力求通过将语音信号中的语义信息平均化，挖掘出包含在语音信号中的说话人的个性因素，强调不同人之间

2017-06-21 11:09:42 8193

转载 MATLAB 滤波函数的源代码

目前比较经典的图像去噪算法主要有以下三种：均值滤波算法：也称线性滤波，主要思想为邻域平均法，即用几个像素灰度的平均值来代替每个像素的灰度。有效抑制加性噪声，但容易引起图像模糊，可以对其进行改进，主要避开对景物边缘的平滑处理。 [cpp] view plaincopy%x是需要滤波的图像,n是模板大小(即n×n) function

2017-05-24 13:52:51 6359

转载 matlab中plot()函数用法大全

plot() 函数是绘制二维图形的最基本函数，它是针对向量或矩阵的列来绘制曲线的。使用plot 函数之前，必须首先定义好曲线上每一点的x 及y 坐标.下面简单介绍!工具/原料matlab2012b+win7.8方法/步骤1 plot(x) 当x 为一向量时，以x 元素的值为

2017-05-23 11:03:46 41103 1

转载 matlab中曲线拟合的函数

曲线拟合实例：温度曲线问题气象部门观测到一天某些时刻的温度变化数据为：t012345678910T131517

2017-05-23 10:22:36 19475

原创 matlab字体忽然变小解决办法

点击“主页——预设——字体——自定义——桌面工具——探查器和比较工具/命令行窗口/命令历史纪录——自定义——字体设为14——应用——确定——重启matlab

2017-05-23 09:55:36 14025

转载 CvMat，Mat和IplImage之间的转化和拷贝

1、CvMat之间的复制//注意：深拷贝 - 单独分配空间，两者相互独立 CvMat* a; CvMat* b = cvCloneMat(a); //copy a to b 2、Mat之间的复制//注意：浅拷贝 - 不复制数据只创建矩阵头，数据共享（更改a,b,c的任意一个都会对另外2个产生同样的作用）Mat a;Mat b = a; //a "

2017-05-18 16:09:56 405

原创 OpenCV创建图像并显示图像的例子

#include "cv.h"#include "cxcore.h"#include "highgui.h"#include //包含需要用到的库文件#pragma comment(lib, "cv.lib")#pragma comment(lib, "cxcore.lib")#pragma comment(lib, "highgui.lib")//

2017-05-18 15:46:17 3131

转载 opencv环境配置----入门款

大致描述一下步骤吧：一、安装前准备1、VS2012（网上看到很多用的VS2010，但是基本不影响）2、OpenCV 安装包（我下载的是最新的2.4.9）二、安装OpenCV 1、解压OPenCV 说是安装，其实就是解压，OpenCV的Windows安装程序就是一个自解压程序:这里我解压到C:\Progra

2017-05-18 14:40:19 294

转载 OpenCV中的DFT和iDFT的详细代码及注释

这次介绍下OpenCV中DFT的使用，对应的例程是(EXAMPLE) dft。在图像处理领域，通过DFT可以将图像转换到频域，实现高通和低通滤波；还可以利用矩阵的卷积运算等同于其在频域的乘法运算从而优化算法降低运算量，即先将图像转换到频域，然后做完乘法运算后，再转换到图像域，opencv中的模板匹配就利用了这一特性降低运算量。下面是dft例程的源码[cpp]

2017-05-18 11:06:23 15340 1

转载 OpenCV实现傅里叶变换,通过直线检测矫正文本

先给出代码，再详细解释一下过程：123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919

2017-05-18 11:05:19 1921 1

转载 c++调用matlab生成的Dll动态连接库

点击打开链接http://download.youkuaiyun.com/detail/nuptboyzhb/4228429c++调用matlab生成的Dll动态连接库实验平台： matlab 7.0(R2009a) VC++6.0思路：1. 设置matlab的编译器，使用外部的VC或者gcc等编译器。 2. 编译m文件成dll 3. 设置VC的Include路径和

2017-04-13 16:17:36 665

转载 vs2010调用matlab2011下的.m文件

很幸运在网上找到了采用引擎的方法，用vs2009调用matlab2008下的.m文件；但个人的环境是vs2010+matlab2011;想着二者差不多，故将s2010调用matlab2008拿来试试；实验环境：Win7MATLAB 2009b（安装路径：E:/Program Files/MATLAB/R2009a）VS2008 中文版（安装路径：E:/Program

2017-04-12 15:47:25 969

转载 matlab2012b与VS2012混编总结（4）——配置VS2012工作环境

注意：最终的最终发现，matlab2012b虽然可以生成链接库等，vs2012也能调用，但是执行不了，找了好久也没有找到好的解决办法，最后改用matlab2013a，它可以直接识别vs2012的编译器，不需要添加别的文件什么的，其他的和以下所写的一样。或者用matlab2010b和vs2010也可以完美匹配哦！！！在MATLAB编译器的努力下，终于生成了我们需要的

2017-04-12 15:41:48 1048

转载 matlab2012b与VS2012混编总结（3）——关于用mcc指令生成的文件集中没有ctf文件

注意：最终的最终发现，matlab2012b虽然可以生成链接库等，vs2012也能调用，但是执行不了，找了好久也没有找到好的解决办法，最后改用matlab2013a，它可以直接识别vs2012的编译器，不需要添加别的文件什么的，其他的和以下所写的一样。或者用matlab2010b和vs2010也可以完美匹配哦！！！在上一篇博文中，我尝试了很多方法和解决方案，最终成功的在matla

2017-04-12 15:41:00 1518 1

转载 matlab2012b与VS2012混编总结（2）——将.m文件编译成dll和lib库文件过程中遇到的问题及解决办法

注意：最终的最终发现，matlab2012b虽然可以生成链接库等，vs2012也能调用，但是执行不了，找了好久也没有找到好的解决办法，最后改用matlab2013a，它可以直接识别vs2012的编译器，不需要添加别的文件什么的，其他的和以下所写的一样。或者用matlab2010b和vs2010也可以完美匹配哦！！！在我的上一篇博文《 matlab2012b与VS2012混编总结（

2017-04-12 15:39:48 1739

转载 matlab2012b与VS2012混编总结（1）——将.m文件编译成dll和lib库文件

注意：最终的最终发现，matlab2012b虽然可以生成链接库等，vs2012也能调用，但是执行不了，找了好久也没找到好的解决办法，最后改用matlab2013a，它可以直接识别vs2012的编译器，不需要添加别的文件什么的，其他的和以下所写的一样。或者用matlab2010b和vs2010也可以完美匹配哦！！！折腾了两天，终于实现了我想要的结果：将.m文件通过m

2017-04-12 15:38:04 1473

转载法打开包括文件:“GLES2/gl2.h”: No such file or directory

法打开包括文件:“GLES2/gl2.h”: No such file or directory

2017-04-06 15:17:35 2150

空空如也

空空如也