
Computer Vision
文章平均质量分 86
ybdesire
Talk is cheap. Show me the code.
展开
-
相似图片搜索中的均值哈希(aHash)
1. 引入参考1中介绍了相似图片搜索的基本原理,借助milvus(参考2)这样的相似性搜索引擎,我们可以非常快速的实现相似性搜索。但实现搜索之前,需要把图片转换为特征向量。本文介绍的均值哈希,就是图片的一种特征。2. 均值哈希的计算过程读入图片并转换为灰度图import numpy as npimport cv2img = cv2.imread('Alyson_Hannigan_200512.jpg', cv2.IMREAD_GRAYSCALE)# IMREAD_GRAYSCALE, IM原创 2021-02-23 22:01:59 · 1262 阅读 · 0 评论 -
大规模向量相似度检索方案
1. 引入有很多指标可以用来衡量向量的相似度,比如余弦距离、汉明距离、欧氏距离等。在图像、视频、文本、音频领域,做向量的相似性搜索,有很多应用点,比如:图像识别,语音识别、垃圾邮件过滤。这种基于相似度检索的方案,不同于机器学习模型的方案。比如用有监督学习模型来做人脸识别,模型的可解释性较低,而基于相似度搜索来做人脸识别,可解释性就更高。但是,当数据量很大,比如几千万张图片,要做相似度搜索,就比较困难了。穷举法固然可行,但非常耗时。针对这种场景,本文主要介绍方案级别的信息。2. 常用方案通用的向量原创 2020-12-21 23:07:43 · 2935 阅读 · 0 评论 -
video1层不能显示完整视频的解决过程
2011-11-14写的一个DVS6446调试文档,今天突然发现,贴出来,自己备用。 用TI的例程soln07d_video_loopthru,在显示器上半部分显示很小的一块,显示花屏(完全看不清图像),但显示部分会随着摄像头的移动而变化。 不能采用这个例程进行学习,只能分步进行。首先搞定视频采集,才能进行视频显示。 视频采集,调用的是V4L2驱动,使用soln07b...原创 2013-01-10 20:58:15 · 3333 阅读 · 0 评论 -
学完deeplearning.ai的Course1和Course4
文章目录说明学习过程中写的文章Course1: Neural Networks and Deep Learning内容与学习过程记录Course4:Convolutional Neural Networks内容与学习过程记录说明从2018年开始,断断续续在网易云课堂学完了吴恩达在deeplearning.ai讲授的两门经典课,记录一下:Course1:《神经网络和深度学习》,Neural ...原创 2019-06-14 22:23:58 · 287 阅读 · 0 评论 -
YOLO算法(Bounding Box)目标检测
Abstract在《基于深度学习的目标检测思路》中,提到了可以用滑动窗口的思路来做目标检测。除了滑动窗口,还有其他的目标检测算法吗?目标检测介绍传统的目标检测算法,都是基于滑动窗口,训练模型的,如下图所示。该方法对目标的标注,需要标注目标的位置、大小、类型等信息,标注成本是很高的。但是,做目标检测是少不了这个标注工作的。 这种传统的滑动窗口目标检测方法,最大的缺点是: 窗口大...原创 2018-07-26 20:53:09 · 21291 阅读 · 5 评论 -
基于深度学习的目标检测思路
引入深度学习或机器学习模型,用于分类和回归任务,是我们很熟悉的用法。目标检测任务,主要用于计算机视觉中,比如人体检测、车辆检测、人脸检测。目标检测的最终目标,是要在图像中找到检测对象的具体位置。在传统的计算机视觉处理中,我们可以用连通体检测或SIFT等,通过一定的规则,找到检测对象。在深度学习中,我们是怎么找到检测对象的位置呢?目标定位(Localization)我们首先解...原创 2018-06-21 21:34:56 · 4735 阅读 · 0 评论 -
手写数字识别研究综述
手写数字识别目前研究的最新成果,以及所用的数据集等综述原创 2016-08-13 10:07:58 · 16226 阅读 · 0 评论 -
利用OPenCV在MFC对话框上显示图片
将图片显示在MFC的Dialog上的Picture控件内原创 2011-02-25 20:08:00 · 5175 阅读 · 0 评论 -
用OpenCV在MFC Dialog中Picture控件上显示摄像头采集实时视频
OpenCV之所以能在MFC Dialog的Picture控件上绘图,全靠了CvvImage::DrawToHDC()方法。这就是下文为出现CvvImage和HDC的原因。下面是具体过程,用OpenCV1.0+VC6实现。本文代码下载地址:http://download.youkuaiyun.com/detail/ybdesire/52975841、在Dlg类中添加public变量 CvC原创 2013-04-24 23:36:08 · 6487 阅读 · 0 评论 -
详解协方差与协方差矩阵
协方差矩阵的理解与计算过程,包括具体细节与两个实例原创 2011-03-23 10:46:00 · 211287 阅读 · 50 评论 -
alpha混合的数学原理与实现
玩davinci的人都知道,视频处理后端(视频图像显示)中的attribute层,是VIDEO1和OSD0的alpha混合,是framebuffer的驱动实现的这种效果。 alpha混合技术,主要是用于实现半透明的效果, 假设一种不透明东西的颜色是A(即VIDEO1),另一种透明的东西的颜色是B(即OSD0),那么透过B去看A,看上去的颜色C(即attribute)就是B和A的混合颜色,原创 2011-11-28 19:39:20 · 4280 阅读 · 3 评论 -
复杂背景车牌定位
参考《复杂背景下的车牌定位和字符分割研究》一文实现了车牌定位方法,具体算法与原文有改动,给出了matlab源码原创 2011-03-16 10:01:00 · 12099 阅读 · 6 评论 -
基函数与基图像
有了基函数的概念,就容易找到离散图像的线性变换(离散傅里叶变换、离散余弦变换、离散沃尔什变换、离散哈达玛变换)之间的联系,各种变换的不同之处,也仅是基函数不同而已了。就是说不同的基函数对应不同的变换,记住一个离散傅里叶变换,根据他们的基函数就可以推导出其他变换的公式,也就不用记那么多变换的公式了。 离散图像的变换可以用两种表达式来描述,一种是代数表达式,另一种是矩阵原创 2011-06-06 14:38:00 · 10830 阅读 · 0 评论