图像识别、机器学习、数据挖掘
文章平均质量分 68
grunt1223
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
视觉特征抽取算法——SURF
目前公司PF系统(违禁图片机器审核)运营尚存在一些问题,主要包括:1.C++&opencv,第三方依赖较重,缺乏相应的C++工程师,维护成本较大2.图片识别引擎与对比算分机制接近黑盒,内部机制不易理解,例如像提高某张高危图片的激励(权重)因子等等3.针对公司特定业务的修改较为困难,例如增加对三维仿射的稳定性、增加图像签名缓存、特征匹配可视化等等在隐网项目的过程中,积累了关于...2010-12-27 13:34:02 · 155 阅读 · 0 评论 -
一个运用SVM进行回归的例子
[code="java"]#include "cv.h"#include "highgui.h"#include "ml.h"#include #include #include using namespace std;//以下例子用来拟合正弦曲线int main(int argc, char **argv){ int num_train =...2011-04-08 11:29:43 · 1210 阅读 · 0 评论 -
黄色-图片识别引擎
黄色-图片自动识别是一个涉及到图像处理、模式识别、机器学习、统计概率的综合领域,其关键技术包括:皮肤检测、人脸检测、连通区域分析、贝叶斯分类、支持向量机等等关于绿-坝是如何实现的,我一直很感兴趣。我这边也有一些相关的工作心得,拿出来与大家分享一下。[b]第一步是皮肤检测。[/b]肤色检测并不像我们想象那样简单,要做到不同光照下的肤色识别,并不是只要指定一个所谓的“肉色”的RGB...2011-04-04 16:45:01 · 1222 阅读 · 0 评论 -
黄色-图片识别引擎的一些心得
黄色-图片自动识别是一个涉及到图像处理、模式识别、机器学习、统计概率的综合领域,其关键技术包括:皮肤检测、人脸检测、连通区域分析、贝叶斯分类、支持向量机等等[b]第一步是皮肤检测。[/b]肤色检测并不像我们想象那样简单,要做到不同光照下的肤色识别,并不是只要指定一个所谓的“肉色”的RGB区域那么容易。一般采用转换到HSV色彩空间+变换的方式获得概率模型。我在获得概率模型之后,用一个...原创 2011-04-02 17:49:44 · 1032 阅读 · 0 评论 -
使用标签云扩展自己的应用
标签云或文字云是关键词的视觉化描述,用于汇总用户生成的标签或一个网站的文字内容。标签一般是独立的词汇,常常按字母顺序排列,其重要程度又能通过改变字体大小或颜色来表现。所以标签云可以灵活地依照字序或热门程度来检索一个标签。大多数标签本身就是超级链接,直接指向与标签相联的一系列条目。互联网标签云(Tag Cloud)的概念最早由Stewart Butterfield在《Make a Flick...2011-03-23 21:50:25 · 393 阅读 · 0 评论 -
Pascal VOC Challenge —— 图像识别与物件分类的挑战
在计算视觉的领域中,Pascal VOC Challenge 就好比是数学中的哥德巴赫猜想一样。Pascal的全称是Pattern Analysis, Statical Modeling and Computational Learning。每年,该组织都会提供一系列类别的、带标签的图片,挑战者通过设计各种精妙的算法,仅根据分析图片内容来将其分类,最终通过准确率、召回率、效率来一决高下。这...2011-03-22 13:35:32 · 426 阅读 · 0 评论 -
基于统计概率和机器学习的文本分类技术 —— 社区产品机器审核机制预研报告...
[align=center][size=x-large]基于统计概率和机器学习的文本分类技术[/size][/align][size=large][align=center]—— 社区产品机器审核机制[/align][/size][b][size=large]一、现状[/size][/b]目前,所在公司社区类产品(论坛、博客、百科)每天都会接收到大量的垃圾、灌水信息,高峰期16...2010-12-01 14:03:46 · 274 阅读 · 0 评论 -
互联网相似图像识别检索引擎 —— 基于图像签名的方式
[size=x-large]一、引言[/size]多媒体识别是信息检索中难度较高且需求日益旺盛的一个问题。以图像为例,按照图像检索中使用的信息区分,图像可以分为两类:基于文本的图像检索和基于内容识别的图像检索(CBIR:Content Based Image Retrieval)。基于文本的图像检索完全不分析和利用图像本身的内容,其检索质量完全依赖于与图像关联的文字信息与图像内容的相关性,...原创 2010-11-29 14:06:41 · 494 阅读 · 0 评论 -
我的数学之美(一)——RANSAC算法详解
给定两个点p1与p2的坐标,确定这两点所构成的直线,要求对于输入的任意点p3,都可以判断它是否在该直线上。初中解析几何知识告诉我们,判断一个点在直线上,只需其与直线上任意两点点斜率都相同即可。实际操作当中,往往会先根据已知的两点算出直线的表达式(点斜式、截距式等等),然后通过向量计算即可方便地判断p3是否在该直线上。生产实践中的数据往往会有一定的偏差。例如我们知道两个变量X与Y之间呈线性关...原创 2011-03-14 12:53:40 · 1935 阅读 · 0 评论 -
JAVA实现的Locality Sensitive Hash
我在之前的博客已大致介绍了LSH的原理及其的适用场景,有兴趣的朋友可以移步至[url]http://grunt1223.iteye.com/blog/937600[/url]这里我给出它的具体实现及实验效果:[code="java"]private int dimention; //维度大小,例如对于sift特征来说就是128private int max; //所需向...2011-03-07 11:36:12 · 264 阅读 · 0 评论 -
漫谈计算机视觉
从输入图象到信息获取之间存在着巨大的认知空白,其间需要经过一系列十分复杂的信息处理和理解过程。想象一下,在火车站,我们可以从茫茫人群中精确地找出要迎接的伙伴,这远非现在的机器学习、搜索引擎所能解决的。这再次证明人类视觉系统的强大。对人类视觉过程本质的认识,乃是揭开机器视觉进步的关键。对计算机而言,所有的输入均是矩阵,机器视觉的目的,就是要从这些矩阵中获取有用的信息。计算机对图像内容的识别,...2011-02-22 17:27:53 · 172 阅读 · 0 评论 -
Standard Kmean Cluster的实现[Java]
Kmean Cluster是一种机器学习中常用的无监督分析方法,例如,在最近的项目中,要从数以百万、千万计的高维图像特征中提取具有代表性的视觉词,就用到了此类技术。Kmean并不是一种高效的算法,理论可以证明,在欧几里得空间中的Kmean问题是NP-Hard(即使聚类数仅为2)。假设单个向量维度为d,向量数为n,目标聚类数为k,则算法的时间复杂度=n^(dk+1)*logn。kme...2011-02-17 13:56:08 · 134 阅读 · 0 评论 -
使用tesseract-ocr破解网站验证码
首先我得承认,关注tesseract-ocr, 是冲着下面这篇文章的噱头去的,26行groovy代码破解网站验证码[url]http://www.kellyrob99.com/blog/2010/03/14/breaking-weak-captcha-in-slightly-more-than-26-lines-of-groovy-code/[/url]当然,看了之后才知道,原来是调用...2011-02-12 10:24:30 · 416 阅读 · 0 评论 -
使用opencv作物件识别(一) —— 积分直方图加速HOG特征计算
方向梯度直方图(Histograms of Oriented Gradients,简称HOG特征)结合支持向量机( support vector machine, 简称SVM),被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。积分直方图可以用于快速计算原始图像矩形区域内的HOG特征。积分直方图的概念类似与viola和jones在脸部识别中所用的积分图像。下面的代码给出了,...2011-04-26 09:45:07 · 350 阅读 · 0 评论 -
【翻译】Seeing With OpenCV - Part 1: Introduction to OpenCV
本文翻译自Robin Hewitt的《Seeing With OpenCV - A Five-Part Series》。正如标题所表达的那样,通过连载的五篇文章,我们将通过step by step的方式,实现一个人脸识别的程序,即从原始图片中检测脸部,并通过某种算法从样本库中筛选近似的肖像加以匹配,这是相当有用&有趣的应用。这是本系列的第一章,主要介绍OpenCV及其一些简单用法。...2011-04-19 14:24:19 · 211 阅读 · 0 评论 -
我的数学之美(三) —— 使用支持向量机进行预测
现实生活中充满着预测问题,即对未知世界的大胆猜测。我们基于什么根据来推测呢?最多的当然是已有的经验,即之前所做的一些已知结果的推测,这就是所谓的“有监督的学习”。这里,我举一个最简单的例子,就是公务员考试中那种最常见的数字推理题:1,4,9,16,?当然,你一眼就看出了这是一个平方序列,下一个数字一定是25,但是,这是唯一的答案吗?应该说,平方序列只是一个模型,比方说,我们...2011-04-09 18:20:06 · 353 阅读 · 0 评论
分享