
算法备忘
文章平均质量分 69
windtalkersm
这个作者很懒,什么都没留下…
展开
-
Run legacy FDDB Evaluation Scripts on macOS Mojave (10.14)
BackgroundFDDB, nearly 20 years old codes (even with a April 1, 2020 updated Gnuplot scripts for generating the ROC curves), should be run just fine - Not on the MAC!Build and ErrorsBuild is easy, really.Choose Mac because only Makefile available with原创 2020-10-10 07:52:40 · 282 阅读 · 0 评论 -
Liveness Detection with OpenCV
Experimenting with Liveness Detection with OpenCVmacOS (same error in Windows below + same solution)Traceback (most recent call last): File "train_liveness.py", line 114, in <module> plt...原创 2020-02-18 00:32:31 · 765 阅读 · 0 评论 -
SVM, Perceptron, LDA, Logistic Regression etc.
Are Fisher’s linear discriminant and logistic regression classifier related?The Efficiency of Logistic Regression Compared to Normal Discriminant Analysis Bradley Efron Journal of the American Statis原创 2015-05-24 09:51:26 · 1073 阅读 · 0 评论 -
EM算法小结
先总结几篇经典的,以后再慢慢补充Rachel有两篇,一篇概述的,一篇具体的(结合GMM)。 聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut GMM的EM算法实现公式符号不一样,但是完全一致的。在通用文章中,行文是说样本数是N,公式中用的是M。 通用文章实际是借用下面文章的公式: The EM Algorithm by Jerry原创 2015-09-29 18:34:15 · 447 阅读 · 0 评论 -
SWT for OCR
IntroductionSWT stands for Stroke Width Transform which is an algorithm often used for text detection in an OCR application.ResourcesPrimarily two online resources have been particularly appealing to m原创 2016-06-14 22:21:29 · 1572 阅读 · 0 评论 -
Yet another Computer Vision Library? No!
HistoryIntroductionCCV : A Modern Computer Vision LibraryLearning CurveConvNetEverything is here: ConvNet: Deep Convolutional NetworksFour popular CNNs [AlexNet 12] ImageNet Classification with原创 2016-06-18 03:34:12 · 375 阅读 · 0 评论 -
阅读笔记 - TextProposals
忘了是怎么找到这篇文章。感兴趣是因为 够新, 2015-16 有完整的C++源码 TextProposals 和其他重要的state-of-the-art 做比较(e.g. Jaderberg) Summarysome good survey papersScene text detection two category Sliding window sear原创 2016-07-27 21:54:20 · 1347 阅读 · 0 评论 -
OCR + Tesseract + OpenALPR
=== 15/11/2016 更“资源”IntroductionRecent focus is OCR. Make some preparation.OpenALPR很不错的开源项目。代码完整,注释清楚,逻辑清晰,文档全面。 有打算仔细研究一下,并翻译出来。 OpenALPR在线文档 OpenALPR Documentation 如何提高精度 Accuracy Impro原创 2016-11-03 23:05:55 · 3330 阅读 · 0 评论 -
Tesseract Call Graph
Route 1 - Read image and setup internal structure (PIX)main[api/tesseractmain.cpp] -> TessBaseAPI::ProcessPages[api/baseapi.cpp] -> TessBaseAPI::ProcessPagesInternal[api/baseapi.cpp] -> (i) **For TI原创 2017-05-12 20:54:57 · 914 阅读 · 0 评论 -
PageSegMode in Tesseract
The PageSegMode in Tesseract is REALLY, REALLY, REALLY confusing!!Well, it is kind of all make sense in the end, once one understand the exact meaning of the terminologies used in Tesseract Documentati原创 2017-05-17 23:59:30 · 2588 阅读 · 0 评论 -
Leptonica --> tesseract --> OpenCV
DependencyVery useful links nicely contains lots lots MS related information. Downloading liblept pre-built binaries and header files for Windows (Optional) Building the liblept library (Optional) B原创 2016-08-24 22:48:06 · 4437 阅读 · 0 评论 -
Build OpenCV 3.1 from source files on Windows
背景也许还是绕不开Windows 的。区别OpenCV 3.1有预编译版本可以下载,只要添加一个opencv_world310.lib 即可使用。但是很多有用的功能都被转移到 一个单独的 opencv_contrib 库里面,需要额外编译。但是这个库又不独立,需要在编译 OpenCV 的时候把开关打开操作The official tutorial is way out of date. Insta原创 2016-11-01 01:16:56 · 1218 阅读 · 0 评论 -
dlib, OpenFace and face_recognition
How to install dlib from source1). download dlib-19.4 2). cd examples/mkdir buildcd build/cmake -G Xcode ...3). Install XQuartz-2.7.11.dmg from https://www.xquartz.org/, so X server is ready 4). c原创 2017-04-12 23:12:38 · 5317 阅读 · 0 评论 -
DNN, DL Updates
机器学习的理论进展到了什么程度? 首先从传统的神经元层面来说,使用了几十年的Sigmoid激活函数被ReLU、PReLU这样的激活函数代替,部分解决了训练到两端梯度变小导致训练缓慢甚至梯度消失的问题;权重的初始化,除了原来的均匀方法、高斯方法,前几年出现了xavier、msra等方法,这些更适合深度网络。当然这些算是小的改进,最近基本很少这方面的文章了。 其次是分类器层面,发展出...原创 2018-03-26 19:37:31 · 427 阅读 · 0 评论 -
目标检测 (Object Detection) 算法汇集
基于深度学习的目标检测综述(一)(2018年03月16日) 图像分类,检测及分割是计算机视觉领域的三大任务。图像分类模型(详情见这里)是将图像划分为单个类别,通常对应于图像中最突出的物体。但是现实世界的很多图片通常包含不只一个物体,此时如果使用图像分类模型为图像分配一个单一标签其实是非常粗糙的,并不准确。对于这样的情况,就需要目标检测模型,目标检测模型可以识别一张图片的多个物体,并可以定位出不同...原创 2018-03-26 21:39:06 · 59969 阅读 · 1 评论 -
目标检测/分类常用数据集和评价指标小汇集
【人工智能学习总结1】分类、目标检测中的评价指标(一) 一:准确率 (Accuracy) 、错误率 (Error rate) 二:混淆矩阵 (Confusion Matrix)三:召回率(Recall)、精确率(Precision)四: P-R曲线、平均精度(Average-Precision,AP)、F指标五:受试者工作特征曲线(Receiver Operating ...原创 2018-03-27 20:57:46 · 6448 阅读 · 0 评论 -
OpenTLD再续 - 猪肚
2年前研究了一段时间的OpenTLD,倒腾了好几个不同的代码实现,不过只简单的做了一些测试。发现除了作者的视频,其他效果都没那么惊艳,就放下了,和其他很多算法,技术一样,花了很多功夫,什么成果也没留下。。。昨天机缘巧合又碰到了OpenTLD。所幸几年了机器虽然升级到Win 8.1 + VS2013 但之前的编译环境还没有变化,几个之前就调通过的程序很快就跑起了,包括原作者的OpenTLD。同时意外的原创 2015-06-26 19:48:06 · 698 阅读 · 0 评论 -
CVG Talk on Deep Learning
2015-05-13go over main talking points last timeIntroduce the output layer, e.g. logistic regression, softmax regressionsummarynow move to convolutional networksconclude原创 2015-05-14 00:30:02 · 581 阅读 · 0 评论 -
Kalman 滤波器
1. 前言这可能应该是最简单的算法/模型/滤波器。。。随便你用什么名字叫它,都不会错。越简单的东西越不简单。现在觉得,如果能把这个模型真的搞清楚了,就算入门了。2. 资源卡尔曼滤波器的资源,无论是网上还是网下,都可以用不计其数来形容。非常经典的,有Greg Welch 和 Gary Bishop的 An Introduction to the Kalma原创 2014-12-27 07:01:32 · 1343 阅读 · 0 评论 -
通过源码学算法--AdaBoost: CART插播
1. 简介CART(Classification and Regression Tree)是一个采用二分法递归划分生成的二叉树。粗略的讲,分类结果是离散的就是分类,是连续的实数就是回归树。2. 特点2.1 优点本质上是无参估计(non-parametric)。就是不管待估计的参数是来自什么神奇古怪的空间,来者不拒。至于分类结果如何,呃, 那是另一回事可以处理输入原创 2013-03-30 21:43:52 · 1457 阅读 · 0 评论 -
通过源码学算法--AdaBoost (CART): RealAdaBoost.m + tree_node_w.m
tree_node_w.m代表分类树的类结构。很简单,只有5个成员如果是左树则只有right_constraint有值,如果是右树则只有left_constraint有值实际上在这里是一个类多用了。比如一个训练好的最大深度为3(max_split == 3)的CART 树有四个节点(node),每个节点就是该类tree_node_w的一个object,同时每个节点又是一个弱分类器原创 2013-03-30 09:15:44 · 2322 阅读 · 2 评论 -
通过源码学算法--AdaBoost (CART) -- Example_1.m
Ionosphere.txt中的数据是351x35,每一行代表一个采样数据,总共351个采样。 数据空间是34维(最后一列是该采样所属类别),所以下面要转置一下% Step1: reading Data from the filefile_data = load('Ionosphere.txt');Data = file_data(:,1:end-1)';Labels = file_原创 2013-04-02 06:25:52 · 1149 阅读 · 0 评论 -
通过源码学算法--AdaBoost (CART) -- train.m
train.m第一步,划分根节点root对输入的数据(特征集,分类标签,权重)用CART算法进行划分,得到左右子节点。传入的node已经设定最大层数为3,所以很快就结束,没有CART通常包含的pruning, optimal selection 及 cross-validation 等步骤注意:这个Matlab包里所有的传入node都只是用来传递一个空的tree_node节点,原创 2013-04-02 06:58:54 · 1547 阅读 · 0 评论 -
通过源码学算法--AdaBoost (CART) -- do_learn_nu.m
如前所述,通过传进来的空节点(已经设置最大层数为3)构造初始左右节点如果不是构造根节点,都要指定父节点papa(为神马没有mama )父节点其实很关键,尤其在calc_output的时候,其实是先让祖先分类,分剩下的才轮到子孙继续划分tree_node_left = tree_node;tree_node_right = tree_node;if(nargin > 4)原创 2013-04-06 03:58:02 · 1453 阅读 · 2 评论 -
Deformable Part Model 实现细节
OverviewStep 1. Compute filter responses to the feature pyramidEach level of features (e.g. 46) is convolved with every stored part filters (e.g. 54), the result subsequently goes to the correspon原创 2013-03-22 03:17:09 · 1437 阅读 · 0 评论 -
高斯,为什么总是高斯分布?
前段时间的group reading 上,一个senior lecturer发出上述疑问 我想不光是她,很多人都有或有过类似的想法。正好research gate上有这样的问答,我觉得解释的很清楚了---尽管很简短If I have a dataset, how can I prove that this dataset has a nature of Gaussian Mixture原创 2013-12-23 07:03:38 · 2189 阅读 · 0 评论 -
Gamma 矫正
记住几个要点:1. 本质上是一个power-law 函数。gamma 1 时也叫解码gamma,gamma扩展2. gamma encoding的主要目的是充分利用人眼对光线的非线性特性,对明亮的部分用较少的数据编码,对阴暗的部分用较多的比特,最终达到perceptually uniform的目的。而所有的基于图像或视频的处理算法,比如图片编辑,颜色处理和直方图计算等都是基于percep原创 2014-01-13 18:52:24 · 1422 阅读 · 0 评论 -
Gesture/Pose/Posture/Action Recognition
最近想收集一些这方面的代码,理理思路。2个小时左右,感觉下面几个有时间可以试试1. Gesture Recognition Toolkit 基于机器学习的,不过貌似提供了整个训练和检测的pipeline,只要提供训练数据就可以了。最新更新于2013年12月---值得跟进2. 2D articulated human pose estimatio原创 2014-01-16 02:08:48 · 1902 阅读 · 0 评论 -
BGSLibrary 和 Change Detection Workshop CDW-2014
这几天在准备这个workshop,做个简单记录。1. bgslibrary这个库目前包含了35个BGS算法。是个很好的起点。把其中有用的算法测完就要不少时间1.1 吐槽1enablePreProcessor is mandotary in FrameProcessor.xml !!! If set to 0, it won't pass (i.e. copy) the in原创 2014-03-16 06:18:19 · 1975 阅读 · 0 评论 -
经典的HaarTraining算法
1. Haar与OpenCV特征检测专题原创 2014-04-16 20:10:51 · 2024 阅读 · 0 评论 -
Dynamic Time Warping (DTW)
Dynamic time Warping to recognize gestures原创 2014-09-10 08:08:14 · 1079 阅读 · 0 评论 -
Open Lectures
Model Thinking by Scott E. Page原创 2014-09-29 23:48:31 · 668 阅读 · 0 评论 -
数据融合算法(data fusion)
1. 前言一直觉得“数据融合”这个翻译有点怪,不过也想不到更好的代替这方面的资料也是多如牛毛,最常见的三种模型是NNDF,PDAF和JPDAF。当然MHT也属于这个范畴,不过MHT同时解决了跟踪的问题(初始化,终止等判断)2. 资料3. 源代码解读3.1 Probabilistic Data Association Filters (PDAF原创 2015-01-07 01:27:00 · 19349 阅读 · 1 评论 -
通过源码学算法--AdaBoost (CART) -- 楔子
引子看源码一直以来是我学习各种算法的主要方式。没办法,数学太差,看到各种paper上的古怪公式就犯恶心。不过等明白了具体实现做法,倒也能理解写公式的苦衷:任何算法实现时都有不少的假设和work around,这些拿不上台面的东西,哪有数学公式看着纯粹与专业呢这些年陆陆续续看了不少源码,确实也帮助很大。不过很多算法当时明白,过段时间再想起时,就只留了大概的印象。要想再获得当初原创 2013-03-27 01:02:07 · 1966 阅读 · 0 评论