
ml
阳光玻璃杯
认真,你或许不会输!
展开
-
opencv_traincascade训练人脸检测
生成样本: opencv_createsamples -vec F:\work\ml\apple-rec\data\pos.vec -info F:\work\ml\apple-rec\data\pos\pos.txt -bg F:\work\ml\apple-rec\data\neg\neg.txt -w 80 -h 80 -num 38 训练 opencv_traincascade -原创 2017-09-14 18:10:02 · 936 阅读 · 0 评论 -
python 使用Id3算法实现决策树
依然是学习《统计学习方法》一书所做的简单实验,写代码的过程参考了大量其他的博客,本人在此深表感谢。代码实现的依然是书上的例子: import numpy as npimport mathimport operatordef CreateDataSet(): dataset = [ [1, 0,0,0,'no'], [1, 0,0,1,'no'],原创 2017-12-05 16:20:16 · 2610 阅读 · 1 评论 -
python KNN算法的简单实现
这里依然是学习《统计学习方法》一书中,K近邻算法的一个实验尝试。具体理论可参考该输,这里简单贴出K近邻算法的思想及实现步骤: 结果展示如下: 大的红点是传入的测试点,k传入的是5,也就是说大红点的周围5个点决定大红点的类别。 上图便是判定大红点属于红色类别的判别过程。也就是说,他周围最近邻的k个点进行投票表决,多数决定其类别。import numpy as npfrom matplotl原创 2017-12-01 19:29:34 · 1233 阅读 · 0 评论 -
python 计算并绘制灰度直方图
其灰度直方图为: 其灰度直方图为: 代码如下:def calHistogram(img): if(len(img.shape) != 2): print("img size error") return None histogram = {} for i1 in range(img.shape[0]): for i2 in原创 2017-12-12 16:21:50 · 7550 阅读 · 5 评论 -
python 朴素贝叶斯
这里的代码应该是学习《统计学习方法》的实验练习吧。代码实现的是《统计学习方法》中第四章朴素贝叶斯法的一个实例,实例如下: 、实现的步骤也是按照书中的步骤,如有问题,谢谢指正。 import numpy as npimport pickleimport osdef creatDataAndLebels(): Xa = [1,1,1,1,1, 2,2,2,2,2, 3,3,3,3,3原创 2017-12-01 16:02:13 · 836 阅读 · 0 评论 -
python K-Means聚类算法的实现
K-Means 简介聚类算法有很多种(几十种),K-Means是聚类算法中的最常用的一种,算法最大的特点是简单,好理解,运算速度快,但是只能应用于连续型的数据,并且一定要在聚类前需要手工指定要分成几类。 具体实现步骤如下: 给定n个训练样本{x1,x2,x3,…,xn} kmeans算法过程描述如下所示: 1.创建k个点作为起始质心点,c1,c2,…,ck 2.重复以下过程直到收敛原创 2017-11-29 19:22:09 · 5938 阅读 · 1 评论 -
python adaboost的简单实现
初学adaboost,自己尝试着写了下adaboost的实现,这个实现以几个简单的数字作为训练样本,当然,这些数字是带标签的。然后尝试着使用adaboost对其分类。对于10个带标签的数字,分类他们只需要3个左右的弱分类器级联,组成一个强分类器就可以完全正确的分类。如果代码本身没有bug的话,adaboost的表现的确惊艳。 另外,pathon也是初学,很多的编程思路和c,c++类似,总之,各方面原创 2017-11-10 17:35:58 · 1743 阅读 · 0 评论 -
python 计算积分图和haar特征
import cv2import numpy as npimport matplotlib.pyplot as pltdef integral(img): integ_graph = np.zeros((img.shape[0],img.shape[1]),dtype = np.int32) for x in range(img.shape[0]): sum_cl原创 2017-11-09 17:19:40 · 5590 阅读 · 9 评论 -
自己制作机器学习训练和测试使用的二进制数据集(C++)
本文主要分享笔者仿照Cifar-10二进制数据库的格式,自己制作机器学习使用的二进制数据库。经过封装后,非常方便使用。代码可用Github下载:BinaryDataset关于Cifar-10CIFAR-10数据集由10个类的60000个32x32彩色图像组成,每个类有6000个图像。 有50000个训练图像和10000个测试图像: 其数据在文件中的存贮格式如下:<1...原创 2018-03-10 14:39:03 · 2399 阅读 · 3 评论