
data mining & machine learning
文章平均质量分 71
Maggie张张
要去当程序员了真激动。。。
展开
-
模糊聚类FCM的MATLAB实现
FCM的原理在之前的博文中写过。现在按照它的算法流程,用MATLAB实现。共包括三个函数(myfcm.m, mydist.m, myplot.m)测试数据集用的是鸢尾花(iris)数据集。下载地址 http://download.youkuaiyun.com/detail/u013657981/92411211. myfcm.mfunction [U, V,objFcn] = myfcm原创 2016-03-29 21:56:46 · 37883 阅读 · 18 评论 -
神经网络中的Softmax是如何更新参数的
本文将从两个方面阐述神经网络中的softmax是如何更新参数的。 第一部分:BP算法怎么更新参数?缺点是什么? 第二部分:用了softmax怎么更新参数?一、BP算法用二次经验误差作为代价函数我们已经知道,BP算法在前向传播中,在每一个功能节点上先是线性组合算得一个状态值,然后用Sigmoid转换成一个激活值,最后一层中把这个激活值o跟真是标签做差求平方,得到某个样本的二次经验误差,作为向前矫正原创 2017-05-26 14:05:47 · 10524 阅读 · 0 评论 -
Back Propagation后向传播算法 Python实现
Back Propagation后向传播算法 Python实现后向传播算法用来自动调节神经网络的参数,本次实现代码完全参照Back Propagation的讲解 选取sklearn.datasets的moon数据集的前250个样本进行训练,迭代10000次之后可以得到训练准确率达到87.6%原创 2017-05-09 18:07:30 · 2748 阅读 · 0 评论 -
卷积神经网络学习笔记
一、理解卷积 首先,卷积是一种数学运算,从二维离散的卷积操作来理解这种运算的意义。摆出二维离散卷积公式: C(x,y)表示一个二维矩阵的函数值,C(x-s,y-t)是距离中心点(x,y)的函数值,F(s,t)是一个加权矩阵,对于中心点周围所有的点乘以一个加权值然后求和,就是该点新的函数值。举个例子: 要求C(2, 2)新的值,对于F(s, t)函数,, 所以C(2,2)=F(-1,-1)C原创 2017-05-10 18:12:35 · 1559 阅读 · 0 评论 -
FCM(Fuzzy C-Means)模糊C聚类
1. FCM初识 FCM的C跟K-Means的K是一样的,指的是聚类的数目。F—Fuzzy是模糊的意思,指的是”一个事件发生的程度“。用在我们的聚类上面,第一条记录以怎样的概率或者说程度属于第一类,又以怎样的程度属于第二类等等。跟传统的聚类有所区别的地方就是,他改变了分类的时候非此即彼的一个现象,一个对象可以以不同的程度同时属于多个类。这个其实是跟我们的现实世界是更契合的。比如说原创 2016-03-18 12:15:16 · 47273 阅读 · 17 评论 -
分类器组合方法Bootstrap, Boosting, Bagging, 随机森林(一)
首先,机器学习的一个重要假设就是样本的分布和总体的分布是一致的。多分类器进行组合的目的是为了将弱分类器(单个分类器)集成为强分类器,提升对未知样本的分类准确率,(实验数据。。。)Bootstraping 名字来源于“Pull up your own bootstraps",即”通过拉靴子让自己上升“,本意是”不可能发生的事情“,现在的意思变成”通过自己的努力,让事原创 2016-06-06 16:26:48 · 24983 阅读 · 6 评论 -
C4.5算法详解(非常仔细)
首先,我们用一个例子来计算一下。 上述数据集有四个属性,属性集合A={ 天气,温度,湿原创 2016-06-11 22:06:54 · 113441 阅读 · 38 评论 -
分类器组合方法Bootstrap, Boosting, Bagging, 随机森林(二)
接《分类器组合方法Bootstrap, Boosting, Bagging, 随机森林(一) 》AdaboostAdaboost给每个基分类器设置了一个重要性参数α,基分类器的重要性参数α是训练误差的的函数,错误率越接近于1,则α有一个很大的负值,如果错误率接近于0,则有一个很大的正值。接下来,用α更新训练样本的权值。原创 2016-07-13 15:28:54 · 3351 阅读 · 0 评论 -
使用weka进行数据挖掘
参考教程点击打开链接原创 2016-06-07 10:34:41 · 21823 阅读 · 5 评论 -
如何使用交叉验证 Cross Validation
在机器学习的相关研究中,如果是有监督的算法,需要将原始数据集分为训练集和测试集两个集合。训练集中的数据带有标签,用这些数据来训练出一个模型,告诉机器什么样的数据可以分成哪一类,然后用这个模型来预测测试集中数据的标签。然后用预测得到的标签跟真实的标签作比对,就可以得到这个模型的预测准确率,其实是考察这个模型的generalization ability(泛化能力),即,从训练集中总结出来的规律能不能原创 2016-06-07 15:28:36 · 14152 阅读 · 0 评论 -
机器学习基本算法总结
写这篇博文主要是想对自己近期学到的机器学习知识做一个总结,同时也谈一谈我对人工智能的理解。一、我对人工智能的理解首先谈一谈我对人工智能的理解。人工智能企图理解智能的本质,并让机器也拥有类似于人的智能。比如,人从出生到慢慢长大,能听懂别人的话,能辨认周围的物体,并且能模仿一些举动,所以人是拥有智能的。但是机器不行,一开始机器可以完成一些人类已经明确告诉它怎么去完成的任务(比如人编写程序告诉计算机加法的原创 2017-05-20 23:00:08 · 2433 阅读 · 3 评论