- 博客(4)
- 收藏
- 关注
原创 机器学习之聚类算法
聚类就是将一个对象的集合(样本集合)分割成几个不想交的子集(每个子集所代表的语义需要使用者自己进行解释),每个类内的对象之间是相似的,但与其他类的对象是不相似的. 分割的类的数目可以是指定的(例如k-means),也可以是有算法生成的(DBSCAN).聚类是无监督学习的一个有用工具。1原型聚类:原型聚类是指聚类结构能够通过一组原型刻画,即样本空间中具有代表性的点。也就是说聚类是通过
2017-12-25 15:51:21
560
原创 统计学习方法(第三章)k近邻算法
K近邻算法 KNN是通过测量不同特征值之间的距离进行分类。它的的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。下图红色,蓝色,代表不同类别的样本,绿色代表待分样
2017-12-03 22:20:23
656
原创 统计学习方法(第二章)感知机
1 什么是感知机在机器学习中,感知机(perceptron)是二分类的线性分类模型,属于监督学习算法。输入为实例的特征向量,输出为实例的类别(取+1和-1)。感知机对应于输入空间中将实例划分为两类的分离超平面。感知机旨在求出该超平面,为求得超平面导入了基于误分类的损失函数,利用梯度下降法 对损失函数进行最优化(最优化)。感知机的学习算法具有简单而易于实现的优点,分为原始形式和对偶形式。感知
2017-12-03 20:24:58
375
原创 统计学习方法学习笔记(第一章)
第一章 概论统计学习的目的:用已知数据的信息来对未知数据进行预测和分析统计学习方法:监督(主要是对此讲解)半监督(是监督学习与无监督学习相结合的一种学习方法。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题)非监督监督学习几个部分1)训练数据也就是输入实例的特征向量X,输出结果Y,假设X,Y遵循联合概率分布P(X,Y)-->为分布密度函数训
2017-12-03 18:13:09
291
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人