
机器学习分类算法
young_so_nice
这个作者很懒,什么都没留下…
展开
-
Svm算法理解以及MLlib实现
首先SVM算法它也是一种分类算法,类似于贝叶斯分类算法,但是在底层的实现还是不同,它可以用更少的样本,训练出更高精度的模型。支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的, 它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中 支持向量机方法是建立在统计学习理论的VC原创 2016-08-08 14:51:16 · 2975 阅读 · 0 评论 -
k-means算法原理以及Scala调用MLlib实现
聚类属于无监督学习,以往的回归、朴素贝叶斯、SVM等都是有类别标签y的, 也就是说样例中已经给出了样例的分类。而聚类的样本中却没有给定y,只有特征x, 比如假设宇宙中的星星可以表示成三维空间中的点集 聚类的目的是找到每个样本x潜在的类别y,并将同类别y的样本x放在一起。 比如上面的星星,聚类后结果是一个个星团,星团里面的点相互距离比较近,星团间的星星距离就比较远了。原创 2016-08-10 11:08:30 · 3516 阅读 · 2 评论 -
MLlib学习Basic Statistics
首先介绍:Summary statistics 1、summary statistics(汇总统计) Summary statistics提供了基于列的统计信息,包括6个统计量:均值、方差、非零统计量个数、总数、最小值、最大值。import org.apache.spark.{SparkContext, SparkConf}import org.apache.spark.mllib.原创 2016-08-15 13:04:13 · 578 阅读 · 0 评论