
机器学习
土豆拍死马铃薯
这个作者很懒,什么都没留下…
展开
-
《Spark机器学习》笔记——Spark分类模型(线性回归、朴素贝叶斯、决策树、支持向量机)
一、分类模型的种类1.1、线性模型1.1.1、逻辑回归1.2.3、线性支持向量机1.2、朴素贝叶斯模型1.3、决策树模型二、从数据中抽取合适的特征MLlib中的分类模型通过LabeledPoint(label: Double, features: Vector)对象操作,其中封装了目标变量(标签)和特征向量从Kaggle/StumbleUpon evergreen分原创 2018-01-06 12:50:35 · 2693 阅读 · 0 评论 -
《Spark机器学习》笔记——Spark应用于数据降维
我们将学习无监督学习模型中降低数据维度的方法。不同于我们之前学习的回归、分类和聚类模型,降维方法并不是用来做模型预测的。降维方法从一个D维的数据输入提取出一个远小于D的k维表示。因此,降维本身是一种预处理方法,或者说特征转换的方法。降维方法中最重要的是:被抽取出的维度表示应该仍能捕捉大部分的原始数据的变化和结构。这源于一个基本思想:大部分数据源包含某种内部结构,这种结构一般来说应该是未知的(常称为原创 2018-01-18 20:36:12 · 2916 阅读 · 0 评论