MLlib
_飞奔的蜗牛_
关注图像处理/机器视觉/机器学习/大数据 等领域
学海无涯,与时俱进。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
spark之MLlib机器学习-线性回归
此篇博文根据《Spark MLlib机器学习》实例程序编写,可作为熟悉scala和mllib编写机器学习算法的一种实践。 1、准备测试数据 可从作者博客自行下载。代码及数据下载地址 2、编写scala源码 为了进一步熟悉scala编程语言,建议自己把代码敲一次。//import org.apache.log4j{ Level, Logger }import org.apac原创 2017-03-19 23:32:06 · 1036 阅读 · 0 评论 -
Spark之训练分类模型练习(1)
()本博文为 spark机器学习 第5章学习笔记。 所用数据下载地址为:实验数据集train.tsv各列的数据意义为: “url” “urlid” “boilerplate” “alchemy_category” “alchemy_category_score” “avglinksize” “commonlinkratio_1” “commonli原创 2017-03-25 16:13:25 · 4775 阅读 · 0 评论 -
Spark之训练分类模型练习(2)
上接博文。1 改进模型及参数调优1.1 数值特征标准化使用RowMatrix类计算列的统计量。每一行为某一样本的特征向量import org.apache.spark.mllib.linalg.distributed.RowMatrixval vectors = data.map(lp => lp.features)val matrix = new RowMatrix(vectors)val原创 2017-03-28 23:15:24 · 1832 阅读 · 0 评论 -
spark之MLlib机器学习-Kmeans
1、构建SBT项目环境 mkdir -p ~/kmeans/src/main/scala 2、编写kmeans.sbtname := "Kmeans Project"version := "1.0"scalaVersion := "2.11.8"libraryDependencies ++=Seq( "org.apache.spark" %% "spark-core" % "2.原创 2017-03-16 00:22:15 · 1352 阅读 · 0 评论
分享