
《深度实践Spark机器学习 》
文章平均质量分 80
大笨笨笨
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
《深度实践Spark机器学习 》第11章 pyspark决策树模型
由于此书不配代码,以下代码都是本宝宝在ipynb测试过的。原创 2018-07-12 12:02:35 · 2326 阅读 · 1 评论 -
《深度实践Spark机器学习》第8章 构建Spark ML分类模型
8.3 数据探索 spark-shell --num-executors 1 --total-executor-cores 3 --executor-memory 512m val Path = "hdfs://uti04.utidata.com:8020/u01/bigdata/" val raw_data = sc.textFile(Path + "data/train_nohea...原创 2018-07-12 18:38:15 · 886 阅读 · 0 评论 -
《深度实践Spark机器学习》第9章 构建Spark ML回归模型
发现一个好地方:https://www.jianshu.com/p/da2be3876b009.2 数据加载 http://archive.ics.uci.edu/ml/datasets/Bike+Sharing+Dataset # 查看前3行 head -3 hour.csv # 查看记录总数 wc -l hour.csv # 查看文件列数 cat hour.csv | head -1 |...原创 2018-07-13 14:22:19 · 1116 阅读 · 0 评论 -
《深度实践Spark机器学习》第10章 构建Spark ML聚类模型
抓住一只文章:https://www.jianshu.com/p/79a896a5442f10.2 数据加载 http://archive.ics.uci.edu/ml/datasets/Wholesale+customers hdfs dfs -put Wholesale_customers_data.csv /u01/bigdata/data import org.apache.spark...原创 2018-07-13 16:39:15 · 643 阅读 · 0 评论 -
《深度实践Spark机器学习》第13章 使用Spark Streaming构建在线学习模型
抓住一只:https://www.jianshu.com/p/82c95217e42913.3 Spark Streaming应用实例 172 // 先启动nc,端口为9999 nc -lk 9999 // 启动spark-shell spark-shell --num-executors 1 --total-executor-cores 3 --executor-memory 512...原创 2018-07-13 17:28:02 · 779 阅读 · 0 评论