
Spark
faith默默
这个作者很懒,什么都没留下…
展开
-
sparklyr包:Spark Machine Learning
sparklyr绑定了Spark分布式机器学习库。而且,sparklyr允许访问spark.ml包中提供的机器学习程序。加上sparklyr的dplyr接口,完全可以通过R精心策划,在spark中轻松创建和调整机器学习的工作流程。翻译 2016-08-19 18:18:51 · 1744 阅读 · 0 评论 -
sparklyr包:dplyr包在Spark中的用法
简介dplyr是一个R包,用来处理R环境内外的结构化数据。dplyr使得R语言使用者更简单、一致、高效地处理数据。使用dplyr包处理spark数据集,功能包括:Select, filter, and aggregate 数据可以使用窗口函数(如sample)多个数据集进行join将spark数据集加载到R内存中 在dplyr语句中可以使用magrittr包中定义的管道连接翻译 2016-08-19 17:16:42 · 2881 阅读 · 0 评论 -
sparklyr包:实现Spark与R的接口
日前,Rstudio公司发布了sparklyr包。转载 2016-08-16 16:32:44 · 2400 阅读 · 1 评论 -
安装sparklyr包过程中遇到的几个ERROR
日前,Rstudio公司发布了sparklyr包。该包具有以下几个功能:实现R与Spark的连接—sparklyr包提供了一个完整的dplyr后端筛选并聚合Spark数据集,接着在R中实现分析与可视化利用Spark的MLlib机器学习库在R中实现分布式机器学习算法可以创建一个扩展,用于调用Spark API。并为Spark的所有包集提供了一个接口未来在RStudio IDE中集成支持Spa原创 2016-08-12 19:17:28 · 2971 阅读 · 0 评论 -
Spark官方文档 - 中文翻译
Spark官方文档 - 中文翻译转载 2016-07-06 18:16:02 · 1650 阅读 · 0 评论 -
Spark SQL 官方文档-中文翻译
Spark SQL 官方文档-中文翻译转载 2016-07-06 18:12:56 · 891 阅读 · 0 评论 -
SparkR安装部署及数据分析实例
SparkR安装部署及数据分析实例转载 2016-06-14 15:22:30 · 1325 阅读 · 6 评论