大数据
文章平均质量分 88
孟夏1988
爱读书的数据分析师。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
翻译:用R实现序列模式挖掘进行商业推荐指南
在这份指南中,Allison Koenecke揭示了当客户增加Azure云的服务时,微软如何通过延伸传统购物篮分析实现对消费者潜在服务需求的推荐。 问题声明: Market Basket Analysis (MBA)购物篮分析回答了一个标准的商业问题:通过一组超市的小票,我们可以发现经常一起购买的商品吗(比如花生酱和果冻)? 假设我们想要提高客户服务体验进行挖掘, 比如,确定过去买过花生酱,是否就意味着未来购买面包的可能性更高。基于此,我们应用了购物篮分析的序列模式...翻译 2020-06-30 17:47:47 · 1069 阅读 · 0 评论 -
SparkR的R3.3.1源码安装
如果想要在spark上使用sparkR必须首先在集群的所有机器上安装R包,前面有安装过R.3.2.1,但是因为很多R包不支持,所以更新为3.3.1。 1、安装依赖 yum install gcc yum install gcc-c++ yum install gcc-gfortran yum install pcre-devel原创 2017-02-08 10:02:30 · 2217 阅读 · 0 评论 -
Hadoop+Spark+Scala+R+PostgreSQL+Zeppelin 安装过程-环境准备
Hadoop+Spark+Scala+R+PostgreSQL+Zeppelin 安装过程前的环境准备。原创 2017-01-19 16:40:26 · 670 阅读 · 0 评论 -
Hadoop+Spark+Scala+R+PostgreSQL+Zeppelin安装过程-Hadoop安装及测试
3.7Hadoop安装 需要在3台服务器上都安装 Hadoop。首先通过sftp将下载下来的二进制的 Hadoop包上传到Master, 将Hadoop 压缩包 hadoop-2.6.3.tar.gz移动到/usr/local/program/目录下,使用tar zxvf hadoop-2.6.3.tar.gz 解压缩。 进入 /usr/local/program/hadoop-2.6.3原创 2017-01-19 17:09:25 · 1260 阅读 · 0 评论 -
Hadoop+Spark+Scala+R+PostgreSQL+Zeppelin安装过程-Spark的安装配置测试和Scala的安装配置
3.8 Scala安装 注意scala2.11版本不支持spark1.*版本。 需要在3台服务器上都安装 Scala 。首先通过sftp将下载下来的 Scala 包上传到Master, 将Scala 压缩包 scala-2.10.4.tgz移动到/usr/local/program/目录下,并解压缩。 进入 scala-2.10.4下 3.8.1配置系统环境变量 vi /etc/pro原创 2017-01-19 17:18:32 · 597 阅读 · 0 评论 -
Hadoop+Spark+Scala+R+PostgreSQL+Zeppelin安装过程-SparkR安装配置和Zeppelin安装配置
3.10 R安装 安装R的原因是Spark安装后直接启动SparkR会报错,且在zeppelin中支持sparkR接口,为了在zeppelin中使用R,故提前安装。 需要在3台服务器上都安装 R。首先通过sftp将下载下来的 R源码 包上传到Master, 将R压缩包 R-3.2.1.tar.gz 移动到/usr/local/program/目录下,并解压缩。 3.10.1安装依赖原创 2017-01-20 09:29:43 · 1885 阅读 · 0 评论
分享