
数据挖掘
.云哲.
向善,求实,藏锋,隐智,戒欲,省身,慎言。
展开
-
【数据挖掘】8-IDEA 设置阿里maven仓库,及设置打包工具
**IDEA版本:IntelliJ IDEA Community Edition 2016.1.1(64) IDEA创建Spark项目,2个常见错误和pom.xml1,IDEA 创建Spark项目1.1,点击IDEA执行文件 1.2 添加scala 1.3 选择Create New Project,选择scala-tools 1.4,输入包名和项目名 1.5,再输入项目名 经过以上步骤,原创 2017-11-09 12:31:10 · 541 阅读 · 0 评论 -
【数据挖掘】9-IDEA MAVEN搭建Spark开发环境,及2个问题
问题1,无法编译,出现解决这个问题,只需要注释test\scala下面系统自动生成的这两个类 问题2,Error:scalac: Error: object scala.runtime in compiler mirror not found.Error:scalac: error while loading <root>, zip file is emptyError:scalac: Erro原创 2017-11-09 14:07:30 · 459 阅读 · 0 评论 -
【数据挖掘】6-Spark集群搭建
下载 spark.1.6.3-bin-hadoop.2.6.tgz1,安装步骤 tar -zxvf spark.1.6.3-bin-hadoop.2.6.tgz -C /export/servers/apps cd spark.1.6.3-bin-hadoop.2.6/conf mv spark-env.sh.template spark-env.sh vi spark-en原创 2017-11-09 16:05:10 · 314 阅读 · 0 评论 -
【数据挖掘】7-ntp服务
ntp服务搭建 Spark集群分为Master,Worker。默认Worker每15秒向Master发一条心跳包。所以,Spark集群时间必须同步。0,准备工作 关闭selinux,关闭防火墙服务器配置 1,安装ntp服务 yum install -y ntp ntpdate2,修改配置文件 vi /etc/ntp.conf 加入#server 0.centos.pool.ntp.org原创 2017-11-09 16:10:58 · 368 阅读 · 0 评论 -
【数据挖掘】13-kafka集群安装
安装kafka,版本:kafka_2.10-0.8.2.1.tgz1,安装Zookeeper http://blog.youkuaiyun.com/luolinll1212/article/details/784907142,安装kafkatar -zxvf kafka_2.10-0.8.2.1.tgzcd kafka_2.10-0.8.2.1/configvi service.properties原创 2017-12-04 22:40:43 · 230 阅读 · 2 评论 -
【数据挖掘】12-hbase安装
hbase安装,版本:hbase-0.99.2-bin.tar.gz1,上传文件2,解压文件tar -zxvf hbase-0.99.2-bin.tar.gz3,修改环境变量vi /etc/profile export HBASE_HOME=/home/hadoop/hbase-0.99.2-bin export PATH=$PATH:$HBASE_HOME/bin4,修改配置文件,hbas原创 2017-12-04 22:36:07 · 288 阅读 · 0 评论 -
【数据挖掘】11-hive安装
hive 安装1,启动hadoop,启动mysql hadoop安装在第3篇博客,http://blog.youkuaiyun.com/luolinll1212/article/details/78484518 mysql安装在第10篇博客,http://blog.youkuaiyun.com/luolinll1212/article/details/784911482,解压hivetar -zxvf apac原创 2017-12-04 22:11:19 · 323 阅读 · 0 评论 -
【数据挖掘】3-Hadoop集群搭建与测试
安装hadoop-2.6.5.tar.gz hdp10 namenode/datanode hdp11 datanode hdp12 datanode0 安装前准备 修改hosts,修改主机名,关闭防火墙,关闭selinux,安装ssh,配置免密码,安装JDK1,添加hadoop用户名 useradd hadoop passwd hadoop vi /etc/sudoersro原创 2017-11-08 23:09:41 · 261 阅读 · 0 评论 -
【数据挖掘】10-mysql安装
mysql原创 2017-11-09 16:27:23 · 750 阅读 · 0 评论 -
【数据挖掘】5-Zookeeper集群搭建
安装zookeeper-3.4.5.tar.gz1,安装JDK2,安装zoookeeper cd /root/apps tar -xf zookeeper-3.4.5.tar.gz cd zookeeper-3.4.5/conf mv zoo_sample.cfg zoo.cfg vi zoo.cfgdataDir=/root/zkdataclientPort=2181#编写一下内容原创 2017-11-09 16:00:08 · 265 阅读 · 0 评论 -
【数据挖掘】4-hadoop-2.6.5-src.tar.gz编译
编译hadoop-2.6.5.tar.gz,需要一下软件将所有软件安装在/usr/local/src目录下jdk-7u25-linux-x64.tar.gz apache-ant-1.9.4-bin.tar.gz findbugs-3.0.0.tar.gz protobuf-2.5.0.tar.gz apache-maven-3.0.5-bin.tar.gz hadoop-2.6.0-sr原创 2017-11-08 23:26:22 · 876 阅读 · 0 评论 -
【数据挖掘】2-SSH免密码设置
搭载完成网络yum源1, 安装ssh服务 yum install -y openssh-server openssh-clients2, 生成sh密码 ssh-keygen 3, 配置免密码 ssh-copy-id 192.168.10.10 把本地的 id_rsa.pub 拷贝给 192.168.10.10 , 并把 id_rsa.pub 加入授权列表4, 查看授权列表 ca原创 2017-11-08 22:37:15 · 196 阅读 · 0 评论