
大数据之Hadoop
技术无他,唯手熟尔
观千剑而后识器,操千曲而后晓声。
展开
-
Hadoop的MapReduce作业实现筛选天气案例——代码实现
1,要处理的数据,也是要测试的数据:tq.txt1949-10-01 14:21:02 34c1949-10-01 19:21:02 38c1949-10-02 14:01:02 36c1950-01-01 11:21:02 32c1950-10-01 12:21:02 37c1951-12-01 12:21:02 23c1950-10-02 12:21:02 41c1950-10...原创 2019-11-23 21:13:57 · 1521 阅读 · 0 评论 -
Hadoop之搭建MapReduce高可用环境
前提是Hadoop的HDFS高可用集群已经搭建完毕。在搭建2.x版本的高可用Hadoop集群博客中有详细介绍,本篇博客主要介绍搭建MapReduce高可用。一 准备条件说明四个虚拟机: node1,node2,node3,node4。NameNode1和NameNode2分别是node1,node2,DataNode有三个,分别是node2,node3,node4搭建MapReduce时,担...原创 2019-10-29 18:07:52 · 467 阅读 · 0 评论 -
搭建2.x版本的高可用Hadoop集群
前提准备1:准备多台虚拟机(我准备了四台) ,分别为:node1,node2,node3,node42.配置好java环境变量和Hadoop的环境变量以及Hadoop的二次JAVA_HOME的配置在虚拟机上实现搭建1.x版本的Hadoop伪分布式中 有介绍环境的配置3.配置好网络,保证虚拟机之间能够ping通 虚拟机中linux系统网络的配置文章中介绍了配置虚拟机网络的步骤,在/ect下的...原创 2019-10-25 17:04:39 · 204 阅读 · 0 评论 -
linux虚拟机上搭建Hadoop2.x版本的全分布式安装
1.准备多台虚拟机我准备了4台虚拟机:别名分别为node1,node2,node3,node42.前期准备1.jdk的安装2.查看虚拟机别名是否正确,通过如下命令查看cat /etc/sysconfig/network查看虚拟机的hosts文件是否一致,保证能够ping通cat /etc/hosts3.检查时间是否一致,命令如下date如果时间不一致,可以通过如下命令设...原创 2019-10-19 11:58:31 · 207 阅读 · 0 评论 -
在虚拟机上实现搭建1.x版本的Hadoop伪分布式
第一步,环境的配置由于Hadoop的底层是java,所以需要安装jdk,并配置好java环境。安装jdk就不详细说明了,这里主要说配置java的环境变量。进入/etc/profile文件中配置java环境变量编辑文件vi /etc/profile在最末尾加入配置的命令如下export JAVA_HOME=/usr/java/jdk1.7.0_67(这里的路径根据个人jdk所在路径所...原创 2019-10-18 22:32:43 · 222 阅读 · 0 评论