大数据 集群测试部分

查看HDFS集群状态

在浏览器里访问http://master:9870
在这里插入图片描述
不能通过主机名master加端口9870的方式,原因在于没有在hosts文件里IP与主机名的映射,现在只能通过IP地址加端口号的方式访问:http://192.168.1.101:9870

在这里插入图片描述
修改宿主机的C:\Windows\System32\drivers\etc\hosts文件,增加hadoop集群主机名与IP地址的映射
在这里插入图片描述
此时,访问http://master:9870,从图中可以看出HDFS集群状态显示正常
在这里插入图片描述
单击导航条上的【Datanodes】,查看数据节点信息

在这里插入图片描述
点开【Utilities - 实用工具】下拉菜单,选择【Browse the file system - 浏览文件系统】
在这里插入图片描述
此时HDFS上什么东东都木有
在这里插入图片描述
在HDFS上创建一个目录BigData,既可以在WebUI上创建,也可以通过shell命令创建

执行命令:hdfs dfs -mkdir /BigData

在这里插入图片描述
在这里插入图片描述
查看四个功能按钮
在这里插入图片描述

查看YARN集群状态

访问http://master:8088/cluster,从图中可以看出YARN集群状态显示正常
在这里插入图片描述
在这里插入图片描述

Hadoop集群初体验 —— 词频统计

启动Hadoop集群

在master虚拟机上执行命令:start-all.sh
在这里插入图片描述

在虚拟机上准备文件

在master虚拟机上创建test.txt文件
在这里插入图片描述

文件上传到HDFS指定目录

上传test.txt文件到HDFS的/BigData目录(如果没有就创建目录)
在这里插入图片描述
利用HDFS命令查看文件是否上传成功
在这里插入图片描述
利用Hadoop WebUI查看文件是否上传成功
在这里插入图片描述

运行词频统计程序的jar包

查看Hadoop自带示例的jar包
在这里插入图片描述
执行命令:hadoop jar ./hadoop-mapreduce-examples-3.3.4.jar wordcount /BigData/test.txt /wc_result
查看输出目录/wc_result,执行命令:hdfs dfs -ls /wc_result
在这里插入图片描述
查看词频统计结果,执行命令:hdfs dfs -cat /wc_result/*
在这里插入图片描述
再次运行程序,会报错:输出目录已存在

在这里插入图片描述

### 搭建大数据集群的方法和教程 #### 准备工作 为了确保环境稳定,在开始搭建之前,建议备份现有配置文件。对于Hadoop组件而言,可以通过移动目录来创建快照副本[^4]。 ```bash cd /etc mv hadoop/ hadoop_20231207_93910 mv sqoop/ sqoop_20231207_93934 mv zookeeper/ zookeeper_20231207_94034 mv hive hive_20231207_94151 mv spark2/ spark2_20231207_94224 ``` #### 安装并配置MySQL 在主机`hadoop102`上安装MySQL前,需先卸载任何可能存在的旧版本以防止冲突[^1]: ```bash sudo yum remove mysql mariadb* -y ``` 完成上述操作后可继续按照官方指南或其他可靠资源指导进行新版本MySQL的部署。 #### 配置YARN应用路径 编辑`core-site.xml`文件中的`<configuration>`部分,加入如下设置项用于指定应用程序类路径[^3]: ```xml <property> <name>yarn.application.classpath</name> <!-- 添加具体classpath --> </property> ``` #### Kafka Topic创建测试 当整个集群初步构建完成后,可以利用Kafka来进行简单的消息队列功能验证。通过执行以下命令创建名为`TestKafkaTopic1`的主题[^2]: ```bash bin/kafka-topics.sh --create --bootstrap-server localhost:9092 \ --replication-factor 1 --partitions 1 --topic TestKafkaTopic1 ``` #### 使用Docker管理节点 如果采用容器化方式运行各服务实,则可通过Docker指令轻松访问特定的服务容器内部环境。如要进入名为`node1`的容器终端会话,只需键入下列命令即可实现[^5]: ```bash docker exec -it node1 /bin/bash ``` 以上步骤涵盖了从准备阶段到最终验证过程的关键环节,提供了较为完整的解决方案框架供参考实施。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值