测试hadoop集群的读写能力

本文记录了使用CDH集群进行读写性能测试的过程,通过执行10个128MB文件的读写操作,详细展示了测试结果,包括吞吐量、平均IO速率和执行时间等关键指标。

本人安装的是cdh

本次实验是执行 10个文件每个文件是128mb 拿三台测试集群进行测试

执行如下

写能力测试

hadoop jar /opt/cloudera/parcels/CDH/jars/hadoop-mapreduce-client-jobclient-3.0.0-cdh6.1.0-tests.jar   TestDFSIO -write -nrFiles 10 -fileSize 128MB

得到的结果

20/05/26 16:22:23 INFO fs.TestDFSIO: ----- TestDFSIO ----- : write
20/05/26 16:22:23 INFO fs.TestDFSIO:             Date & time: Tue May 26 16:22:23 CST 2020
20/05/26 16:22:23 INFO fs.TestDFSIO:         Number of files: 10
20/05/26 16:22:23 INFO fs.TestDFSIO:  Total MBytes processed: 1280 //总文件大小
20/05/26 16:22:23 INFO fs.TestDFSIO:       Throughput mb/sec: 279.9  //吞吐量
20/05/26 16:22:23 INFO fs.TestDFSIO:  Average IO rate mb/sec: 313.91 //  平均IO速率
20/05/26 16:22:23 INFO fs.TestDFSIO:   IO rate std deviation: 102.48 //IO速率标准偏差
20/05/26 16:22:23 INFO fs.TestDFSIO:      Test exec time sec: 19.02 //整体时间

读能力测试

hadoop jar /opt/cloudera/parcels/CDH/jars/hadoop-mapreduce-client-jobclient-3.0.0-cdh6.1.0-tests.jar   TestDFSIO -read -nrFiles 10 -fileSize 128MB

结果

20/05/26 16:24:46 INFO fs.TestDFSIO: ----- TestDFSIO ----- : read
20/05/26 16:24:46 INFO fs.TestDFSIO:             Date & time: Tue May 26 16:24:46 CST 2020
20/05/26 16:24:46 INFO fs.TestDFSIO:         Number of files: 10
20/05/26 16:24:46 INFO fs.TestDFSIO:  Total MBytes processed: 1280
20/05/26 16:24:46 INFO fs.TestDFSIO:       Throughput mb/sec: 442.6
20/05/26 16:24:46 INFO fs.TestDFSIO:  Average IO rate mb/sec: 863.31
20/05/26 16:24:46 INFO fs.TestDFSIO:   IO rate std deviation: 661.44
20/05/26 16:24:46 INFO fs.TestDFSIO:      Test exec time sec: 18
### Hadoop集群读写性能测试方法 #### 1. 准备工作 在执行Hadoop集群的读写性能测试之前,需确保Hadoop环境已正确配置并启动。可以通过以下命令验证Hadoop服务状态: ```bash jps ``` 此命令应显示NameNode、DataNode等相关进程正在运行。 --- #### 2. 写性能测试 写入性能测试通过`TestDFSIO`工具完成,该工具位于Hadoop安装目录下的`mapreduce`模块中。以下是具体命令及其参数解释: **命令** ```bash hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.x-tests.jar TestDFSIO -write -nrFiles 10 -size 10MB ``` **参数说明** - `-write`: 表示进行写操作。 - `-nrFiles 10`: 创建10个文件用于测试- `-size 10MB`: 每个文件大小为10MB。 上述命令会向HDFS写入指定数量和大小的文件,并记录写入时间以评估写性能[^3]。 --- #### 3. 读性能测试 读取性能测试同样依赖于`TestDFSIO`工具。以下是具体的读取测试命令及其参数解释: **命令** ```bash hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.x-tests.jar TestDFSIO -read -nrFiles 10 -fileSize 128MB ``` **参数说明** - `-read`: 表示进行读操作。 - `-nrFiles 10`: 测试读取10个文件。 - `-fileSize 128MB`: 每个文件大小为128MB。 此命令会对先前创建的文件进行读取操作,并统计平均读取速度作为衡量标准[^4]。 --- #### 4. 清理测试数据 为了防止多次测试之间的干扰,在每次测试完成后建议清理生成的数据文件。使用以下命令删除测试过程中产生的临时文件: **命令** ```bash hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.x-tests.jar TestDFSIO -clean ``` 此命令将移除所有由`TestDFSIO`工具生成的测试文件。 --- #### 5. 结果分析 执行以上命令后,系统会在控制台输出详细的性能指标,包括但不限于吞吐量(Throughput)、每秒传输字节数等。这些数据可用于进一步优化Hadoop集群的资源配置或网络带宽调整。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值