一、FSNamesystemFilesTotal:HDFS文件总数BlocksTotal:HDFS的Block总数CapacityTotalGB:HDFS文件系统总容量CapacityUsedGB:HDFS已使用的容量NonDfsUsedSpace:HDFS未使用但是已占用的容量CapacityRemainingGB:HDFS空余容量TotalLoad:HDFS连接数二、NameNode_RPCgetFileInfo_num_ops:查询文件信息的数次getFileInfo_avg_time:查询文件信息的平均时间getListing_num_ops:查询文件列表的数次getListing_avg_time:查询文件列表的平均时间delete_num_ops:删除文件的次数delete_avg_time:删除的平均时间mkdirs_num_ops:新建目录的次数mkdirs_avg_time:新建目录的时间create_num_ops:创建文件的数次create_avg_time:创建文件的平均时间renewLease_num_ops:重命名的次数renewLease_avg_time:重命名的平均时间addBlock_num_ops:写入block的数次addBlock_avg_time:写入的平均时间blockReceived_num_ops:block响应的次数blockReceived_avg_time:响应的平均时间setSafeMode_num_ops:安全模式的次数setSafeMode_avg_time:处于安全模式的平均时间getBlockLocations_num_ops:获取block位置的次数getBlockLocations_avg_time:该操作的平均时间fsync_num_ops:文件同步的次数fsync_avg_time:同步的平均时间RpcQueueTime_num_ops:rpc队列中完成rpccap做的数目RpcQueueTime_avg_time:该操作的平均时间RpcProcessingTime_num_ops:RPC在交互中的连接数RpcProcessingTime_avg_time:交互的平均时间三、NameNodeMetricsFilesCreated:已创建的文件个数FilesAppended:已插入的文件个数GetBlockLocations:获取block位置的操作数FilesRenamed:重命名文件个数GetListingOps:查询列表的数次CreateFileOps:创建文件的数次FilesDeleted:已删除文件个数DeleteFileOps:删除文件次数FileInfoOps:查看文件信息的数次AddBlockOps:插入block的次数Transactions_num_ops:传输的次数Transactions_avg_time:传输平均时间Syncs_num_ops:同步次数Syncs_avg_time:同步平均时间JournalTransactionsBatchedInSync:定期同步处理的传输量blockReport_num_ops:block报告次数blockReport_avg_time:报告平均时间fsImageLoadTime:加载fsImage的时间FilesInGetListingOps:getlist操作次数四、NameNode_WarningCorruptBlocks:损坏的blockExcessBlocks:多余的blockMissingBlocks:丢失的blockUnderReplicatedBlocks:副本数量不足的blockPercentRemaining:空间使用百分比LiveNodes:存活的节点个数DeadNodes:出问题的节点个数DeadNodesServer:出问题的节点名称五、HMasternameAsString:表名称readRequestsCount:读取请求个数(readRequestCount与客户端读取数据的个数不等价,而且大部分情况下readRequestCount 远小于客户端读取数据个数,因为next(1000)只算一次请求)requestsCount:请求次数rootIndexSizeKB:根索引容量storefileIndexSizeMB:storefile索引的大小storefileSizeMB:storefile文件大小storefiles:storefiles文件个数stores:stores的文件个数totalCompactingKVs:压缩的KeyValue数量totalStaticBloomSizeKB:store上所有bloom容量totalStaticIndexSizeKB:静态索引大小writeRequestsCount:写入请求个数(riteRequestCount与客户端写操作个数不完全等价,批量写只记做一次请求,大部分情况下writeRequestCount远小于客户端写操作的个数(尤其批量写频繁的情况下)currentCompactedKVs:当前压缩完成的KeyValue数量memStoreSizeMB:RegionServer中所有HRegion中的memstore大小的总和六、Hbase_Master_WarningZookeeper:Zookeeper的个数DeadRegion:出问题的节点个数DeadRegionServers:出问题的节点名称七、JobTracker_RPCRpcQueueTime_num_ops:rpc队列中完成rpccap做的数目RpcQueueTime_avg_time:该操作的平均时间RpcProcessingTime_num_ops:RPC在交互中的连接数RpcProcessingTime_avg_time:交互的平均时间getSystemDir_num_ops:访问系统目录的次数getSystemDir_avg_time:访问系统目录的平均时间getStagingAreaDir_num_ops:访问等待区目录的次数getStagingAreaDir_avg_time:访问等待区目录的平均时间getNewJobId_num_ops:创建新jobid的次数getNewJobId_avg_time;平均时间submitJob_num_ops:提交job的次数submitJob_avg_time:平均时间getJobStatus_num_ops:获取job状态次数getJobStatus_avg_time:平均时间getTaskCompletionEvents_num_ops:完成的task次数getTaskCompletionEvents_avg_time:平均时间getJobCounters_num_ops:job数量getJobCounters_avg_time:平均时间八、JobTrackerMetricsmap_slots:全局map_slots的资源数量reduce_slots:全局reduce_slots的资源数量maps_launched:启动的map数量maps_completed:完成的数量maps_failed:失败的数量reduces_launched:启动的reduces数量reduces_completed:完成的数量reduces_failed:失败的数量waiting_maps:等待的mapwaiting_reduces:等待的reducesjobs_failed:失败的jobjobs_killed:kill的job九、TaskTrackerMetricsRpcQueueTime_num_ops:rpc队列中完成rpccap做的数目RpcQueueTime_avg_time:该操作的平均时间RpcProcessingTime_num_ops:RPC在交互中的连接数RpcProcessingTime_avg_time:交互的平均时间getTask_num_ops:当子进程启动后,获取jvmtask的次数getTask_avg_time:当子进程启动后,获取jvmtask的平均时间getMapCompletionEvents_num_ops: reduce获取已经完成的map输出地址事件的次数getMapCompletionEvents_avg_time:reduce获取已经完成的map输出地址事件的平均时间commitPending_num_ops:提交挂起的次数commitPending_avg_time:平均时间tasks_completed:已完成的task次数tasks_failed_timeout:失败超时的task次数tasks_failed_ping:因tasktracker与task交互失败导致的失败的task数目十、DataNodeMetricsbytes_written:写入字节数bytes_read:读取字节数blocks_written:硬盘写入block的次数blocks_read:硬盘读取block的次数blocks_replicated:block的复制总数blocks_removed:删除block的数量blocks_verified:blcok验证的次数block_verification_failures:block验证失败的次数blocks_get_local_pathinfo:blcok获取本地路径信息的次数reads_from_local_client:从本地读取block的次数reads_from_remote_client:远程读取block的次数writes_from_local_client:写入本地的次数writes_from_remote_client:写入远程的次数readBlockOp_num_ops:读块总次数 一般和dfs.datanode.blocks_read一致,先从硬盘读入输入流,增加dfs.datanode.blocks_read计数,然后再增加该计数readBlockOp_avg_time:读块的平均时间writeBlockOp_num_ops:写块总次数一般和dfs.datanode.blocks_written一致,先从硬盘,增加dfs.datanode.blocks_read计数,然后再增加该计数writeBlockOp_avg_time:写块的平均时间ThreadCount:线程数十一、 RegionServerMetricsThreadCount:线程数totalStaticIndexSizeKB: HRegionServer上每个HFile文件的IndexSize的大小,这是指未压缩的,不带有其它信息的所有HFileBlockIndex信息的总和blockCacheFree:block cache中空闲的内存大小memstoreSizeMB:memstore大小的总和blockCacheCount:RegionServer中缓存到blockcache中block的个数blockCacheHitRatio: blockCache命中比例blockCacheHitCachingRatio:HitCache表示因为读取不到而cacheblock的行为,blockCacheHitCachingRatio表示发生该行为的比率blockCacheHitCount:blockCache命中次数hdfsBlocksLocalityIndex:统计RegionServer所在机器的数据本地化的概率writeRequestsCount:写请求的数量:writeRequestCount与客户端写操作个数不完全等价,批量写只记做一次请求,大部分情况下writeRequestCount远小于客户端写操作的个数(尤其批量写频繁的情况下)compactionTimeMinTime:压缩的最短时间compactionTimeMaxTime:压缩的最大时间blockCacheSize:blockCache大小readRequestsCount:读请求的数量:readRequestCount与客户端读取数据的个数不等价,而且大部分情况下readRequestCount 远小于客户端读取数据个数,因为next(1000)只算一次请求rootIndexSizeKB: storefileIndex的大小,和storefileIndexSizeMB相同blockCacheMissCount:blockCache非命中比例blockCacheHitRatioPastNPeriods:周期内的缓存命中率blockCacheHitCachingRatioPastNPeriods:周期内读取不到而cacheblock的行为的比率storefiles:Storefiles的个数blockCacheEvictedCount:BlockCache中被换出的Block的个数stores: RegionServer包含的Store的个数requests:请求的数量十二、JVMmemNonHeapUsedM: JVM已使用的非堆的大小memNonHeapCommittedM:JVM分配给非堆的大小memHeapUsedM:jvm使用堆内存大小memHeapCommittedM:JVM分配的堆大小gcCount:JVM进行GC的次数gcTimeMillis:GC花费的时间,单位为微妙ThreadCount:线程数threadsNew:处于NEW状态线程数量threadsRunnable:处于RUNNABLE状态线程数量threadsBlocked:处于BLOCKED状态线程数量threadsWaiting:处于WAITING状态线程数量threadsTimedWaiting:处于TIMED_WAITING状态线程数量threadsTerminated:处于TERMINATED状态线程数量
rpc.metrics.R_avg_time.rrd 在固定间隔内R的平均操作时间 rpc.metrics.R_num_ops.rrd 在固定间隔内请求R的次数 rpc.metrics.RpcQueueTime_avg_time.rrd RPC在call队列中等待平均时间 rpc.metrics.RpcQueueTime_num_ops.rrd RPC在call队列中等待的数量 rpc.metrics.RpcProcessingTime_avg_time.rrd 平均处理一个RPC所消耗时间 rpc.metrics.RpcProcessingTime_num_ops.rrd 实际处理RPC的数量
hadoop_performance
最新推荐文章于 2025-08-10 19:30:00 发布
本文详细探讨了Hadoop与Spark在大数据处理领域的应用,包括它们各自的优势、工作原理以及在实际项目中的实践案例。介绍了如何利用Hadoop进行大规模数据存储与管理,以及Spark如何提供高效的数据处理能力,特别强调了两者在复杂数据分析任务中的协同作用。
876

被折叠的 条评论
为什么被折叠?



