ASDF:用于诊断Hadoop性能问题的自动化在线框架
在当今的大数据环境中,Hadoop作为一个广泛使用的分布式计算框架,其性能问题的诊断至关重要。ASDF(Automated, Online Framework for Diagnosing Performance Problems)为解决Hadoop性能问题提供了一种有效的自动化在线诊断方案。下面将详细介绍ASDF的相关内容,包括数据收集、分析模块、设计选择以及在Hadoop中的应用。
1. 数据收集
在ASDF中,数据收集是诊断性能问题的基础。系统的各种性能指标,如CPU使用率、上下文切换率、分页活动、I/O活动、文件使用情况、网络活动(针对特定协议)和内存使用等,传统上会记录在 /proc 伪文件系统中,并通过 /proc 解析工具(如 sysstat 包中的 sadc )进行收集。
ASDF使用了修改版的 sysstat 代码,以库 libsadc 的形式存在,它能够以C数据结构的形式收集系统级和进程级的统计信息。 ASDF sadc 数据收集模块将这些 /proc 黑盒指标作为 fpt-core 的输出,并提供给 fpt-core 的分析模块。
为了收集远程统计信息,ASDF使用了ZeroC的ICE(Internet Communications Engine)RPC来生成RPC存根,这些存根与
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



