CDH整合Tez:图文步骤编程
CDH(Cloudera Distribution including Apache Hadoop)是一种开源的Hadoop分发版,而Tez则是一个基于YARN的高性能数据处理框架。本文将介绍CDH如何与Tez整合,以便在CDH集群上运行Tez作业。
步骤一:准备环境
首先,确保你已经安装了CDH集群,并且所有的节点都已正常运行。此外,你还需要安装Tez。在CDH中,可以通过Cloudera Manager进行安装和管理。
步骤二:配置Tez
-
在Cloudera Manager中,选择你的CDH集群,然后点击"Services"选项卡。
-
在"Services"页面中,找到"YARN"服务,然后点击它。
-
在"YARN"服务页面中,点击"Configuration"选项卡。
-
在"Configuration"页面中,搜索"yarn-site.xml"配置文件,并点击它。
-
在"yarn-site.xml"配置文件页面中,找到"yarn.application.classpath"属性,并点击"添加属性"按钮。
-
在"属性名称"输入框中,输入"yarn.application.classpath",然后在"属性值"输入框中,输入以下值(每个值之间用逗号分隔):
$HADOOP_CONF_DIR,$HADOOP_COMMON_HOME/*,$HADOOP_COMMON_HOME/lib/*,$HADOOP_H
本文详述了如何在CDH集群上整合并运行Tez作业,包括环境准备、配置Tez、编写Tez作业及运行作业的详细步骤。
订阅专栏 解锁全文
615

被折叠的 条评论
为什么被折叠?



