hadoop 之 yarn 使用命令行查看日志、结束作业

本文介绍了Yarn命令行的两个操作。一是查看日志,使用命令“yarn logs -applicationId 【作业id】”,同时需在yarn-site.xml中添加特定配置;二是结束作业,使用命令“yarn application -kill 【作业id】”,并给出了相应示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

  • 1、yarn 命令行查看日志
  • 2、yarn 命令行结束作业

1、yarn 命令行查看日志

 yarn logs -applicationId 【作业id】

例如 yarn logs -applicationId  application_1562937465914_0001

【注意】在yarn-site.xml 中添加以下配置

  • <property>
  • <name>yarn.log-aggregation-enable</name>
  • <value>true</value>
  • </property>

2、yarn 命令行结束作业

yarn application -kill 【作业id】

例如 yarn application -kill application_1562937465914_0001

### HadoopYARN 的监控与管理 #### 使用 Web 用户界面监控 YARN ResourceManager 提供了一个内置的 Web UI,用于监控整个集群的状态以及运行在其上的应用程序。通过访问 ResourceManager 所在主机的特定端口(通常是8088),用户可以获得详细的集群视图,包括但不限于正在运行的应用程序列表、已完成的任务历史记录等信息[^1]。 #### 命令行工具 `yarn` 和 `mapred` 对于偏好命令行操作或者需要自动化脚本支持的情况而言,Hadoop 提供了一系列强大的 CLI 工具来帮助管理员执行日常维护工作。例如,利用 `yarn application -list` 可以列出当前活跃的所有应用;而像 `yarn logs -applicationId <app ID>` 则允许获取指定任务的日志输出[^2]。 ```bash # 查看所有活动的应用程序 $ yarn application -list # 获取某具体应用程序的日志文件 $ yarn logs -applicationId application_1467953647646_0001 ``` #### 配置参数调整优化性能表现 为了更好地适应不同的业务场景需求,在实际部署过程中往往还需要针对具体的环境特点做出相应的配置修改。比如适当调节队列容量比例 (`yarn.scheduler.capacity.root.default.capacity`) 或者设置最大可分配内存大小(`yarn.nodemanager.resource.memory-mb`) 等关键属性值都可以显著影响到系统的整体效率和稳定性[^3]。 #### 日志分析定位问题根源 当遇到异常情况时,深入研究日志数据成为解决问题不可或缺的一环。除了前面提到过的直接从命令行提取外,还可以借助外部开源项目如 Apache Logstash 来集中收集并解析这些分散于各个节点之间的文本记录,从而更加快捷高效地发现潜在隐患所在之处。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值