Hive SQL运行状态监控（HiveSQLMonitor）

最新推荐文章于 2025-06-14 18:29:00 发布

forover2015

最新推荐文章于 2025-06-14 18:29:00 发布

阅读量4k

点赞数 3

CC 4.0 BY-SA版权

分类专栏： hive

本文链接：https://blog.youkuaiyun.com/sumo2010/article/details/50787310

hive 专栏收录该内容

18 篇文章

订阅专栏

本文介绍了一种方法，通过分析HiveSQL执行过程中的日志信息，实现对HiveSQL执行状态的实时监控与进度展示。利用会话日志、预钩子（PreHook）和自定义的REST API服务，该方法能够收集并处理日志数据，从而获取到查询执行的详细状态，包括转换为的MapReduce任务数量、各任务的进度以及最终的执行结果。同时，通过维护JobName与QueryId的关系，以及JobName与查询进度的对应，实现对查询执行进度的跟踪。尽管数据维护在内存中且服务为单点，但此方法提供了对HiveSQL执行过程的透明化监控手段。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Hive SQL运行状态监控（HiveSQLMonitor）

引言

目前数据平台使用Hadoop构建，为了方便数据分析师的工作，使用Hive对Hadoop MapReduce任务进行封装，我们面对的不再是一个个的MR任务，而是一条条的SQL语句。数据平台内部通过类似JDBC的接口与HiveServer进行交互，仅仅能够感知到一条SQL的开始与结束，而中间的这个过程通常是漫长的（两个因素：数据量、SQL复杂度），某些场景下用户需要了解这条SQL语句的执行进度，从而为我们引入以下几个问题：

（1）通过JDBC接口执行一条SQL语句时，这条SQL语句被转换成几个MR任务，每个MR任务的JobId是多少，如何维护这条SQL语句与MR任务的对应关系？

（2）如何获取MR任务的运行状态，通过JobClient？

（3）通过HiveServer是否可以获取到上述信息？

思路

当我们在终端下执行命令“hive”后，会看到有如下输出：

Hive有会话（Session）的概念，而 这次会话中的所有日志消息将会输出到这个日志文件中，包含SQL语句的执行日志，查看这个日志文件可以看到以下信息：

QueryStart行日志包含QUERY_STRING、QUERY_ID。

TaskStart行日志包含TASK_ID、QUERY_ID。

TaskProgress行日志包含TASK_HADOOP_PROGRESS、TASK_ID、QUERY_ID、TASK_HADOOP_ID，其中TASK_HADOOP_PROGRESS中可以获取到map、reduce进度。

TaskEnd行日志包含TASK_HADOOP_PROGRESS、TASK_ID、QUERY_ID、TASK_HADOOP_ID。

QueryEnd行日志包含QUERY_STRING、QUERY_ID。

由上可知，QueryStart、TaskStart、TaskProgress、TaskEnd（一个复杂的Query可能会产生多个Task）、QueryEnd覆盖整个查询的执行过程，通过对这些行日志的解析，我们就可以获取到Hive SQL的执行状态。

此外，还有SessionStart、SessionEnd，由于使用过程中发现SessionEnd日志有时不被输出，因此没有使用这两个状态。

会话的日志文件存储在HiveServer的本地磁盘中，而实际应用中我们有多台HiveServer提供服务，因此我们需要能够统一收集所有HiveServer的会话日志。

通过对Hive源码的分析发现，每次Hive执行语句时都会执行一些“Hook”（PreHook），代码如下：

通过会话日志、PreHook，我们基本可以整理出以下思路：

在PreHook中启动线程监听会话日志的输出（类型Linux的tailf），将这些日志信息统一收集到某一服务中，统一处理后做进度展示。

实现

我们构建了一个Rest API服务，一部分用于接收由PreHook发送的会话日志信息，另一部分用于对外提供进度展示。

PreHook要求实现接口ExecuteWithHookContext，如下：

通过hookContext我们可以获取到以下信息：

QueryId：

QueryStr：

HadoopJobName：

Jobs：

HistFileName：

为了保证后续对会话日志的接收，我们需要在查询执行伊始就将上述信息发送给Rest API服务，如下：

然后就是对会话日志的输出监听（即tailer），我们使用Apache Commons IO中的Tailer完成些功能，如下：

Tailer实际上启动一个后台线程，并通过listener完成数据行的处理，而一次会话中可能执行多条查询语句，而每一次执行查询语句时都会导致PreHook的执行，因此我们需要避免同一会话中对histFileName多次“tailf”,需要维护已被“tailf”的文件，而且Tailer实例是需要被“stop”的，多数时候无法获取到SessionEnd数据行，需要通过其它方式能够终止会话已经消失的Tailer线程。为此专门设计了TailerTracker（单例，即TAILER_TRACKER）。

TailerTracker维护着一个记录列表：