Hive源码阅读环境准备

本文介绍了如何从github或gitee下载Hive源码,重点在于本地编译Hive项目,配置IDEA进行源码调试,包括设置远程JVMDebug,以及在Hive客户端开启debug模式来追踪SQL的解析和执行过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

源码地址

hive源码地址在github或gitee均可以下载,如果没有vpn工具,使用gitee网速更快点。
github地址为:

https://github.com:edingbrugh/hive.git

gitee地址如下:

https://gitee.com/apache/hive.git
环境要求
  • 本地或远程已经安装hive
  • jdk 8+
  • maven 3.6+
  • idea安装antlr插件
编译

本地编译hvie项目,在本地编译hive项目之前首先需要确保有一个可用的hive环境,才能进行源码调试。

# 下载hive项目
git clone https://gitee.com/apache/hive.git
# 进入clone的hive根目录
cd hive
# 编译hive项目
mvn clean package -DskipTests -Pdist
导入Idea

将编译好的hive项目导入idea中,导入后的hive项目目录如下
在这里插入图片描述

配置启动入口

将hive项目导入idea后,还需要配置源码调试入口。配置流程如下:Run -> Edit Configurations -> + -> Remote JVM Debug。然后配置远程的ip和port即可。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

hive配置客户端debug模式

在已经安装的hive机器上开启debug模式,开启debug模式之后,会卡住如果没有配置、运行Idea的Remote JVM Debug。开启debug如下:

bin/hive --debug -hiveconf hive.root.logger=DEBUG,console

启动后即可获取debug的端口,如下
在这里插入图片描述
hive的cli的入口为CliDriver#main

org.apache.hadoop.hive.cli.CliDriver

以下为在hive-cli中执行show databases的调试。
在这里插入图片描述
至此hive源码调试环境已经搭建完成,可以从CliDriver#main方法作为入口一步步调试了解hive sql如何解析、校验、最后转化MR的流程。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值