Python 2.7.5操作Hive最全解析

本文介绍如何在未设置用户名和密码的默认Hive环境中,通过安装必要Python库并配置,实现Python脚本连接Hive。具体步骤包括安装sasl、thrift、thrift-sasl、PyHive等库,解决gcc错误,启动metastore和hiveserver2服务,以及编写Python脚本执行SQL查询。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前提:Hive默认用户名和密码为空,并没有做修改,可以在hive-site.xml中进行配置

(1)安装相关Python库

pip install sasl

pip install thrift

pip install thrift-sasl

pip install PyHive

安装sasl的过程中,可能会报以下错误:

error: command 'gcc' failed with exit status 

解决方法:Ubuntu系统可能需要先装好libsasl2-dev,CentOS系统需要预先装好python-devel和cyrus-sasl-devel。再pip install sasl即可

yum install gcc-c++ python-devel.x86_64 cyrus-sasl-devel.x86_64

(2)启动Hive的metastore和hiveserver2

hive --service metastore &

hive --service hiveserver2 &

hiveserver2 正常启动会默认监听10000端口,可以通过以下命令查看它是否正常启动

netstat -anp | grep 10000

(3)编写Python脚本

#!/usr/bin/env python
# -*- coding: utf-8 -*-
from pyhive import hive
conn = hive.Connection(host='hadoop000', port=10000, database='***')
cursor=conn.cursor()
cursor.execute('select * from user_log limit 10')
for each in cursor.fetchall():
    print each

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值