Python连接Impala/Hive

本文介绍了在Python3.5环境下,使用Impyla连接分布式查询引擎的测试过程。包括安装Impyla及其依赖包,测试连接Impala,安装特定版本的thrift_sasl以解决连接Hive报错问题,最后测试连接Hive。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

测试环境:Python3.5、Impala2.10.0、Impyla0.15.0

Impyla是用于分布式查询引擎的HiveServer2实现(如Impala、Hive)的python客户端。

1、安装Impyla
安装依赖包:

sudo pip install six
sudo pip install bit_array
sudo pip install thriftpy

安装Impyla:

sudo pip install impyla

2、测试连接impala

#-*- coding: utf-8 -*-

from impala.dbapi import connect

conn = connect(host='192.168.1.188', port=21050)
#conn = connect(host=host, port=prot_impala, user='', password='', auth_mechanism='')
cur = conn.cursor()
cur.execute('select name from user limit 10')
data_list=cur.fetchall()

for data in data_list:
    print("用户名称:" + str(data[0]))

3、安装thrift_sasl
thrift_sasl是连接Hive的依赖包,此处需要安装0.2.1版本(默认安装的0.3.0会报错’TSocket’ object has no attribute ‘isOpen’)

sudo pip install thrift-sasl==0.2.1

4、测试连接Hive

#-*- coding: utf-8 -*-

from impala.dbapi import connect

conn = connect(host='192.168.1.188',port=10000)
#conn = connect(host=host, port=prot_impala, user='', password='', auth_mechanism='')
cur = conn.cursor()

cur.execute("select * from abc where date='2019-05-28'")
data_list=cur.fetchall()

for data in data_list:
    print(data)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值