
hive
文章平均质量分 60
愚昧之山绝望之谷开悟之坡
人工智能智慧城市元宇宙pf,无无明亦无无明尽
展开
-
python hive集群链接方式
# 环境pip install pyhive thrift kazoo sasl thrift_sasl (yum -y install cyrus-sasl cyrus-sasl-devel cyrus-sasl-lib)# 1.普通地址 jdbc:hive2://****:10000/default# 2.基于zk的高可用地址 jdbc:hive2://****:2181,****:2181,*****:2181/default;serviceDiscoveryMode=zooKeeper;zo原创 2021-09-07 10:57:11 · 1142 阅读 · 0 评论 -
快速查询hive数据仓库表中的总条数
Author: kwu 快速查询hive数据仓库中的条数,在查询hive表的条数,通常使用count(*),但是数据量大的时候,mr跑count(*)往往需要几分钟的时间。 1、传统方式获得总条数如下: [sql] view plain copy select count(*) from ods.tracklog; &nb...原创 2021-05-11 16:52:55 · 4388 阅读 · 0 评论 -
linux Python-安装sasl包的错误
yum install gcc-c++ python-devel.x86_64 cyrus-sasl-devel.x86_64pip install pyhs2原创 2021-05-08 15:30:31 · 3371 阅读 · 2 评论 -
python通过SSH链接HIVE
from sshtunnel import SSHTunnelForwarderfrom pyhive import hiveimport pandas as pdserver = SSHTunnelForwarder( ssh_address_or_host=('XX', 2210), ssh_password='XX', ssh_username='XX', remote_bind_address=('XX',10000))server.start()co原创 2021-05-07 18:17:38 · 514 阅读 · 0 评论 -
Windows10系统下Hadoop和Hive开发环境搭建填坑指南
Windows10系统下Hadoop和Hive开发环境搭建填坑指南 笔者目前需要搭建数据平台,发现了Windows系统下,Hadoop和Hive等组件的安装和运行存在大量的坑,而本着有坑必填的目标,笔者还是花了几个晚上的下班时候在多个互联网参考资料的帮助下完成了Windows10系统下Hadoop和Hive开发环境的搭建。这篇文章记录了整个搭建过程中的具体步骤、遇到的问题和对应的解决方案。 ...原创 2021-05-07 17:23:24 · 739 阅读 · 0 评论 -
Window 安装Hive
基本环境资源 Hadoop:2.7.X Hive:2.1.X.bin.tar.gz 版本 Hive:1.x.src.tar.gz 源码版本 第一步:windows 安装Hadoop2.7.x,请参考: 第二步:下载Hive.tar.gz,官网下载地址:http://archive.apache.org/dist/hive 第二步:解压Hive.tar.gz 至指定文件夹目录(C:\hive),配置Hive 全局环境变量。 Hive 全局环境变量...原创 2021-05-07 17:21:57 · 1063 阅读 · 0 评论 -
DBeaver/hive
DBeaver一样的配置,host代表ip端口默认是10000,然后数据库名,用户名,密码等,一样通过ssh链接,一样需要配置好这个跳板机服务器的ip,port,用户名,密码。链接超时的话代表服务器响应过慢,把链接时间扩大添加个0即可,所以的客户端都是通用的原理。安装依赖包:其中sasl安装可能会报错,可以去https://www.lfd.uci.edu/~gohlke/pythonlibs/#sasl下载对应版本安装。下载下来后可以直接本地安装Python操作Hive的两种方法总结_Cla原创 2021-05-07 15:17:36 · 1026 阅读 · 0 评论 -
python操作hive和hive_sql语句
Hive是一个数据仓库基础的应用工具,在Hadoop中用来处理结构化数据,通过类SQL语言对数据进行操作。Hive将sql语句通过解析器转换成MapReduce作业提交到Hadoop集群上,Hadoop监控作业执行过程,并将执行结果返回给用户。 值得注意的是,Hive并不支持行级数据的更新,主要使用场合为大数据集的批处理作业中。 下面为Hive中常用的SQL语句,‘[ ]’中的内容根据实际需求来确定要不要写。复制代码– 创建数据库create database name;– 常用显示命令s原创 2021-05-06 16:00:46 · 5591 阅读 · 0 评论