
Hive
文章平均质量分 90
终极量化数据
十多年.Net,Java后台开发经验,丰富的python爬虫和数据分析能力,专注于研究大数据和人工智能技术,理论,架构与原型实现,每周分享技术干货。同时致力于python量化投资分析,欢迎关注,一起做技术研究和交流。
个人原创公众号「 猫头鹰数据分析 」,更新技术干货,欢迎关注!!!
展开
-
大数据分析学习第十八课 CDH6.3.2详细安装配置
yum -y install wget下载文件wget -c http://119.29.179.227/cdh/CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcelcdh6.1.0 离线包:CDH-6.1.0-1.cdh6.1.0.p0.770702-el7.parcelCDH-6.1.0-1.cdh6.1.0.p0.770702-el7.parcel.sha256manifest.json下载: https://archive....原创 2021-10-21 11:24:05 · 3180 阅读 · 3 评论 -
Spark3.X 编译源码支持hive(亲测可用)
Spark官网提供的编译版本默认是不支持Hive的,今天就给大家介绍采用源码编译方法得到支持Hive的Spark版本原创 2021-10-13 16:04:13 · 2073 阅读 · 5 评论 -
大数据分析学习第十七课 基于Hadoop2.7.5安装Sqoop1.4.7(亲测可用)
关键字:Linux CentOS Sqoop Hadoop Hive Java版本号:CetOS7.6 Sqoop1.4.7 Hadoop2.7.5 Hive2.1.0Sqoop简介 Apache Sqoop是在Hadoop生态体系和RDBMS体系之间传送数据的一种工具。来自于Apache软件基金会提供。Hadoop生态系统包括:HDFS、Hive、Hbase等RDBMS体系包括:Mysql、Oracle、DB2等Sqoop可以理解为:“SQL 到 Hado...原创 2021-10-12 15:43:27 · 594 阅读 · 0 评论 -
大数据分析学习第十五课 自建云服务器集群离线安装Ambari2.7.5和HDP3.1.5(一)
之前了解了很多关于大数据平台一站式部署管理的工具,比如Apache Ambari和CDH,目前最新的CDH已经没有了社区版,也就是说以后使用新版本的Cloudera Manager和CDH都是要收费的,这对于很多小公司来说,可能无法承受。转向Ambari是他们的一个可选项。 Ambari是Apache的一个顶级开源项目,开源是其最大的优势,开源也意味着Ambari可以灵活地进行扩展,集成更多的数据组件,对于需要定制化和二次开发的企业来说,Ambari也极具吸引力。 由于之前学习大...原创 2021-08-10 19:16:20 · 1073 阅读 · 0 评论 -
hiveserver2服务的启动与简单使用技巧
一、hiveserver2简介Hive在生产上是不需要部署集群的,操作Hive只需要通过它提供的客户端即可,Hive提供了大致三类客户端:hive shell:通过hive shell来操作hive,但是至多只能存在一个hive shell,启动第二个会被阻塞,也就是说hive shell不支持并发操作。WebUI: 通过HUE/Zeppelin来对Hive表进行操作。基于JDBC等协议:启动hiveserver2,通过jdbc协议可以访问hive,hiveserver2支持高并发。简而言之,h原创 2021-08-02 20:14:45 · 14866 阅读 · 1 评论