
hive
黑尾土拨鼠
远处的是风景,近处的才是人生
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Spark实战(六)spark SQL + hive(Python版)
一、hive环境准备1、安装hive 按照hive安装步骤安装好hiveCREATE USER 'spark'@'%' IDENTIFIED BY '123456';GRANT all privileges ON hive.* TO 'spark'@'%';flush privileges;2、环境配置 将配置好的hive-site.xml放入$SPARK-HOME/...原创 2019-01-10 13:54:29 · 9684 阅读 · 0 评论 -
hadoop实战(七)hiveserver2无法启动
hive配置后无法正常启动解决步骤1.修改core-site.xml core-site.xml增加如下内容:<property> <name>hadoop.proxyuser.root.hosts</name> <value>*</value></property><pr...原创 2019-02-19 15:55:38 · 7154 阅读 · 0 评论 -
hadoop实战(八)hive常用函数及练习小示例
首先准备三个表的数据student表—学生基本信息 新建一个student.txt文件,增加如下内容:95001,李勇,男,20,CS95002,刘晨,女,19,IS95003,王敏,女,22,MA95004,张立,男,19,IS95005,刘刚,男,18,MA95006,孙庆,男,23,CS95007,易思玲,女,19,MA95008,李娜,女,18,CS95009,梦...原创 2019-02-25 16:24:18 · 757 阅读 · 0 评论 -
Spark实战(十一)Spark2.x集成Hive
一、Hive配置(一)、简介 一般的公司都会有自己的数据仓库,而大多数都选择的Hive数据仓库,总所周知hive默认使用MapReduce来进行数据操作,MapReduce在计算过程中会涉及数量巨大的网络传输,这需要耗费大量的时间,在计算过程中会反复读写磁盘,极其耗时,因此使用spark来计算可以提高效率,但是之前有很多数据都是通过hive来操作,好在spark可以无缝集成hive,使用h...原创 2019-04-03 17:48:31 · 1171 阅读 · 0 评论