
hive
文章平均质量分 93
BB侠的大数据之旅
愿我们的生活不会有bug
展开
-
大数据分析利器之Hive(三):企业级hive调优
系列文章目录 大数据分析利器之Hive(一) 大数据分析利器之Hive(二) 大数据分析利器之Hive(三) 文章目录系列文章目录前言1. Hive表的数据压缩1、数据的压缩说明2、压缩配置参数3、开启Map输出阶段压缩4、 开启Reduce输出阶段压缩2. Hive表的文件存储格式1、列式存储和行式存储2 、TEXTFILE格式3 、ORC格式4 、PARQUET格式5、 主流文件存储格式(TEXTFILE/ORC/PARQUET)3、存储和压缩结合1. 创建一个非压缩的的ORC存储方式2. 创建一个原创 2021-03-26 16:35:54 · 201 阅读 · 0 评论 -
SQL必练50题(HQL版)
HQL 50题 1.建表 create table study.student ( student_id string -- 学生编号 ,name string -- 学生姓名 ,birthday string -- 学生生日 ,sex string -- 学生性别 ) stored as parquet tblproperties("orc.compress"="snappy"); create table stu原创 2021-03-22 10:26:07 · 636 阅读 · 1 评论 -
大数据分析利器之Hive(二):Hive的动态分区、静态分区和分桶表
系列文章目录 大数据分析利器之Hive(一) 大数据分析利器之Hive(二) 文章目录系列文章目录前言1.Hive的分桶表1.1 分桶表原理1.2 作用1.3 案例演示:创建分桶表2.Hive数据导入2.1 直接向表中插入数据(强烈不推荐使用)2.2 通过load加载数据(必须掌握)2.3 通过查询加载数据(必须掌握)2.4 查询语句中创建表并加载数据(as select)2.5 创建表时指定location2.6 export导出与import 导入 hive表数据(内部表操作)3. Hive数据导出原创 2021-03-22 10:13:47 · 1236 阅读 · 3 评论 -
大数据分析利器之Hive(一):数仓与数据库的区别以及hive的各种DDL语法
系列文章目录 大数据分析利器之Hive(一) 文章目录系列文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结 前言 本文主要围绕hive的基础知识点进行讲解。主要包括以下几个方面: hive的核心概念 hive与数据库的区别 hive的架构原理 hive的交互方式 hive的数据类型 hive的DDL语法操作 提示:以下是本篇文章正文内容,下面案例可供参考 一、pandas是什么? 示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的原创 2021-03-11 11:18:32 · 628 阅读 · 1 评论