自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 2024.03.19Hive数据库/表定义操作

Hive DDL操作常用命令:create、drop、alter、truncate(清空表)、show、describe(显示细节)分区:将分区列的值将表划分为文件夹;分桶:是相对分区进行更细粒度的划分;

2024-03-21 13:59:14 132

原创 Hive的数据类型

MAP:一组键值对组合,如:{"a":"b","c":"d"}(key不能相同,value可以相同,可以通过key值找寻value)如:["a","b"](如果存入相同的变量,能存入吗?Hive中的基本数据类型也称为原始类型,包括整数、小数、文本、布尔、二进制以及时间类型。STRUCT:封装了一组由名字的字段,其类型可以是任意基本类型。整数:TINYINT、SMALLINT、INT、BIGINT。二进制:DATE、TIMESTAMP、INTERVAL。小数:FLOAT、DOUBLE、DECIMAL。

2024-03-12 15:31:01 142

原创 数据仓库(第四次课)查询和分析

Databases:数据库,在HDFS中表现为hive.metastore.warehouse.dir目录下的一个文件夹。Hive种的数据:有真实数据与元数据之分,元数据是表示真实数据与Hive表的映射关系。2.SEQUENCEFILE,二进制序列化过的文本存储文件格式。4.ORCFILE,对RCFILE的优化格式。3.RCFILE,面向列的数据存储格式。1.TEXTFILE,文本文件格式。1.了解Hive的存储格式与模型。2.了解Hive的数据类型。

2024-03-12 15:04:25 169

原创 Hive内容(数据仓库第三次课)存储和计算

Hive Storage and Computing:包含Hive的数据存储与计算的内容,Hive元数据存储在RDBMS中,数据存储在HDFS中,大部分数据查询和计算由MapReduce完成。场景技术特点:为超大数据集设计的计算、扩展能力、支持SQL like查询语言、支持多表的join操作、支持非结构化数据的查询与计算、提供数据存取的编程接口,支持JDBC和ODBC。Hive Client:Hive客户端,可通过Java、Python等语言连接Hive并进行与RDBMS类似的SQL查询操作。

2024-03-12 14:04:42 490

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除