Hive内置数据类型

Hive的内置数据类型可以分为两大类:(1)、基础数据类型;(2)、复杂数据类型。其中,基础数据类型包括:TINYINT,SMALLINT,INT,BIGINT,BOOLEAN,FLOAT,DOUBLE,STRING,BINARY,TIMESTAMP,DECIMAL,CHAR,VARCHAR,DATE。下面的表格列出这些基础类型所占的字节以及从什么版本开始支持这些类型。

数据类型 所占字节 开始支持版本
TINYINT 1byte,-128 ~ 127  
SMALLINT 2byte,-32,768 ~ 32,767  
INT 4byte,-2,147,483,648 ~ 2,147,483,647  
BIGINT 8byte,-9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807  
BOOLEAN    
FLOAT 4byte单精度  
DOUBLE 8byte双精度  
STRING    
BINARY   从Hive0.8.0开始支持
TIMESTAMP   从Hive0.8.0开始支持
DECIMAL   从Hive0.11.0开始支持
CHAR   从Hive0.13.0开始支持
VARCHAR   从Hive0.12.0开始支持
DATE   从Hive0.12.0开始支持

  复杂类型包括ARRAY,MAP,STRUCT,UNION,这些复杂类型是由基础类型组成的。

   ARRAY:ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由['apple','orange','mango']组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;
   MAP:MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中username是key,password是value;那么我们可以通过userlist['username']来得到这个用户对应的password;
   STRUCT:STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。
   UNION: UNIONTYPE,他是从Hive 0.7.0开始支持的。

  创建一个包含复制类型的表格可以如下

[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. CREATE TABLE employees (  
  2.     name STRING,  
  3.     salary FLOAT,  
  4.     subordinates ARRAY<STRING>,  
  5.     deductions MAP<STRING, FLOAT>,  
  6.     address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>  
  7. ) PARTITIONED BY (country STRING, state STRING);  
### Hive基本数据类型使用指南 Hive支持多种原生数据类型,这些数据类型涵盖了数值型、字符型和时间戳等多种类别。以下是每种数据类型的详细说明及其使用的示例。 #### 数值型数据类型 - **Tinyint**: 占用1字节,取值范围为`-128 ~ 127`。 ```sql CREATE TABLE example_tinyint (value TINYINT); INSERT INTO example_tinyint VALUES (100Y); -- 'Y'表示tinyint类型 ``` - **Smallint**: 占用2字节,取值范围为`-32,768 ~ 32,767`。 ```sql CREATE TABLE example_smallint (value SMALLINT); INSERT INTO example_smallint VALUES (100S); -- 'S'表示smallint类型 ``` - **Int**: 占用4字节,取值范围为`-2,147,483,648 ~ 2,147,483,647`。 ```sql CREATE TABLE example_int (value INT); INSERT INTO example_int VALUES (100); -- 默认为int类型 ``` - **Bigint**: 占用8字节,取值范围极大。 ```sql CREATE TABLE example_bigint (value BIGINT); INSERT INTO example_bigint VALUES (100L); -- 'L'表示bigint类型 ``` - **Float/Double**: 浮点数类型,分别占用4字节和8字节。 ```sql CREATE TABLE example_float_double ( float_value FLOAT, double_value DOUBLE ); INSERT INTO example_float_double VALUES (3.14F, 3.14D); -- F/D区分float/double ``` - **Decimal**: 高精度浮点数,适合金融计算场景。 ```sql CREATE TABLE example_decimal (value DECIMAL(9, 8)); INSERT INTO example_decimal VALUES (CAST('3.1415926' AS DECIMAL(9, 8))); ``` #### 字符型数据类型 - **String**: 可变长度字符串,无固定上限。 ```sql CREATE TABLE example_string (value STRING); INSERT INTO example_string VALUES ('abc'); ``` - **Varchar**: 固定最大长度的字符串,范围为1~65535。 ```sql CREATE TABLE example_varchar (value VARCHAR(10)); -- 定义最大长度为10 INSERT INTO example_varchar VALUES ('abcdefg'); ``` - **Char**: 固定长度字符串,范围为1~255。 ```sql CREATE TABLE example_char (value CHAR(10)); -- 定义固定长度为10 INSERT INTO example_char VALUES ('abcdef'); -- 不足部分会被填充为空格 ``` #### 时间与日期类型 - **Date**: 表示日期,格式为`YYYY-MM-DD`。 ```sql CREATE TABLE example_date (value DATE); INSERT INTO example_date VALUES (CAST('2024-05-01' AS DATE)); ``` - **Timestamp**: 表示精确到纳秒的时间戳。 ```sql CREATE TABLE example_timestamp (value TIMESTAMP); INSERT INTO example_timestamp VALUES ('2024-05-01 12:34:56.789'); ``` #### 特殊类型 - **Boolean**: 布尔类型,仅能存储`TRUE`或`FALSE`。 ```sql CREATE TABLE example_boolean (value BOOLEAN); INSERT INTO example_boolean VALUES (TRUE); ``` - **Binary**: 存储二进制数据。 ```sql CREATE TABLE example_binary (value BINARY); INSERT INTO example_binary VALUES (UNHEX('ABCDEF')); ``` --- ### 数据类型之间的转换 Hive允许通过隐式或显式方式进行数据类型转换: - **隐式转换** - 所有整数类型均可自动转换为其范围更大的类型[^5]。 - `TINYINT -> SMALLINT -> INT -> BIGINT`。 - 示例: ```sql SELECT tinyint_column * bigint_column FROM table_name; ``` - **显式转换** 使用`CAST()`函数完成强制类型转换。 - 将字符串转为整数: ```sql SELECT CAST('123' AS INT) AS result; ``` - 将整数转为字符串: ```sql SELECT CAST(123 AS STRING) AS result; ``` - 将浮点数转为整数: ```sql SELECT CAST(1.1 AS INT) AS result; -- 结果可能因舍入规则而变化 ``` --- ### 总结 Hive提供了丰富的数据类型以满足各种业务需求。开发者可以根据实际应用场景选择合适的数据类型利用其内置的转换机制灵活处理不同类型间的交互[^4][^5]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值