Hive的基本数据类型

博客介绍了常见的数据类型,包括数值类型(整型、浮点型)、时间类型(时间戳、日期)、字符串类型(STRING、VARCHAR等)、其他类型(布尔、二进制)以及复合类型(数组、Maps、Structs),还提到复杂数据类型声明需用尖括号指明字段类型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、数值类型

  1. 整型
    TINYINT (1字节整数)
    SMALLINT (2字节整数)
    INT/INTEGER (4字节整数)
    BIGINT (8字节整数)
  2. 浮点型
    FLOAT (4字节浮点数)
    DOUBLE (8字节双精度浮点数)

二、时间类型

  1. TIMESTAMP (时间戳) (包含年月日时分秒的一种封装)
  2. DATE (日期)(只包含年月日)

三、字符串类型

  1. STRING (不设定长度)
  2. VARCHAR (字符串1-65355长度,超长截断)
  3. CHAR (字符串,最大长度255)

四、其他类型

  1. BOOLEAN(布尔类型):true false
  2. BINARY (二进制)

五、复合类型

  1. array数组类型
    一组有序字段,字段类型必须相同 ARRAY<data_type>
    eg:array(“a”,”b”,”c”)
  2. Maps:和Java中的Map相同,即存储K-V对的;
    一组无序的键/值对,键的类型必须是原子的,值可以是任意类型,同一键映射的值得类型必须相同
    MAP<primitive_type, data_type>
    eg:map(“a”,1,”b”,2)
  3. Structs:一组由任意数据类型组成的结构
    一组命名的字段,字段类型可以不同
    STRUCT<col_name : data_type, ...>
    eg:struct(“a”,1,2,3)

**复杂数据类型的声明必须使用尖括号指明其中数据字段的类型。

create table t_eg(
         col1 ARRAY< INT>,
         col2 MAP< STRING,INT>,
         col3 STRUCT< a:STRING,b:INT,c:DOUBLE>);
### Hive基本数据类型使用指南 Hive支持多种原生数据类型,这些数据类型涵盖了数值型、字符型和时间戳等多种类别。以下是每种数据类型的详细说明及其使用的示例。 #### 数值型数据类型 - **Tinyint**: 占用1字节,取值范围为`-128 ~ 127`。 ```sql CREATE TABLE example_tinyint (value TINYINT); INSERT INTO example_tinyint VALUES (100Y); -- 'Y'表示tinyint类型 ``` - **Smallint**: 占用2字节,取值范围为`-32,768 ~ 32,767`。 ```sql CREATE TABLE example_smallint (value SMALLINT); INSERT INTO example_smallint VALUES (100S); -- 'S'表示smallint类型 ``` - **Int**: 占用4字节,取值范围为`-2,147,483,648 ~ 2,147,483,647`。 ```sql CREATE TABLE example_int (value INT); INSERT INTO example_int VALUES (100); -- 默认为int类型 ``` - **Bigint**: 占用8字节,取值范围极大。 ```sql CREATE TABLE example_bigint (value BIGINT); INSERT INTO example_bigint VALUES (100L); -- 'L'表示bigint类型 ``` - **Float/Double**: 浮点数类型,分别占用4字节和8字节。 ```sql CREATE TABLE example_float_double ( float_value FLOAT, double_value DOUBLE ); INSERT INTO example_float_double VALUES (3.14F, 3.14D); -- F/D区分float/double ``` - **Decimal**: 高精度浮点数,适合金融计算场景。 ```sql CREATE TABLE example_decimal (value DECIMAL(9, 8)); INSERT INTO example_decimal VALUES (CAST('3.1415926' AS DECIMAL(9, 8))); ``` #### 字符型数据类型 - **String**: 可变长度字符串,无固定上限。 ```sql CREATE TABLE example_string (value STRING); INSERT INTO example_string VALUES ('abc'); ``` - **Varchar**: 固定最大长度的字符串,范围为1~65535。 ```sql CREATE TABLE example_varchar (value VARCHAR(10)); -- 定义最大长度为10 INSERT INTO example_varchar VALUES ('abcdefg'); ``` - **Char**: 固定长度字符串,范围为1~255。 ```sql CREATE TABLE example_char (value CHAR(10)); -- 定义固定长度为10 INSERT INTO example_char VALUES ('abcdef'); -- 不足部分会被填充为空格 ``` #### 时间与日期类型 - **Date**: 表示日期,格式为`YYYY-MM-DD`。 ```sql CREATE TABLE example_date (value DATE); INSERT INTO example_date VALUES (CAST('2024-05-01' AS DATE)); ``` - **Timestamp**: 表示精确到纳秒的时间戳。 ```sql CREATE TABLE example_timestamp (value TIMESTAMP); INSERT INTO example_timestamp VALUES ('2024-05-01 12:34:56.789'); ``` #### 特殊类型 - **Boolean**: 布尔类型,仅能存储`TRUE`或`FALSE`。 ```sql CREATE TABLE example_boolean (value BOOLEAN); INSERT INTO example_boolean VALUES (TRUE); ``` - **Binary**: 存储二进制数据。 ```sql CREATE TABLE example_binary (value BINARY); INSERT INTO example_binary VALUES (UNHEX('ABCDEF')); ``` --- ### 数据类型之间的转换 Hive允许通过隐式或显式方式进行数据类型转换: - **隐式转换** - 所有整数类型均可自动转换为其范围更大的类型[^5]。 - `TINYINT -> SMALLINT -> INT -> BIGINT`。 - 示例: ```sql SELECT tinyint_column * bigint_column FROM table_name; ``` - **显式转换** 使用`CAST()`函数完成强制类型转换。 - 将字符串转为整数: ```sql SELECT CAST('123' AS INT) AS result; ``` - 将整数转为字符串: ```sql SELECT CAST(123 AS STRING) AS result; ``` - 将浮点数转为整数: ```sql SELECT CAST(1.1 AS INT) AS result; -- 结果可能因舍入规则而变化 ``` --- ### 总结 Hive提供了丰富的数据类型以满足各种业务需求。开发者可以根据实际应用场景选择合适的数据类型,并利用其内置的转换机制灵活处理不同类型间的交互[^4][^5]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值