Hive进行 insert 复杂类型array struct嵌套的字段

本文详细介绍了如何在Hive中创建包含Array<Struct>类型的表,并演示了两种向此类表插入数据的方法:使用named_struct和struct。通过具体示例,读者可以了解到正确的数据格式和插入语法。
需求:在创建表的时候有一列类型为array<struct:”id”:string,”l”:string>想要自己造数据向表里insert格式应该怎么写呢?

建表语句如下:

CREATE EXTERNAL TABLE `test.test_imp06`(
`exps` array<struct<id:string,l:string>> COMMENT ‘ceshi')

insert into 的select语句

insert into test.test_imp06
select array(named_struct('id','exp6','l','layer_3'),named_struct('id','exp7','l','layer_6')) as exps

结果:
在这里插入图片描述
还有一种写法如下:

select array(struct('id','exp6','l','layer_3'),struct('id','exp7','l','layer_6')) as exps

结果:
在这里插入图片描述
两种方法,但是如果使用struct会导致和之前的列名定义的列名无法对应。。最后还是使用name_struct喽

Hive SQL 中,`STRUCT` 和 `ARRAY` 是两种常见的复杂数据类型。以下是它们的定义和使用方法: 1. **`STRUCT`**:表示一个结构体类型,类似于其他编程语言中的对象或记录。它可以包含多个字段,每个字段有自己的名称和类型。 2. **`ARRAY`**:表示一个有序集合,其中的元素可以是任意类型(包括基本类型、`STRUCT` 或其他复杂类型)。 --- ### 示例代码 #### 1. 创建包含 `STRUCT` 和 `ARRAY` 的表 以下是一个包含 `STRUCT` 和 `ARRAY` 数据类型Hive 表示例: ```sql CREATE TABLE user_info ( id INT, name STRING, address STRUCT<city:STRING, state:STRING>, phone_numbers ARRAY<STRING> ); ``` - `address` 是一个 `STRUCT`,包含两个字段:`city` 和 `state`。 - `phone_numbers` 是一个 `ARRAY`,存储用户的电话号码列表。 --- #### 2. 插入数据 向表中插入一些示例数据: ```sql INSERT INTO user_info VALUES (1, 'Alice', NamedStruct('city', 'New York', 'state', 'NY'), array('123-456-7890', '987-654-3210')), (2, 'Bob', NamedStruct('city', 'Los Angeles', 'state', 'CA'), array('555-123-4567')), (3, 'Charlie', NamedStruct('city', 'Chicago', 'state', 'IL'), array('333-444-5555', '666-777-8888')); ``` - 使用 `NamedStruct` 创建 `STRUCT` 类型的数据。 - 使用 `array` 函数创建 `ARRAY` 类型的数据。 --- #### 3. 查询 `STRUCT` 和 `ARRAY` 查询表中的数据,并访问 `STRUCT` 和 `ARRAY` 的具体字段。 ```sql -- 查询用户信息以及他们的城市和第一个电话号码 SELECT id, name, address.city AS city, address.state AS state, phone_numbers[0] AS primary_phone FROM user_info; ``` - `address.city` 和 `address.state` 分别访问 `STRUCT` 的字段。 - `phone_numbers[0]` 访问 `ARRAY` 的第一个元素。 --- #### 4. 展开 `ARRAY` 如果需要将 `ARRAY` 中的每个元素展开为多行,可以使用 `LATERAL VIEW` 和 `explode` 函数。 ```sql -- 将 phone_numbers 展开为多行 SELECT id, name, address.city AS city, address.state AS state, phone FROM user_info LATERAL VIEW explode(phone_numbers) exploded_table AS phone; ``` - `LATERAL VIEW explode(phone_numbers)` 将 `ARRAY` 中的每个元素展开为单独的一行。 - `exploded_table AS phone` 表示将展开的结果命名为 `phone` 列。 --- ### 给出解释 1. **`STRUCT` 的使用**: - `STRUCT` 是一种组合数据类型,用于表示具有固定字段的复合对象。 - 在查询时,可以通过 `struct_name.field_name` 的方式访问 `STRUCT` 的字段。 2. **`ARRAY` 的使用**: - `ARRAY` 是一种有序集合类型,用于存储多个值。 - 可以通过索引(如 `array_name[0]`)访问 `ARRAY` 的元素,或者使用 `LATERAL VIEW` 和 `explode` 函数将其展开为多行。 3. **`LATERAL VIEW` 和 `explode`**: - 当需要将 `ARRAY` 或 `MAP` 类型的数据展开为多行时,可以使用 `LATERAL VIEW` 和 `explode` 函数。 - 这种操作非常适合处理嵌套结构的数据。 --- ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值