1. 原始数据
hive> select * from word;
OK
1 MSN
10 QQ
100 Gtalk
1000 Skype
2. 创建保存为parquet格式的数据表
hive> CREATE TABLE parquet_table(age INT, name STRING)STORED AS PARQUET;
3. 数据表的描述
hive> describe parquet_table;
hive> describe parquet_table;
OK
id int
name string
Time taken: 0.099 seconds, Fetched: 2 row(s)
4. 插入数据
hive> INSERT OVERWRITE TABLE parquet_table SELECT * FROM word;
&nb

该博客详细介绍了如何在Hive中读写Parquet格式的数据,从创建Parquet表到插入数据、查询,再到解析HDFS上的Parquet二进制文件,全面解析Hive与Parquet的交互过程。
最低0.47元/天 解锁文章
435

被折叠的 条评论
为什么被折叠?



