greenplum使用PXF访问外部数据

本文档介绍了如何使用Greenplum的PXF功能来访问存储在Hive中的不同格式的数据,包括RCFile、ORC和Parquet。通过示例展示了创建外部表的语法,以及如何查询这些格式的数据。
Greenplum平台扩展框架(PXF)通过内置连接器提供对外部数据的访问,
这些连接器可以将外部数据源映射到Greenplum数据库表,通过外部表的形式查询外部数据源。


PXF可支持访问的外部数据源有HDFS,Hive和HBase。其中可以对HDFS数据进行读和写操作。


下面介绍PXF访问Hive数据的方法
一)PXF访问Hive数据
PXF Hive连接器支持多种hive的数据格式,包括TextFile,SequenceFile,RCFile,ORC,Parquet.


1、首先,创建一个文本文件:


$ vi /tmp/pxf_hive_datafile.txt


2、将以下数据添加到pxf_hive_datafile.txt; 请注意使用逗号,分隔四个字段值:


Prague,Jan,101,4875.33
Rome,Mar,87,1557.39
Bangalore,May,317,8936.99
Beijing,Jul,411,11600.67
San Francisco,Sept,156,6846.34
Paris,Nov,159,7134.56
San Francisco,Jan,113,5397.89
Prague,Dec,333,9894.77
Bangalore,Jul,271,8320.55
Beijing,Dec,100,4248.41


3、在default数据库中创建一个命名为sales_info的Hive表(这里的hive表是textfile格式):


hive> CREATE TABLE sales_info (location string, month string,
        number_of_orders int, total_sales double)
   
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值