PostgreSQL的外部表使用

本文详细介绍了如何在PostgreSQL中使用file_fdw扩展来创建外部表,访问数据库外的文件,如CSV或TXT文件。通过创建外部表服务接口、建立外部表结构并上传文件,可以实现数据的灵活访问和利用。此外,还展示了与普通表的结合、修改外部表及工具使用的相关信息,突出了外部表的实用性和扩展性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原文链接:http://my.oschina.net/Kenyon/blog/165432


  PostgreSQL从9.1开始增加了外部表访问的功能,这个功能就是数据库直接读取数据库以外的文件,比如csv或者text等类型的文件,暂时不支持DML。PostgreSQL有各种插件能直连各种异构DB,如oracle_fdw,mysql_fdw,file_fdw等,对数据的迁移是很方便的,这是PG的扩展性较强的一个表现。这里介绍foreign data wrapper的file_fdw使用。

一、环境:
OS :CentOS 6.3
DB :PostgreSQL 9.3

二、使用过程

  • 1. 创建扩展,因为默认不安装,安装需要手工创建
[postgres@kenyon ~]$ psql
psql (9.3.0)
Type "help" for help.
postgres=# CREATE EXTENSION file_fdw;
CREATE EXTENSION
postgres=# \dx
                        List of installed extensions
   Name   | Version |   Schema   |                Description                
----------+---------+------------+----------------------------------------
 file_fdw | 1.0     | public     | foreign-data wrapper for flat file access
 plpgsql  | 1.0     | pg_catalog | PL/pgSQL procedural language
(2 rows)
  • 2. 创建外部表服务接口,查看
postgres=# create server pg_file_server foreign data wrapper file_fdw;
CREATE SERVER
postgres=# \des
             List of foreign servers
      Name      |  Owner   | Foreign-data wrapper 
----------------+----------+----------------------
 pg_file_server | postgres | file_fdw
(1 row)
  • 3. 建立一个外部表,与外部文件结构一致
postgres=# create foreign table tab_area(
            id int,
            cname varchar(80),
            create_time varchar(30)
 ) server pg_file_server options(filename '/home/postgres/data1.csv',format 'csv',header 'true',delimiter ',',null '1'); 

– 后面options里面参数的说明
– filename后面是文件名和绝对路径
– format是格式,csv是逗号分隔,text表示是tab分隔的方式
– delimiter是分隔符
– header表示第一行数据是否需要
– null表示空数据的转化处理,例子中字段1将转化为null

  • 4. 上传外部文件
[postgres@kenyon ~]$ more data1.csv 
?ID,cname,ename,create_time
1,浙江,zhejiang,2013-01-01
2,杭州,hangzhou,2013-01-02
3,北京,beijing,2012-09-12
4,默认,,2013-09-10
5,四川,sichuan,2012-12-12
6,,nanjing,
7,甘肃,,1998-12-12
  • 5.查询
postgres=# select * from tab_area;
 id | cname |  ename   | create_time 
----+-------+----------+-------------
    | 浙江  | zhejiang | 2013-01-01
  2 | 杭州  | hangzhou | 2013-01-02
  3 | 北京  | beijing  | 2012-09-12
  4 | 默认  |          | 2013-09-10
  5 | 四川  | sichuan  | 2012-12-12
  6 |       | nanjing  | 
  7 | 甘肃  |          | 1998-12-12
(7 rows)
  • 6. 查看外部表
postgres=# \d+ tab_area
                                    Foreign table "public.tab_area"
   Column    |         Type          | Modifiers | FDW Options | Storage  | Stats target | Description 
-------------+-----------------------+-----------+-------------+----------+--------------+-------------
 id          | integer               |           |             | plain    |              | 
 cname       | character varying(80) |           |             | extended |              | 
 ename       | character varying(80) |           |             | extended |              | 
 create_time | character varying(10) |           |             | extended |              | 
Server: pg_file_server
FDW Options: (filename '/home/postgres/data1.csv', format 'csv', delimiter ',', header 'true', "null" '1')
Has OIDs: no
  • 7.与实际普通表的结合
postgres=# create table tab_act_area as select * from tab_area;
SELECT 7
postgres=# insert into tab_act_area select * from tab_area where id>2;
INSERT 0 5
postgres=# \d+
                              List of relations
 Schema |     Name     |     Type      |  Owner   |    Size    | Description 
--------+--------------+---------------+----------+------------+-------------
 public | empsalary    | table         | postgres | 16 kB      | 
 public | tab_act_area | table         | postgres | 8192 bytes | 
 public | tab_area     | foreign table | postgres | 0 bytes    | 
 public | test         | table         | postgres | 5096 kB    | 
(4 rows)
  • 8.修改外部表
postgres=# alter foreign table tab_area options(set null '^null*');
ALTER FOREIGN TABLE
postgres=# select * from tab_area;
 id | cname |  ename   | create_time 
----+-------+----------+-------------
  1 | 浙江  | zhejiang | 2013-01-01
  2 | 杭州  | hangzhou | 2013-01-02
  3 | 北京  | beijing  | 2012-09-12
  4 | 默认  |          | 2013-09-10
  5 | 四川  | sichuan  | 2012-12-12
  6 |       | nanjing  | 
  7 | 甘肃  |          | 1998-12-12
(7 rows)

其他语法和普通表类似,除了option的三个选项(drop、add和set) ,具体参考:
http://www.postgresql.org/docs/9.3/static/sql-alterforeigntable.html

  • 9.工具的使用

    这里写图片描述

三、总结:
1. 外部表实际不存储数据,只是一张表结构;
2. 9.2版本比9.1版本多了option的选择,9.3又多了collate一些排序的补充,功能进一步完善,现在已有约束、default普通表的应有功能;
3. 实用性,对定期的数据抽取但无需入库检查是很方便的,既减少了数据存储,像基于postgresql的greenplum的数据导入导出就非常实用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值