PostgreSQL表空间、数据库、模式、表、用户/角色之间的关系

本文详细解析了PostgreSQL中的角色与用户关系、数据库与模式的关系以及表空间与数据库的关系。通过一系列实验验证了不同对象之间的逻辑关系及权限管理。
[url]http://blog.youkuaiyun.com/kanon_lgt/article/details/5931522[/url]
看PostgreSQL9的官方文档,我越看越迷糊,这表空间,数据库,模式,表,用户,角色之间的关系怎么在PostgreSQL里这么混乱呢?
经过中午的一个小实验,我逐渐理清了个中来龙去脉。下面我来还原我的试验,并循序讲清其中关系。



[color=red][b]首先,实验出角色与用户的关系[/b][/color]
[color=darkblue]在PostgreSQL中,存在两个容易混淆的概念:角色/用户。之所以说这两个概念容易混淆,是因为对于PostgreSQL来说,这是完全相同的两个对象。唯一的区别是在创建的时候[/color]:
1.我用下面的psql创建了角色kanon:
CREATE ROLE kanon PASSWORD 'kanon';
接着我使用新创建的角色kanon登录,PostgreSQL给出拒绝信息:

FATAL: role 'kanon' is not permitted to log in.
说明该角色没有登录权限,系统拒绝其登录。
2.我又使用下面的psql创建了用户kanon2:
CREATE USER kanon PASSWORD 'kanon2';
接着我使用kanon2登录,登录成功。
难道这两者有区别吗?查看文档,又这么一段说明:"CREATE USER is the same as CREATE ROLE except that it implies LOGIN."----CREATE USER除了默认具有LOGIN权限之外,其他与CREATE ROLE是完全相同的。
为了验证这句话,修改kanon的权限,增加LOGIN权限:ALTER ROLE kanon LOGIN;再次用kanon登录,成功!
那么,事情就明了了:CREATE ROLE kanon PASSWORD 'kanon' LOGIN 等同于CREATE USER kanon PASSWORD 'kanon'.
这就是ROLE/USER的区别。



[color=red][b]然后,数据库与模式的关系[/b][/color]
看文档了解到:[color=darkblue]模式(schema)是对数据库(database)逻辑分割。
在数据库创建的同时,就已经默认为数据库创建了一个模式--public,这也是该数据库的默认模式。所有为此数据库创建的对象(表、函数、试图、索引、序列等)都是常见在这个模式中的。[/color]
实验如下:
1.创建一个数据库dbtt----CREATE DATABASE dbtt;
2.用kanon角色登录到dbtt数据库,查看dbtt数据库中的所有模式:/dn; 显示结果是只有public一个模式。
3.创建一张测试表----CREATE TABLE test(id integer not null);
4.查看当前数据库的列表: /d; 显示结果是表test属于模式public.也就是test表被默认创建在了public模式中。
5.创建一个新模式kanon,对应于登录用户kanon:CREATE SCHEMA kanon OWNER kanon;
6.再次创建一张test表,这次这张表要指明模式----CREATE TABLE kanon.test (id integer not null);
7.查看当前数据库的列表: /d; 显示结果是表test属于模式kanon.也就是这个test表被创建在了kanon模式中。
得出结论是:数据库是被模式(schema)来切分的,一个数据库至少有一个模式,所有数据库内部的对象(object)是被创建于模式的。用户登录到系统,连接到一个数据库后,是通过该数据库的search_path来寻找schema的搜索顺序,可以通过命令SHOW search_path;具体的顺序,也可以通过SET search_path TO 'schema_name'来修改顺序。
官方建议是这样的:在管理员创建一个具体数据库后,应该为所有可以连接到该数据库的用户分别创建一个与用户名相同的模式,然后,将search_path设置为"$user",
这样,任何当某个用户连接上来后,会默认将查找或者定义的对象都定位到与之同名的模式中。这是一个好的设计架构。


[color=red][b]接下来,再来研究下表空间与数据库的关系[/b][/color]
[color=darkblue]数据库创建语句CREATE DATABASE dbname 默认的数据库所有者是当前创建数据库的角色,默认的表空间是系统的默认表空间--pg_default。[/color]
为什么是这样的呢?因为在PostgreSQL中,数据的创建是通过克隆数据库模板来实现的,这与SQL SERVER是同样的机制。
由于CREATE DATABASE dbname并没有指明数据库模板,所以系统将默认克隆template1数据库,得到新的数据库dbname。(By default, the new database will be created by cloning the standard system database template1).

而template1数据库的默认表空间是pg_default,这个表空间是在数据库初始化时创建的,所以所有template1中的对象将被同步克隆到新的数据库中。
相对完整的语法应该是这样的:CREATE DATABASE dbname OWNER kanon TEMPLATE template1 TABLESPACE tablespacename;
下面我们来做个实验验证一下:
1.连接到template1数据库,创建一个表作为标记:CREATE TABLE tbl_flag(id integer not null);向表中插入数据INSERT INTO tbl_flag VALUES (1);
2.创建一个表空间:CREATE TABLESPACE tskanon OWNER kanon LOCATION '/tmp/data/tskanon';在此之前应该确保目录/tmp/data/tskanon存在,并且目录为空。
3.创建一个数据库,指明该数据库的表空间是刚刚创建的tskanon:CREATE DATABASE dbkanon TEMPLATE template1 OWNERE kanon TABLESPACE tskanon;
4.查看系统中所有数据库的信息:/l;可以发现,dbkanon数据库的表空间是tskanon,拥有者是kanon;
5.连接到dbkanon数据库,查看所有表结构:/d;可以发现,在刚创建的数据库中居然有了一个表tbl_flag,查看该表数据,输出结果一行一列,其值为1,说明,该数据库的确是从template1克隆而来。

仔细分析后,不难得出结论:[color=darkblue]在PostgreSQL中,表空间是一个目录,里面存储的是它所包含的数据库的各种物理文件。[/color]



[color=red][b]最后,我们回头来总结一下这张关系网[/b][/color]
[color=darkblue]表空间是一个存储区域,在一个表空间中可以存储多个数据库,尽管PostgreSQL不建议这么做,但我们这么做完全可行。[/color]
一个数据库并不知直接存储表结构等对象的,而是在数据库中逻辑创建了至少一个模式,在模式中创建了表等对象,将不同的模式指派该不同的角色,可以实现权限分离,又可以通过授权,实现模式间对象的共享,并且,还有一个特点就是:public模式可以存储大家都需要访问的对象。
这样,我们的网就形成了。可是,既然一个表在创建的时候可以指定表空间,那么,是否可以给一个表指定它所在的数据库表空间之外的表空间呢?
答案是肯定的!这么做完全可以:那这不是违背了表属于模式,而模式属于数据库,数据库最终存在于指定表空间这个网的模型了吗?!
是的,看上去这确实是不合常理的,但这么做又是有它的道理的,而且现实中,我们往往需要这么做:将表的数据存在一个较慢的磁盘上的表空间,而将表的索引存在于一个快速的磁盘上的表空间。
但我们再查看表所属的模式还是没变的,它依然属于指定的模式。所以这并不违反常理。实际上,PostgreSQL并没有限制一张表必须属于某个特定的表空间,我们之所以会这么认为,是因为在关系递进时,偷换了一个概念:模式是逻辑存在的,它不受表空间的限制。
<think>好的,我现在需要帮助用户理解PostgreSQL表空间模式之间的区别及关系。根据用户提供的引用内容,我需要综合这些信息,并结合之前的回答,给出一个清晰的解释。 首先,用户之前询问了如何在DBeaver中查看表空间,现在转向了概念性的问题,即表空间模式关系。我需要确保回答结构清晰,分点说明,同时结合引用中的关键点。 引用[1]提到,所属的模式不会改变,即使存储在另一个表空间,这并不违反常理,因为模式是逻辑的,不受表空间限制。引用[2]和[3]解释了表空间是物理存储,而模式属于逻辑结构,一个数据库可以有多个模式,这些模式可以分布在不同的表空间。引用[4]给出了创建表空间数据库的示例,说明如何指定表空间。 我需要先明确两者的定义:表空间是物理存储位置,模式是逻辑命名空间。然后区分它们的角色,比如模式管理对象,表空间管理存储。接着说明它们的关系,比如多对多的关系,以及如何配合使用,比如和索引可以放在不同的表空间优化性能。 同时,需要指出用户可能存在的误区,比如认为模式必须对应特定表空间,但实际上它们是独立的。此外,引用中的例子显示,可以在不同表空间中,但模式不变,这需要强调逻辑和物理的分离。 最后,总结两者的联系和区别,确保用户理解它们如何协同工作但职责不同。可能还需要添加示例和注意事项,比如权限管理或路径问题,以增强实用性。</think>根据PostgreSQL的存储架构设计和引用内容,表空间(Tablespace)与模式(Schema)是逻辑层和物理层的不同维度概念,以下是它们的核心区别及关系分析: --- ### 一、本质区别 | **维度** | **表空间** | **模式** | |----------------|------------------------------------|----------------------------------| | **定义层级** | 物理存储管理单元 | 逻辑命名空间 | | **核心作用** | 控制数据文件的物理存储位置 | 组织数据库对象(/视图/函数等)的归属 | | **可见性** | 跨数据库存在(但实际存储路径由数据库管理) | 数据库内独立存在 | | **创建方式** | `CREATE TABLESPACE` 指定物理路径 | `CREATE SCHEMA` 仅需逻辑名称 | | **系统默认项** | `pg_default`/`pg_global` | `public` | --- ### 二、核心关系解析 #### 1. 多对多映射关系 - **一个模式**中的对象可以分布在**多个表空间** 例如:用户存储在HDD表空间,索引存储在SSD表空间[^3] - **一个表空间**可以服务于**多个模式** 如开发环境将所有模式集中存储到`tbspc_dev`表空间 #### 2. 层级包含关系 ```sql 数据库 (Database) ├─ 模式 (Schema) │ ├─ (Table) → 可指定表空间A │ └─ 索引 (Index) → 可指定表空间B └─ 临时对象 → 可指定表空间C ``` *关键特性*:模式仅定义对象归属,物理存储完全由表空间控制[^1] --- ### 三、配合使用场景 #### 场景1:性能优化 ```sql -- 创建高速表空间(SSD) CREATE TABLESPACE fast_ssd LOCATION '/ssd/pgdata'; -- 创建普通表空间(HDD) CREATE TABLESPACE slow_hdd LOCATION '/hdd/pgdata'; -- 将存储到HDD,索引存储到SSD CREATE TABLE orders (...) TABLESPACE slow_hdd; CREATE INDEX idx_orders_date ON orders(date) TABLESPACE fast_ssd; ``` #### 场景2:存储分离 ```sql -- 财务模式存加密表空间 CREATE TABLESPACE encrypted LOCATION '/encrypted/pgdata' WITH (encryption = on); CREATE SCHEMA finance; CREATE TABLE finance.salary (...) TABLESPACE encrypted; -- 日志模式存低成本存储 CREATE TABLESPACE archive LOCATION '/nfs/archive'; CREATE SCHEMA logs; CREATE TABLE logs.access (...) TABLESPACE archive; ``` --- ### 四、常见误区澄清 1. **误区**:模式必须与表空间一一对应 **事实**:模式是纯逻辑容器,与表空间无强制绑定[^3] 2. **误区**:修改表空间会改变对象所属模式 **事实**:`ALTER TABLE ... SET TABLESPACE`仅影响物理存储,不改变`pg_class.relnamespace`(模式ID)[^1] 3. **误区**:删除表空间会级联删除模式 **事实**:表空间删除仅影响物理文件,需手动清理关联对象 --- ### 五、管理命令对比 | 操作 | 表空间相关命令 | 模式相关命令 | |--------------------|---------------------------------------|---------------------------------| | 查看对象 | `\db+` 或查询`pg_tablespace` | `\dn+` 或查询`pg_namespace` | | 修改存储位置 | `ALTER TABLE ... SET TABLESPACE` | 不支持直接修改(需重建对象) | | 权限控制 | `GRANT CREATE ON TABLESPACE TO role` | `GRANT USAGE ON SCHEMA TO role` | --- ### 六、最佳实践建议 1. **生产部署**: - 将系统目录保留在`pg_default` - 用户数据使用自定义表空间 - 事务日志单独存放(通过`pg_wal`目录配置) 2. **权限分离**: ```sql REVOKE CREATE ON SCHEMA public FROM PUBLIC; CREATE SCHEMA app_data; GRANT USAGE ON SCHEMA app_data TO app_user; GRANT CREATE ON TABLESPACE app_tbspc TO app_user; ``` 3. **监控方案**: ```sql -- 查看模式-表空间映射 SELECT nspname AS 模式名称, relname AS 对象名称, (SELECT spcname FROM pg_tablespace WHERE oid = reltablespace) AS 表空间 FROM pg_class c JOIN pg_namespace n ON n.oid = c.relnamespace; ``` --- #### 附:关系示意图 ``` [物理层] [逻辑层] 表空间A (SSD) <---存储--- 数据库DB1 ├─ 模式SchemaX │ ├─ Table1 (存储在表空间A) │ └─ 索引Index1 (存储在表空间B) └─ 模式SchemaY └─ Table2 (存储在表空间C) ``` *说明:箭头示物理存储指向,模式层级仅体现逻辑归属* --- ### 相关问题 1. 如何将已有PostgreSQL迁移到新表空间? 2. 表空间数据库集群初始化参数`PGDATA`有何关联? 3. 为什么`pg_default`表空间不建议直接存储用户
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值