PostGIS教程十:空间连接

本文探讨了空间数据库中的空间连接技术,展示了如何利用空间关系连接不同数据表,进行地理信息系统的高级分析,包括人口统计、种族构成及地铁服务区域的探究。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

一、连接和汇总

二、高级连接

三、空间连接练习


    空间连接(spatial joins)是空间数据库的主要组成部分,它们允许你使用空间关系作为连接键(join key)来连接来自不同数据表的信息。

    在上一节中,我们通过两个步骤探索了空间关系:首先,我们提取了'Broad St(宽街)'的地铁站点;然后,我们用这个地铁站点来问更多的问题,如"'Broad St'站位于哪个社区?"

    使用空间连接,我们可以只通过一个步骤来回答这个问题,检索有关地铁站及其所在社区的信息:

 
  1. SELECT

  2. subways.name AS subway_name,

  3. neighborhoods.name AS neighborhood_name,

  4. neighborhoods.boroname AS borough

  5. FROM nyc_neighborhoods AS neighborhoods

  6. JOIN nyc_subway_stations AS subways

  7. ON ST_Contains(neighborhoods.geom, subways.geom)

  8. WHERE subways.name = 'Broad St';

    我们本可以把每个地铁站都连接到它所在的社区,但在这种情况下,我们只想知道其中一个地铁站的信息。

    任何在两个表之间提供true/false关系的函数都可以用来驱动空间连接,但最常用的函数是:ST_Intersects、ST_Contains和ST_DWithin。

一、连接和汇总

    JOINGROUP BY的组合支持通常在GIS系统中的某些分析。

    例如:"曼哈顿行政区的各个社区的人口和种族构成是什么?",这个问题将人口普查中的人口信息与社区的几何信息结合在一起,社区信息只限制在曼哈顿的一个行政区中。

 
  1. SELECT

  2. neighborhoods.name AS neighborhood_name,

  3. Sum(census.popn_total) AS population,

  4. 100.0 * Sum(census.popn_white) / Sum(census.popn_total) AS white_pct,

  5. 100.0 * Sum(census.popn_black) / Sum(census.popn_total) AS black_pct

  6. FROM nyc_neighborhoods AS neighborhoods

  7. JOIN nyc_census_blocks AS census

  8. ON ST_Intersects(neighborhoods.geom, census.geom)

  9. WHERE neighborhoods.boroname = 'Manhattan'

  10. GROUP BY neighborhoods.name

  11. ORDER BY white_pct DESC;

    这里发生了什么?从理论上讲(数据库在内部对实际运行机制进行了优化)发生的情况如下:

  1. JOIN子句创建了一个虚拟表,其中包含来自neighborhoods表和census表的列。
  2. WHERE子句将我们的虚拟表筛选为仅保留有关曼哈顿行政区的记录。
  3. 结果记录按neighborhood name分组,并通过聚合函数Sum()计算人口数
  4. 在对最后的数字进行一些算术和格式化之后,我们的查询就会输出百分比。

    注意:JOIN子句组合了两个FROM子句中的数据表,默认情况下,数据库使用的是INNER JOIN连接类型,但还有其他四种连接类型,有关详细信息,请参阅PostgreSQL文档中的join_type的定义。

    我们还可以使用距离测试作为连接键,以创建汇总的“半径内所有项”查询。让我们使用距离查询来探索纽约的种族地理。

    首先,让我们了解一下这个城市的基本种族构成。

 
  1. SELECT

  2. 100.0 * Sum(popn_white) / Sum(popn_total) AS white_pct,

  3. 100.0 * Sum(popn_black) / Sum(popn_total) AS black_pct,

  4. Sum(popn_total) AS popn_total

  5. FROM nyc_census_blocks;

    因此,在纽约的800万人口中,大约44%的人被记录为”白人“,26%的人被记录为”黑人“。

    艾灵顿公爵曾经唱过这样一首歌:"你/必须乘A-train/去哈莱姆区(Harlem)的糖山(Sugar Hill)。"正如我们早些时候看到的,哈莱姆地区拥有曼哈顿(Manhattan)最多的非裔美国人(80.5%)。杜克(Duke)的A-train也是这样的吗?

    首先,请注意,nyc_subway_stations表routes字段的内容是我们感兴趣的用于查找A-train的内容。里面的值有点复杂。

SELECT DISTINCT routes FROM nyc_subway_stations;

    注意DISTINCT关键字从结果中消除重复的行。如果没有DISTINCT关键字,上面的查询将标识491个结果,而不是73个。

    所以,要找到A-train,我们需要在routes列中有'A'的所有行记录。我们可以通过多种方法来实现这一点,但今天我们将使用strpos(routes, 'A'),它只有当'A'在routes列中才会返回非零数。

 
  1. SELECT DISTINCT routes

  2. FROM nyc_subway_stations AS subways

  3. WHERE strpos(subways.routes,'A') > 0;

    现在让我们计算一下距A-train线200米以内的种族构成

 
  1. SELECT

  2. 100.0 * Sum(popn_white) / Sum(popn_total) AS white_pct,

  3. 100.0 * Sum(popn_black) / Sum(popn_total) AS black_pct,

  4. Sum(popn_total) AS popn_total

  5. FROM nyc_census_blocks AS census

  6. JOIN nyc_subway_stations AS subways

  7. ON ST_DWithin(census.geom, subways.geom, 200)

  8. WHERE strpos(subways.routes,'A') > 0;

    因此,可以得出结论:A-train服务的区域的人群构成与城市其他区域的种族构成并没有太大的不同。

二、高级连接

    在上面的最后部分,我们看到A-train服务的区域的人群构成与城市其他区域的种族构成并没有太大的不同。有没有哪些地铁的服务区域的种族构成与纽约整个城市的种族构成差异较大?

    为了回答这个问题,我们将在查询中添加另一个连接,以便可以同时计算多条地铁线路的构成。要做到这一点,我们需要创建一个新的表,遍历我们想要汇总的所有行。

 
  1. CREATE TABLE subway_lines ( route char(1) );

  2. INSERT INTO subway_lines (route) VALUES

  3. ('A'),('B'),('C'),('D'),('E'),('F'),('G'),

  4. ('J'),('L'),('M'),('N'),('Q'),('R'),('S'),

  5. ('Z'),('1'),('2'),('3'),('4'),('5'),('6'),

  6. ('7');

    现在,我们可以将subway lines连接到原始查询中。

 
  1. SELECT

  2. lines.route,

  3. 100.0 * Sum(popn_white) / Sum(popn_total) AS white_pct,

  4. 100.0 * Sum(popn_black) / Sum(popn_total) AS black_pct,

  5. Sum(popn_total) AS popn_total

  6. FROM nyc_census_blocks AS census

  7. JOIN nyc_subway_stations AS subways

  8. ON ST_DWithin(census.geom, subways.geom, 200)

  9. JOIN subway_lines AS lines

  10. ON strpos(subways.routes, lines.route) > 0

  11. GROUP BY lines.route

  12. ORDER BY black_pct DESC;

    如前所述,连接创建了一个虚拟表,其中包含在JOIN ON约束范围内可用的所有的连接的行记录,然后将这些行记录分组。ST_DWithin可确保计算中仅包括靠近地铁站的人口普查区块

三、空间连接练习

    下面是我们之前所看到的一些函数的汇总,它们应该对练习有用!

    同时请记住我们的数据库中现有的数据表

  • nyc_census_blocks
    • name, popn_total, boroname, geom
  • nyc_streets
    • name, type, geom
  • nyc_subway_stations
    • name, routes, geom
  • nyc_neighborhoods
    • name, boroname, geom

    练习:

    ①"小意大利(Little Italy)社区"有什么地铁站?它在哪些地铁线路上?

 
  1. SELECT s.name, s.routes

  2. FROM nyc_subway_stations AS s

  3. JOIN nyc_neighborhoods AS n

  4. ON ST_Contains(n.geom, s.geom)

  5. WHERE n.name = 'Little Italy';

    ②"6-train服务哪些社区?"(提示:nyc_subway_stations表中的routes列具有类似"B,D,6,V"和"C,6"的值)

 
  1. SELECT DISTINCT n.name, n.boroname

  2. FROM nyc_subway_stations AS s

  3. JOIN nyc_neighborhoods AS n

  4. ON ST_Contains(n.geom, s.geom)

  5. WHERE strpos(s.routes,'6') > 0;

    注意:我们使用DISTINCT关键字从结果集中删除在一个社区中的多个地铁站的重复记录。

    ③"9/11事件后,'Battery Park'社区附近将禁止入内几天,那么要疏散多少人呢?"

 
  1. SELECT Sum(popn_total)

  2. FROM nyc_neighborhoods AS n

  3. JOIN nyc_census_blocks AS c

  4. ON ST_Intersects(n.geom, c.geom)

  5. WHERE n.name = 'Battery Park';

    ④"'Upper West Side'和'Upper East Side'的人口密度(人/km^_{2})是多少"(提示:1km^_{2}等于1000000m^{2}

 
  1. SELECT

  2. n.name,

  3. Sum(c.popn_total) / (ST_Area(n.geom) / 1000000.0) AS popn_per_sqkm

  4. FROM nyc_census_blocks AS c

  5. JOIN nyc_neighborhoods AS n

  6. ON ST_Intersects(c.geom, n.geom)

  7. WHERE n.name = 'Upper West Side'

  8. OR n.name = 'Upper East Side'

  9. GROUP BY n.name, n.geom;


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值