关于 Voronoi 图的一切：分析东京公共交通站点的服务区域

原创于 2025-11-27 00:06:24 发布 · 219 阅读

3 ·

CC 4.0 BY-SA版权

License CC BY-NC-SA 4.0 / 自豪地采用谷歌翻译

文章标签：

#榛樿鍒嗙被

榛樿鍒嗙被专栏收录该内容

731 篇文章

订阅专栏

原文：towardsdatascience.com/data-snack-use-voronoi-to-analyze-service-areas-of-transit-stations-in-tokyo-b1179b9dc2a3?source=collection_archive---------10-----------------------#2024-08-16

在获取一些略显有趣的统计见解的同时，探索数据科学技术

https://medium.com/@martin-jurran?source=post_page---byline--b1179b9dc2a3--------------------------------https://towardsdatascience.com/?source=post_page---byline--b1179b9dc2a3-------------------------------- 马丁·朱兰

·发布于Towards Data Science ·12 分钟阅读·2024 年 8 月 16 日

–

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/562cb2e9d7365d3590a0a42f89bd5988.png

数据科学与公共交通：梦之队。（图片来源：作者，插图由三船隆志提供，遵循免费使用协议）

随着世界日益城市化[1]，公共交通已经成为城市生活中无处不在的一部分。世界上可能最具城市化特点的地方是东京[2]—这座规模无与伦比的繁忙大都市，其中大多数人都主要依赖公共交通[3]来处理日常事务。

本文将向你介绍在城市规划背景下的Voronoi 图概念，并用它来划分东京火车站的服务区域。我们将利用获得的服务区域来获取一些或许略显有趣的关于车站周边的统计数据。

介绍

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/c701b6cb07e92d80d99c6aaa39fb9691.png

Voronoi 图（图片来源：作者）

Voronoi 图和 Delaunay 三角剖分在许多科学领域得到了广泛应用。[4] Voronoi 图，也被称为Voronoi 网格，用于将平面表面划分为对应于特定点的独立区域。

这个问题在许多不同的情况下频繁出现。[5]

下面是一些例子：

墨尔本政府（2024-），当他们将学生分配到最近的学校时[6]
约翰·斯诺（1813–1853），当他将伦敦霍乱爆发与水泵的位置相关联时[4]
勒内·笛卡尔（1596–1650），当他研究物质相对于恒星的分布时[4]

如今，Voronoi 图在许多领域中被广泛应用，包括计算机科学、地理学，尤其是城市规划。城市规划是我想要向你们详细介绍的领域——我们将确定世界最大都市——东京的公共交通站点的服务区域。

Voronoi 的组成部分

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/6aa97fa52adfe9062d90e7353ffebd24.png

Voronoi 图的组成部分（图片来自作者）

Voronoi 图由多个不同的结果集组成，每个结果集有不同的名称和用途：

🔵 Voronoi 站点是计算Voronoi 区域的参考位置。
🟣 Voronoi 区域包含表面上所有距离相关Voronoi 站点比任何其他站点更近的点。
🟢 Voronoi 弧线是两条Voronoi 区域之间的边界直线段[4]
🟠 Voronoi 顶点是 Voronoi 弧线交点的地方。

Voronoi 的距离函数

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/678430fa5c98b7310f8a171e805c9432.png

比较各种距离函数（图片来自作者）

城市规划中的Voronoi 图通常基于距离/参考系统关系。距离是根据某些度量标准计算的，例如实际距离或旅行时间。计算该距离的方法有多种：

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/4d682df59903ad8d0b9bd5f5443526d6.png

欧几里得距离概述（图片来自作者）

欧几里得距离。是坐标系中两点之间的航空距离。它假设两点之间有开阔空间，没有任何阻碍物。它是最基本的计算距离的方法。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/82372e4d5d03a26f8a931745933c9fca.png

曼哈顿距离概述（图片来自作者）

曼哈顿距离。忽略航空距离，并引入一种距离函数来近似城市网格中的旅行时间——就像在曼哈顿一样。它更适合某些城市环境。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/f1043738887a6ad8ba8c64e16b43aaca.png

基于时间的距离概述（图片来自作者）

基于时间的距离。这是最准确的度量标准，但也是获取最复杂的度量标准。

此外，基于时间的距离可能会导致异常，因为不同区域之间的旅行时间可能与实际距离不成线性关系，从而可能导致沃罗诺伊区域的不均匀划分 [10]——就像下面的例子一样。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/d4e4f1e256ce46e16a9d03437448eed0.png

图 5. 选定区域的沃罗诺伊图，包括地理（a）、道路（b）和旅行时间距离（c）。宽蓝线表示沃尔塔河，而品红色的块状区域表示桥梁的位置 [11]

现在，我们已经掌握了开始进行现实案例——东京公共交通所需的所有基础知识。让我们开始吧！

评估东京的交通系统

城市规划中最重要的方面之一就是公共交通网络——尤其是在像东京这样的地方。东京是许多人向往的地方——尤其是公共交通爱好者。

因此，东京为我们提供了一个完美的例子，可以在现实生活中应用沃罗诺伊图。

概念

想象一张城市地图，上面标有公共交通站点。每个站点服务其周围的区域，这被称为服务区。那么，我们如何确定这些服务区呢？

为了更好地理解如何实现我们的目标——获取公共交通车站的服务区，我将沃罗诺伊图融入我们的公共交通视角：

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/622c635ce9ac00ffb30daac9d0467482.png

一个关于如何使用沃罗诺伊图来获取服务区的概念（图源：作者）

🔵 沃罗诺伊站点 现在是东京的一个火车站
🟢 沃罗诺伊弧线 现在是划分火车站服务区的边界
🟣 沃罗诺伊区域 现在是基于我们距离函数定义的一个特定火车站所服务的区域

这就是沃罗诺伊图能为我们提供的东西。通过根据到最近车站的距离将地图划分为多个区域，我们就有了一个非常简单的方法来定义火车站的服务区。

现在，概念已经清晰，我们可以开始实际的实施了。

确定东京

我们需要定义我们想要为其创建沃罗诺伊图的区域。这个过程通常被称为定义边界框。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/9022ef03f0c371ca3036efef86dc8e25.png

东京市与东京府的区别（图源：作者）

当有人提到“东京”时，它对不同的人可能意味着不同的事情。

有些人可能会将其看作是：

1) 繁华的城市（东京市），有着高耸的摩天大楼和充满活力的街头文化，而其他人可能会将其视为一个

2) 都道府县（东京府），拥有迷人的风景和自然美景，而其他人可能会提到

3) 大东京地区，这是世界上人口最多的都市区 [8]，由多个独立的城市组成（例如东京、埼玉、横滨等）。

然而，重要的是要明确我们所说的“东京”到底指的是什么，以避免混淆。

使用府县定义使我们能够区分东京与其邻近的城市，如埼玉、千叶和横滨，同时包含大多数人通常所说的“在东京”的位置。

东京府将成为我们所有后续Voronoi计算的基本边界框。

为了获取有关东京府的地理空间信息，我们求助于官方政府来源，具体如下：

数据集： 国家土地数值信息 | 行政边界数据 (mlit.go.jp)，根据开放数据政策授权，允许商业使用。利用規約 (mlit.go.jp)

定位火车站

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/2926ee4e8b8f5c7cec14c9a7ce5edb2f.png

视觉检查我们的数据集。我在正确的位置找到了高田马场。（图片来自作者）

日本政府提供了一个可靠的火车站信息来源。他们的网站提供了一个详细的数据集，包含全国各地的所有火车站，以及其他相关元数据。

值得注意的是，该数据集仅关注日本政府定义的火车站，可能不包括地铁和单轨列车等大众交通工具，但包括了人们通常不认为是火车的交通方式，例如特定的缆车。

通过结合额外的数据来源，可能有机会提高检索数据的准确性。[9] 在本文中，我将继续使用政府数据集，不进行进一步的增强。

数据集： 国家土地数值信息 | 铁路数据 (mlit.go.jp)，根据开放数据政策授权，允许商业使用。利用規約 (mlit.go.jp)

获取服务区域

现在我们已经确定了东京的边界以及相关火车站的列表，接下来可以开始计算我们的服务区域。我们将使用KNIME，这是一款功能强大的科学计算工具，通过抽象化许多复杂性，最大程度减少了对深入数学知识或编程的需求。

[## 开放创新 | KNIME

免费和开源，包含所有数据分析工具。通过视觉工作流构建器创建数据科学解决方案…

www.knime.com

1. 提取数据

我们从连接数据源到工具开始。幸运的是，KNIME 提供了一套地理空间操作工具，我们可以直接使用这些工具。

我们继续创建两个节点来导入我们的数据。GeoFile Reader node 能够处理 Shapefile 和 geojson 数据类型。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/c0e07d7f55bc76255df7694a371b711c.png

在 KNIME 中进行数据导入（图片来源：作者）

要使用这两个数据集，必须进行一些准备工作。

我们使用 Column Filter node 删除了一些字段，因为每个数据集中的字段数量过多。
为了增强可读性，我们使用 Column Renamer node 对数据集中的某些列进行了重命名。
为了避免后续的混淆，我们使用 Column Renamer node 给每个数据集中相同的列赋予唯一的名称。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/1035ae6b32b6e4e713e6b72b1fd26712.png

在 KNIME 中进行数据提取（图片来源：作者）

完成数据提取和准备工作后，我们现在可以继续进行计算了。

2. 处理数据

我们的下一个目标是获取每个车站的 Voronoi 多边形，从而使我们能够推导出它们各自的服务区域。

我们使用东京县数据集创建了 Voronoi 图的边界框，利用 Bounding Box node。
为了执行计算，我们需要的是车站的点而不是多边形表示。Geometry to Point node 用于将它们转换为点。
我们使用Voronoi (Thiessen) Polygon 节点进行 Voronoi 计算，生成多边形和关联的 ID。然而，由于我们还需要车站元数据，我们必须通过空间连接节点将 Voronoi 多边形与这些信息再次连接。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/4a847d621c712c0555af3a43b88ad6ac.png

KNIME 中的整个工作空间（图片来自作者）

这就是我们在 KNIME 中获取车站服务区所需的一切。让我们看看结果。

服务区（V1）

现在我们可以看到 Voronoi 图已经将我们的地图划分，给每个车站分配了一个独特的区域。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/bbedd47befa295fc8b47898a9d891c5f.png

一站多服务区——出了点问题。使用 QGIS 进行可视化（图片来自作者）

我们应当记住，像高田马场这样的车站，在现实中看起来像一个车站，但实际上由多个车站组成。因此，我们需要做一些额外的工作，确保我们的计算能够准确反映这一点。

清理数据和服务区（V2）

车站数据集包含一个额外的 ID，该 ID 根据车站的公共名称和/或实际外观对车站进行分组。通过利用这个 ID 和Group By 节点，我们可以将各个车站合并成一个。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/7335f675e26162e737b9c3165c25edef.png

KNIME 中的整个工作空间（图片来自作者）

在合并各个车站后，我们能够创建一个更准确的服务区数据集，更好地反映人们在现实中看到车站的方式。看看高田马场——它现在位于一个单一的 Voronoi 区域内。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/c2d8ae7a96186e3583555e197d470071.png

清理后的数据集：现在每个车站有一个服务区，通过 QGIS 进行可视化（图片来自作者）

结果

我们已经完成了计算，并得到了可以提供有用见解和统计数据的服务区域。

若要自己探索结果，您可以在这个 GitHub 仓库中找到所有内容：

[## GitHub - martinjurran/KNIME-Tokyo-StationServiceAreas: 计算服务区的 KNIME 工作流…

计算东京车站服务区和餐厅密度分析的 KNIME 工作流……

github.com](https://github.com/martinjurran/KNIME-Tokyo-StationServiceAreas/tree/main?source=post_page-----b1179b9dc2a3--------------------------------)

接下来，我们将获取一些可以从服务区中导出的现实生活统计数据。