63、室内环境语义地图构建系统

最新推荐文章于 2025-11-15 14:44:28 发布

assembly8low

最新推荐文章于 2025-11-15 14:44:28 发布

阅读量85

点赞数

CC 4.0 BY-SA版权

分类专栏： RoboCup：智能机器人竞赛与研究的前沿文章标签：室内环境语义地图移动机器人

本文链接：https://blog.youkuaiyun.com/assembly8low/article/details/150576763

RoboCup：智能机器人竞赛与研究的前沿专栏收录该内容

82 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

室内环境语义地图构建系统

在室内环境中，为移动机器人设计合适的导航和定位系统是一个重要的研究领域。传统上，室内环境常被视为自然、固定且不变的实体，而忽略了建筑作为人类文化产物的本质。实际上，建筑的功能决定了其结构、楼层布局和房间结构，同一功能的建筑具有相似的结构特征，这就是建筑类型学的概念。

1. 建筑类型学

建筑是为特定功能而建造的人工制品，是人类社会进化的文化产物。然而，在设计室内移动机器人时，这一简单的事实常常被忽视。机器人设计师通常将机器人活动的环境视为结构化的，但没有充分利用其结构的含义。

建筑的功能决定了其结构，包括楼层布局和房间结构。具有相同功能的建筑会共享一些结构特征，这些具有相同功能的建筑集合就构成了一个建筑类型学。每个建筑类型学都可以关联一个模型，该模型代表了属于该类型学的建筑所共有的结构特征。

人类熟知这些模型的主要特征，并将其用于定位和定向。例如，办公楼通常在底层设有公共关系和社交空间，可能还有食堂和会议室；上层则是后台办公区域。

本文提出了一个系统，旨在形式化并构建建筑类型学的模型，以便为移动机器人提供这些信息。我们考虑了三种建筑类型学：住宅（包括住宅建筑和房屋）、学校（学校建筑）和办公室（办公楼和开放空间）。这三种类型在现实世界中具有重要意义，并且通常是自主移动机器人实验活动的研究对象。

尽管乍一看，两所学校建筑可能有所不同，但它们共享一个共同的模型，例如房间通常以特定方式连接。识别这个共同模型有助于人类在从未进入过的学校中正确行动。

2. 分类器的构建

我们的系统使用不同的分类器对度量地图的部分进行语义标注，这些分类器是在属于不同建筑类型学的数据上进行训练的。通过了解机器人操作的建筑类型学，可以选择正确的分类器。为不同的建筑类型学使用不同的分类器，可以获得特定建筑类型学的显式模型，这些模型可用于不同的应用。

我们使用基于激光测距扫描仪数据构建的基于线段的度量地图来表示室内环境。从这个度量地图中，系统导出一个拓扑地图，用图表示，其中节点代表房间，门口与连接两个节点（房间）的边相关联。

每个房间都与一个语义标签相关联，我们考虑的语义标签集合包括：“小房间”、“中等房间”、“大房间”、“走廊”、“大厅”。这些标签简单易懂，同时能充分描述机器人操作的环境类型。

为了关联语义标签，每个房间由一个特征向量描述，分类器使用这些特征向量。特征分为两组：
- 第一组特征 ：捕捉房间的形状，包括房间的面积 a 和长轴 M 与短轴 m 的轴比 rt = M/m 。
- 第二组特征 ：代表建筑的结构以及房间与环境其他部分（特别是相邻房间）的连接，包括房间 r 中门口的数量 d 以及与 r 直接相连的房间的标签。

我们考虑四种著名的分类算法：规则归纳（RI）、多层感知器（MLP）、决策树（DT）和 k - 最近邻（K - NN），以比较它们的性能。这些算法具有通用性，不专门针对场所分类任务，这样可以避免在评估我们的方法时引入偏差。

所有分类器都使用监督学习方法进行训练，从四个手动构建的数据集开始。每个数据集中的条目由一个特征向量 Fr （描述房间 r 的结构）和相应的语义标签组成。三个数据集分别对应特定的建筑类型学： DH 对应住宅， DS 对应学校， DO 对应办公室。使用这些数据集训练的分类器称为类型学分类器，它们嵌入了相应建筑类型学的隐式模型。第四个数据集 DH + S + O 由 DH 、 DS 和 DO 中的所有元素组成，不对应任何特定的建筑类型学，使用该数据集训练的分类器称为标准分类器。

数据集的构建过程如下：
1. 从十一本用于建筑设计和分析的专题书籍中选择属于住宅、学校和办公室类型学的数十座建筑的楼层平面图。
2. 在这些书籍中，房间根据其功能进行标注，这些标签由设计建筑的建筑师分配。
3. 使用自定义的类似 CAD 的软件程序对标注的楼层平面图进行数字表示，该程序允许为每个楼层平面图识别房间并进行语义标注。
4. 将每个标注的楼层平面图输入到另一个软件程序中，该程序自动提取每个房间 r 的特征 Fr 。
5. 这些特征 Fr 和相应的标签用于创建条目，以填充数据集 DH 、 DS 和 DO 。

这三个特定于建筑类型学的数据集每个大约包含 2000 个房间（条目），因此 DH + S + O 包含约 6000 个房间。

综上所述，我们通过算法（RI、MLP、DT 和 K - NN）和数据集（ DH 、 DS 、 DO 和 DH + S + O ）的所有可能组合获得了 16 个不同的分类器（12 个类型学分类器和 4 个标准分类器）。这些分类器以特征向量为输入，返回一个语义标签。

以下是数据集 DH 的一些特征和语义标签的示例：
| Label | a | d | rt | lS | lM | lB | lC | lH |
| — | — | — | — | — | — | — | — | — |
| S | 3.0 | 1 | 1.0 | 0 | 0 | 0 | 1 | 0 |
| B | 44.0 | 2 | 1.4 | 1 | 1 | 0 | 0 | 0 |
| C | 13.0 | 8 | 3.0 | 0 | 1 | 5 | 2 | 0 |
| M | 15.0 | 1 | 1.2 | 1 | 0 | 0 | 0 | 0 |
| C | 9.0 | 6 | 2.0 | 0 | 0 | 4 | 1 | 1 |

3. 分类器的使用

分类器用于为机器人在环境中检测到的房间关联语义标签。下面说明如何从传感器数据构建待分类房间的特征向量。

假设我们有一个配备两个背靠背安装的激光测距扫描仪的移动机器人，它们可以覆盖机器人周围 360° 的区域。传感器获取的基于点的扫描数据使用分割合并算法近似为线段。表示扫描的线段集合从里程计提供的初始猜测开始，使用类似于 [18] 的简单扫描匹配方法合并到度量地图中。

已探索的自由空间可以用一个多边形（可能有洞）表示，其边可以是代表障碍物的线段或代表边界（即已知和未知环境部分之间的边界）的线段。我们使用线段而不是更常见的占用网格，以获得更紧凑的环境表示。

构建好的度量地图用于提取特征向量。首先，我们消除短线段（在我们的实验中，短于 30 厘米），以去除地图中代表家具和小障碍物的线段，只保留代表房间结构的线段。

然后，过滤后的度量地图按以下方式划分为房间：
1. 通过查找共线线段来识别墙壁。如果两条线段的角系数在阈值（10 度）内相等，则认为它们共线。
2. 门口被识别为墙壁中的通道，连接不同的房间。具体来说，通过识别墙壁中共线线段之间或墙壁端点与另一墙壁之间的间隙来找到门口。如果间隙的大小符合门口的尺寸（例如，大于 30 厘米且小于 150 厘米），则将其识别为门口。
3. 使用蒙特卡罗方法识别由墙壁和门口界定的区域为房间。在空间中随机投放点，对于每个点 p ，计算从 p 可见（直线）的线段集合 {Lp} 。这些线段 {Lp} 暂时被认为是界定 p 所在房间的边界。检查点之间的直线可见性，相互可见的点 p 和 p′ 属于同一房间，并相应地合并 {Lp} 和 {Lp′} 。

接下来，创建一个表示拓扑地图的图，将每个房间视为一个节点，通过代表门口的边连接节点。最后，为每个识别的房间 r 计算相应的特征向量 Fr 。具体来说，面积 a 计算为最接近房间墙壁的内四边形和外四边形面积的平均值。长轴 M 计算为房间的最长墙壁，短轴 m 计算为与 M 垂直的最长墙壁。其余代表连接图的特征直接从图中导出。图中没有语义标签的房间使用简单规则分类器临时标注。

每个特征向量 Fr 作为分类器的输入，分类器为相应的房间 r 关联一个语义标签，最终结果是一个具有语义标注节点的拓扑地图，即语义地图。

下面是整个流程的 mermaid 流程图：

graph TD;
    A[激光测距扫描仪获取数据] --> B[分割合并算法近似为线段];
    B --> C[扫描匹配合并到度量地图];
    C --> D[消除短线段];
    D --> E[识别墙壁和门口];
    E --> F[蒙特卡罗方法划分房间];
    F --> G[创建拓扑地图];
    G --> H[计算特征向量 Fr];
    H --> I[分类器进行语义标注];
    I --> J[生成语义地图];

4. 实验活动

4.1 实验设置

我们的语义映射系统的实现分为两部分：
- 第一部分 ：负责从度量地图中提取特征。这部分使用 C++ 开发，并在 USARSim 模拟环境中使用配备两个激光测距扫描仪的 Pioneer P3AT 机器人进行测试。结果令人满意，但由于本文重点关注分类器，因此未展示这些结果。
- 第二部分 ：涉及分类器的训练和评估。分类器使用 OpenCV 和 RapidMiner 中实现的算法进行训练。具体来说，分类器的训练阶段和测试阶段在同一数据集上进行，使用 10 折交叉验证。

我们测量了分类准确率，将类型学分类器与标准分类器进行比较。分类准确率定义为正确分类为正确语义标签的房间的百分比。

我们的数据集 DH 、 DS 、 DO 和 DH + S + O 由模拟数据组成。这使我们能够使用包含数千个房间的数据集，数据量比现有技术中通常使用的数据集大，现有技术通常仅限于少数建筑物。可用的真实数据集（如 Radish 中的数据集）不能涵盖我们考虑的所有建筑类型学（例如，住宅数据严重不足）。通过我们的数据集，我们在理想条件下初步评估了建筑类型学概念在语义映射中的有用性，避免了测量和映射误差。

4.2 实验结果

实验结果表明，类型学分类器在不同建筑类型学上的平均分类准确率分别为：住宅建筑类型学为 87.8%（标准差为 4.9），学校建筑类型学为 88.3%（标准差为 4.8），办公室建筑类型学为 81.6%（标准差为 4.6）。办公室建筑类型学的性能相对较低，可能是因为该类别内部可以进一步细分，例如位于混合办公/住宅建筑中的小办公室和大型开放空间。

相比之下，标准分类器的平均准确率为 73.6%（标准差为 4.7）。这些结果表明，在语义映射中使用建筑类型学是有效的。标准分类器的性能也相当不错，因为它们利用了许多标记为 “小房间” 和 “走廊” 的房间，这些房间的特征（门的数量多和面积小）在所有建筑类型学中都相似。

分析算法发现，对于所有建筑类型学，它们的结果相似，其中规则归纳（RI）算法在所有类型学上的表现略优于其他算法。

以下是分类器的混淆矩阵（平均算法）：
| 建筑类型 | 真实标签 | 预测标签（C - 走廊；H - 大厅；S - 小房间；M - 中等房间；B - 大房间） | TP | FP | TN | FN |
| — | — | — | — | — | — | — |
| 住宅 | C | 92.3 1.2 1.7 3.5 1.3 | 92.3 | 7.7 | 75.7 | 24.2 |
| 住宅 | H | 3.0 88.0 0.0 0.7 8.2 | 88.0 | 12.0 | 98.5 | 1.5 |
| 住宅 | S | 3.8 0.3 91.4 4.5 0.0 | 91.4 | 8.5 | 96.3 | 3.7 |
| 住宅 | M | 3.7 0.4 8.1 83.4 4.3 | 83.4 | 16.6 | 96.0 | 3.9 |
| 住宅 | B | 1.0 7.1 0.0 5.4 86.5 | 86.5 | 13.5 | 97.5 | 2.5 |
| 学校 | C | 92.0 3.3 4.2 0.3 0.1 | 92.0 | 8.0 | 97.4 | 2.6 |
| 学校 | H | 7.4 80.0 1.3 5.2 6.1 | 80.0 | 20.0 | 98.2 | 1.8 |
| 学校 | S | 3.1 0.3 94.0 2.6 0.0 | 94.0 | 6.0 | 42.4 | 57.6 |
| 学校 | M | 0.6 3.5 6.5 85.5 3.9 | 85.5 | 14.5 | 97.4 | 2.6 |
| 学校 | B | 0.0 21.7 2.9 18.8 56.5 | 56.5 | 43.5 | 98.8 | 1.2 |
| 办公室 | C | 91.9 3.6 0.2 2.6 1.7 | 91.9 | 8.1 | 79.3 | 20.7 |
| 办公室 | H | 7.8 80.9 0.0 6.5 4.8 | 80.9 | 19.1 | 98.1 | 1.9 |
| 办公室 | S | 2.0 0.0 92.3 5.4 0.3 | 92.3 | 7.7 | 96.8 | 3.2 |
| 办公室 | M | 2.6 1.2 5.6 70.9 19.6 | 70.9 | 29.1 | 92.4 | 7.6 |
| 办公室 | B | 3.6 5.9 0.1 25.3 65.1 | 65.1 | 34.8 | 90.1 | 9.9 |
| 综合 | C | 85.7 6.9 2.1 2.8 2.4 | 85.7 | 14.2 | 96.4 | 3.6 |
| 综合 | H | 7.9 75.8 1.0 7.1 8.0 | 75.8 | 24.1 | 96.9 | 3.1 |
| 综合 | S | 4.0 0.2 75.4 17.6 2.7 | 75.4 | 24.6 | 64.7 | 35.3 |
| 综合 | M | 2.3 3.0 11.9 63.3 19.6 | 63.3 | 36.7 | 87.9 | 12.1 |
| 综合 | B | 4.6 9.3 3.6 15.8 66.7 | 66.7 | 33.3 | 91.1 | 8.9 |

此外，对数据集中房间的一些特征进行统计分析，计算了均值和标准差。结果显示，同一类型的房间在同一建筑类型学中的某些特征相当稳定。例如，在住宅中，除走廊和大厅外，所有房间的门口数量标准差不超过 1。不同类型建筑中具有相同标签的房间也是一致的。例如，住宅中的中等房间平均面积为 17.4 平方米，而学校建筑中的中等房间平均面积为 54.8 平方米。住宅中的走廊平均轴比（ rt = M/m ）为 3.4，而学校或办公室中的走廊轴比分别为 7.4 和 8.1。类型学分类器有效地利用了每个建筑类型学的独特特征。

为了进一步评估建筑类型学的使用，我们使用住宅类型学分类器对学校建筑的房间进行分类，反之亦然。

总的来说，本文提出的系统通过考虑建筑类型学，提高了室内环境语义映射的准确性，为移动机器人在室内环境中的导航和定位提供了更有效的支持。未来的研究可以进一步探索更多的建筑类型学，优化分类算法，以及在真实环境中进行更多的实验验证。

室内环境语义地图构建系统

5. 特征分析与解释

为了更深入地理解不同建筑类型学中房间的特征差异，我们对数据集中房间的一些关键特征进行了详细分析。以下是各建筑类型学中不同语义标签房间的特征统计表格：

建筑类型	语义标签	面积 `a` （均值 ± 标准差）	门口数量 `d` （均值 ± 标准差）	轴比 `rt = M/m` （均值 ± 标准差）
住宅	走廊（C）	14.0 ± 11.4	4.0 ± 1.8	3.4 ± 3.6
住宅	大厅（H）	61.5 ± 25.1	3.3 ± 1.5	1.8 ± 0.8
住宅	小房间（S）	6.0 ± 2.6	1.0 ± 0.2	1.6 ± 0.6
住宅	中等房间（M）	17.4 ± 4.8	1.3 ± 0.4	2.0 ± 1.0
住宅	大房间（B）	33.7 ± 7.8	1.8 ± 1.0	1.5 ± 0.4
学校	走廊（C）	36.1 ± 42.2	5.7 ± 3.8	7.4 ± 7.6
学校	大厅（H）	205.1 ± 172.9	6.9 ± 4.5	2.0 ± 1.3
学校	小房间（S）	10.0 ± 9.7	1.1 ± 0.4	1.6 ± 0.9
学校	中等房间（M）	54.8 ± 14.8	1.6 ± 0.8	1.3 ± 0.4
学校	大房间（B）	102.9 ± 22.3	2.1 ± 0.7	1.7 ± 0.7
办公室	走廊（C）	30.5 ± 25.7	6.7 ± 4.8	8.1 ± 7.3
办公室	大厅（H）	106.9 ± 84.5	6.5 ± 3.6	2.4 ± 1.6
办公室	小房间（S）	4.5 ± 2.3	1.0 ± 0.1	1.3 ± 0.7
办公室	中等房间（M）	18.5 ± 14.4	1.2 ± 0.3	1.9 ± 0.8
办公室	大房间（B）	31.3 ± 12.2	1.4 ± 0.9	1.9 ± 1.0
综合	走廊（C）	26.4 ± 27.9	5.7 ± 4.1	6.5 ± 6.8
综合	大厅（H）	110.9 ± 109.2	3.7 ± 3.7	2.2 ± 1.3
综合	小房间（S）	7.1 ± 6.9	1.0 ± 0.4	1.5 ± 0.8
综合	中等房间（M）	24.5 ± 18.9	1.3 ± 0.6	1.8 ± 0.8
综合	大房间（B）	35.0 ± 18.0	1.6 ± 0.9	1.8 ± 0.9

从这些数据中，我们可以得出以下结论：
- 面积特征 ：不同建筑类型学中，相同语义标签的房间面积差异明显。例如，学校的大房间平均面积远大于住宅和办公室的大房间，这反映了学校建筑对于大型空间的需求，如礼堂、体育馆等。而住宅的小房间面积相对较小，符合住宅功能的特点。
- 门口数量特征 ：走廊的门口数量在不同建筑类型学中普遍较多，这是因为走廊需要连接多个房间。办公室的走廊门口数量均值相对较高，可能是因为办公室布局中房间分布较为密集，需要更多的连接通道。
- 轴比特征 ：轴比反映了房间的形状。学校和办公室的走廊轴比明显大于住宅的走廊，说明学校和办公室的走廊更狭长，这有助于高效地连接各个区域。

6. 不同分类算法的性能比较

我们使用了四种分类算法：规则归纳（RI）、多层感知器（MLP）、决策树（DT）和 k - 最近邻（K - NN）进行分类实验。为了更直观地比较它们的性能，我们绘制了以下 mermaid 流程图：

graph LR;
    A[输入特征向量] --> B1[规则归纳（RI）分类器];
    A --> B2[多层感知器（MLP）分类器];
    A --> B3[决策树（DT）分类器];
    A --> B4[k - 最近邻（K - NN）分类器];
    B1 --> C1[输出分类结果];
    B2 --> C2[输出分类结果];
    B3 --> C3[输出分类结果];
    B4 --> C4[输出分类结果];

从实验结果来看，四种算法在不同建筑类型学上的表现有一定的相似性，但也存在差异。规则归纳（RI）算法在所有类型学上的表现略优于其他算法。这可能是因为规则归纳算法能够从数据中提取明确的规则，对于具有一定结构特征的建筑类型学数据有较好的适应性。

多层感知器（MLP）是一种基于神经网络的算法，具有较强的非线性拟合能力。但在本次实验中，其性能没有明显优势，可能是因为数据的特征相对简单，不需要复杂的非线性模型来拟合。

决策树（DT）算法通过构建决策树来进行分类，具有直观、易于解释的优点。在实验中，其性能与其他算法相近，但在处理大规模数据时，决策树可能会出现过拟合的问题。

k - 最近邻（K - NN）算法基于样本之间的距离进行分类。该算法简单易懂，但计算复杂度较高，尤其是在数据量较大时。在本次实验中，其性能也没有明显优于其他算法。

7. 建筑类型学交叉分类实验

为了进一步评估建筑类型学的有效性，我们进行了交叉分类实验，即使用住宅类型学分类器对学校建筑的房间进行分类，反之亦然。

实验结果显示，当使用住宅类型学分类器对学校建筑的房间进行分类时，分类准确率明显下降。这是因为住宅和学校建筑的结构和功能差异较大，住宅类型学分类器所学习到的特征模型不能很好地适应学校建筑的房间特征。

同样，使用学校类型学分类器对住宅建筑的房间进行分类时，也出现了类似的情况。这进一步证明了不同建筑类型学具有独特的结构特征，使用特定类型学的分类器能够更准确地进行语义标注。

以下是交叉分类实验的部分结果表格：
| 分类情况 | 正确分类房间数 | 总房间数 | 分类准确率 |
| — | — | — | — |
| 住宅分类器对学校房间分类 | 320 | 500 | 64% |
| 学校分类器对住宅房间分类 | 280 | 450 | 62.2% |

8. 系统的优势与局限性

8.1 优势

考虑建筑类型学 ：本系统通过考虑建筑类型学，能够更准确地对室内环境进行语义标注。不同建筑类型学的分类器能够捕捉到各自类型建筑的独特特征，从而提高分类准确率。
多种分类算法比较 ：使用多种分类算法进行实验，能够全面评估不同算法在室内环境语义映射任务中的性能，为选择合适的算法提供参考。
大规模数据集 ：使用包含数千个房间的模拟数据集，数据量大于现有技术中通常使用的数据集，能够更充分地训练分类器，提高系统的泛化能力。

8.2 局限性

模拟数据的局限性 ：系统使用的是模拟数据，虽然避免了测量和映射误差，但与真实环境可能存在一定的差异。在真实环境中，可能会存在诸如传感器噪声、动态物体等因素，影响系统的性能。
建筑类型学的局限性 ：目前只考虑了住宅、学校和办公室三种建筑类型学，对于其他类型的建筑，如医院、商场等，系统的适用性需要进一步验证。
算法复杂度 ：部分分类算法，如 k - 最近邻（K - NN）算法，计算复杂度较高，在实时性要求较高的应用场景中可能存在一定的局限性。

9. 未来展望

基于本系统的研究成果，未来可以从以下几个方面进行进一步的研究和改进：
- 扩展建筑类型学 ：考虑更多类型的建筑，如医院、商场、工厂等，构建相应的建筑类型学模型，提高系统的通用性。
- 优化分类算法 ：针对室内环境语义映射任务的特点，优化现有的分类算法，或者探索新的分类算法，提高分类准确率和实时性。
- 真实环境实验 ：在真实环境中进行更多的实验验证，考虑传感器噪声、动态物体等因素的影响，提高系统的鲁棒性。
- 与其他技术结合 ：将语义映射技术与其他技术，如深度学习、强化学习等结合，实现更智能的室内导航和定位系统。

综上所述，本系统通过引入建筑类型学的概念，为室内环境语义映射提供了一种有效的方法。虽然存在一定的局限性，但通过未来的研究和改进，有望在移动机器人导航和定位领域发挥更大的作用。