基于视觉的盲人运动导航系统

最新推荐文章于 2025-11-21 15:17:24 发布

原创最新推荐文章于 2025-11-21 15:17:24 发布 · 772 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#视觉导航 #嵌入式系统 #单目视觉 #触觉反馈 #残障辅助

IEEE智能交通系统汇刊，第19卷，第2期，2018年2月 649

机电系统以帮助视觉障碍用户在步行和跑步过程中
阿德里亚诺·曼奇尼，IEEE会员，埃马努埃莱·弗龙托尼，IEEE会员，和普里莫·津加雷蒂，IEEE高级会员

摘要

环境辅助生活与智能交通系统正变得紧密关联。有必要通过为残障人士开发包容性出行解决方案来提高生活质量。本文重点研究一种基于单目视觉的系统，用于在户外环境中辅助残障用户进行步行、慢跑和跑步。该系统引导残障用户沿着专用跑道上的车道或线条所表示的路径行进。我们开发了一套图像处理算法，用于提取需要跟随的线条/车道。该嵌入式系统基于一个小型摄像头和一块负责处理图像并与所开发的触觉设备通信的电路板。该触觉设备由一副配备有振动电机的手套组成，通过振动引导用户朝正确方向移动。振动序列由类机器人控制器生成，将用户视为一个两轮转向机器人，其旋转和移动速度均可被控制。
实验结果表明，整个系统能够准确识别正确路径，并通过手套向用户提供适当的刺激，最高可在超过10 km/h的速度下正常工作。

Index Terms— 残障人士，视觉导航，嵌入式系统，单目视觉。

一、引言

MOST 的时间内，智能交通系统（ITSs）支持健全用户安全高效地使用交通系统（例如汽车）。当用户存在某种残疾时，就会出现问题。在这种情况下，考虑到基础设施障碍[1]，使用交通系统可能确实是一项挑战。

根据世界卫生组织2011年报告[2]，全球15%的人口至少面临一种类型的残疾，例如身体、视觉或听觉障碍。
显然，有必要重新思考智能交通系统的概念，智能交通系统应成为推动包容性服务的技术驱动力。正如《欧洲残疾战略2010‐2020[3]所指出的，有必要投资于消除基础设施障碍。这一过程需要长期的规划，而在实际城市中实施并不容易，主要是由于成本问题。尽管如此，考虑到这一范围

稿件于2017年2月6日收到；2017年6月27日和2017年10月20日修订； 2017年11月22日接受。出版日期为2018年2月1日；当前版本日期为2018年 2月1日。本文的副编辑为M. Bertozzi。(通讯作者：Adriano Mancini。)
作者单位：意大利安科纳马尔凯理工大学信息工程系，邮编60131（电子邮件：a.mancini@univpm.it；e.frontoni@univpm.it； p.zingaretti@univpm.it）。本文中一张或多张图的彩色版本可在线获取，网址为 http://ieeexplore.ieee.org。数字对象标识符 10.1109/TITS.2017.2780621

针对残疾问题，有必要专注于特定的问题。所开发的解决方案随后可以集成到更大的系统中，从而进一步提高残障人士的生活质量。例如，电子导航辅助设备[4] 可支持残障人士在复杂环境中自主导航。

残疾的范围广泛且多样化。我们决定将关注点集中在从事体育活动（包括各个水平）如慢跑和轻度跑步的视障人士。残障人士的体育活动在《残疾人权利公约》第30条中有明确说明[5]。

残障人士的步行/跑步活动需要遵循在坡度、粗糙度、宽度以及与其他交通通道（如人行道、自行车道和人行与自行车混合道）交互方面合适的路径。路径规划不在本研究范围内，但曼奇尼et al.[6],[7]提出了一种专用的路线规划器，该规划器考虑了路径的宽度、人行横道和坡度等约束，从而能够在复杂城市环境中实现残障人士的安全导航。

视障人士在步行/慢跑时的导航大多在户外进行，这一特点对所需感知环境的传感器类型构成了约束，同时还需适应阳光、阴影等变化。引导用户沿指定路径安全行进的问题与自动驾驶汽车必须遵循车道并根据交通状况调整速度的问题非常相似。残障用户需要持续获得关于其方向和速度的反馈信息。

本文提出了一种视觉系统，用于识别给定路线上的线条和车道。估计出的线条或车道代表参考路径。通过向专用手套提供振动反馈，来校正用户相对于期望路径的距离/ 方向。振动提示用户改变速度或通过向左/右转来改变方向。在此情况下，残障用户的行为类似于差动轮式机器人，便于人类用户改变速度或向左/右转。控制器的设计基于专用的仿真引擎，评估了纯追踪方法和模糊推理系统。选择振动刺激的原因是考虑到声音反馈可能会干扰用户体验以及对周围环境的感知。

本文的组织结构如下。在第二节中，介绍了相关工作，特别关注导航方面。

1524‐9050 © 2018 IEEE.个人使用许可，但重新出版/分发需获得IEEE许可。更多信息请见 http://www.ieee.org/publications_standards/publications/rights/index.html
本文档由 funstory.ai 的开源 PDF 翻译库 BabelDOC v0.5.10 (http://yadt.io) 翻译，本仓库正在积极的建设当中，欢迎 star 和关注。

650 IEEE智能交通系统汇刊，第19卷，第2期，2018年2月

为残障人士提供辅助的系统

第三节描述了系统架构（包括硬件和软件）。第四节介绍了图像处理流程，而第五节描述了如何利用源自移动机器人技术的控制器计算刺激信号。第六节讨论了实验结果，第七节概述了结论及未来工作。

II. 相关工作

根据[4] ，面向视障人士的电子导航辅助设备可以增强、替代或取代视觉。增强方法依赖于视觉显示，该显示呈现来自摄像头的处理数据[8],[9] （例如虚拟现实系统、智能眼镜）。由于增强和替代方法涉及视觉皮层，因此与取代方法有显著不同，且不在本研究的范围之内。

视觉替代则假设输入来自摄像头的数据流，而输出并非视觉信息，而是听觉、触觉或振动信息。这种方法与智能交通系统和移动机器人学非常接近。

视觉替代系统可进一步分为电子出行辅助设备（ ETAs）、电子定向辅助设备和定位设备。顾名思义， ETAs 是对视觉残障用户有用的设备。ETAs 基于一组传感器（不仅限于摄像头），能够感知环境并识别路径上可能存在的障碍物。它们通过多种感官模式提供反馈，以引导用户到达特定位置，或在遇到障碍物时向用户发出警示。

白手杖就是一种 ETA 设备，已有许多相关方法被提出[6]。

实际上，有许多研究人员正在研究利用电子导航辅助设备（ETAs）的辅助技术模型。在[10]中可以找到有关辅助技术模型的有趣综述与分析。我们开发的嵌入式系统符合人与技术匹配模型（MPT）。原因是通过使用所提出的设备，可以在具有挑战性的中等/环境条件下应对，同时考虑使用该设备时的技能限制（无需复杂培训）所涉及的需求/偏好和个人倾向，以及期望的功能（使用设备时无不适和压力）。

现有方法通常适用于室内外环境中的城市导航[11]– [13]。针对慢跑/跑步等体育活动的ETA设备的研究与开发，相较于标准导航而言尚不充分。这一需求在实际体育赛事中也有所体现，这些赛事同样面向视障人士，例如在上届波士顿马拉松中，约有一百名视障跑步者参赛。一个有趣的项目是Blindtrack[14],，该项目通过射频设备支持跑步，如[15]所述。[16]和[17]提出了一种采用RGB‐D方法引导用户沿路径行进的技术，主要基于车道检测与跟踪。

目前，视障人士仍需依赖引导员，这实际上限制了用户的独立性。白手杖适用于步行活动，但在某些情况下侵入性较强。相比之下，可穿戴设备的使用符合低侵入性的要求，有助于提升用户的独立性包容。在过去几年中，可穿戴设备的研究引起了研究人员的关注，而不仅仅局限于健全用户[4],[18]–[20]。还需要考虑到，用于体育活动的可穿戴设备数量在持续增长，这得益于蓝牙低功耗堆栈的支持，从而确保了电池的低能耗续航[21]。

在处理电子导航辅助设备时，重要的是要考虑如何将控制操作（例如，向左/右转、停止）提供给残障用户。声音反馈通常利用耳机实现，但这可能会给依赖听觉来“感知”环境的视障人士带来问题。而以振动形式提供的反馈则被充分证明是在可用性与功能性之间的一种良好折衷方案。触觉设备也已被使用，尽管它们并非体育/休闲活动的最佳选择。

在这种情况下，重要的是要认识到已有大量系统被设计出来，但跑步和慢跑尚未得到深入研究。

电子导航辅助设备的主要需求包括在已知或未知环境中实现适当的导航、与残障用户进行交互以提供反馈（例如听觉、触觉、振动）以及最终实现路径上静态和动态障碍物的检测。从定位出发，考虑到步行和慢跑通常在户外进行，基于L1接收器（分米级精度）[27]或L1/L2（厘米级精度）的实时运动学（RTK）定位系统应能产生有趣的结果。然而，RTK的使用需要流动站（用户）范围内存在基站，或通过互联网连接有效接入虚拟参考站，从而增加系统在成本、重量和功耗方面的复杂性。此外，该方案受树木/树冠影响较大，可能导致精度显著下降。惯性导航系统即使在树冠遮挡情况下也能提高精度，但可能对整体用户体验产生负面影响。

导航涉及多种可用的传感器。超声波[28],[29]和激光雷达[30],[31]方法都可能受到多重反射或温度、雾、雨、阳光等环境条件等外部因素的影响。因此，已有人提出基于雷达[6],[32]或电磁设备的其他方法[33],[34]。还有一些方法依赖于视觉系统，有时结合深度[16],[35],[36]。

帮助视障人士进行体育和休闲活动并不简单。白手杖 [37]–[39]非常适合在室内/室外环境中导航，特别是低速路线。由于机械和实际原因，智能行走/跑步与白手杖不兼容。

本文提出的想法是利用基于视觉的系统与手套上的振动触觉界面相结合，引导用户朝正确方向行进。本文所解决的问题是赛道或专用路线情况下的车道/线路跟随[17]。

车道/线路检测是自动驾驶汽车领域的一个典型课题，这类车辆需要遵循由明确方向设定的路径

曼奇尼等：机电系统帮助视觉障碍用户在步行和跑步期间 651

车道[32],[40],[41]。由于基于纯视觉的系统体积紧凑，其可用性得以提高，尽管在阴影、阳光和夜间条件下仍存在一些挑战。为了降低所需的计算能力，同时保持对车道/ 标线位置的精确估计，可以使用单目系统[42] 而不是立体视觉系统[43],[44] 。对于视障人士而言，车道/线路跟随无需环境的三维地图，尽管三维地图在障碍物检测方面具有重要意义。基于视觉的传感器是实现精确导航的最佳候选方案，但需要鲁棒算法来应对阴影及光照变化。障碍物检测是额外的一层处理，如果通过摄像头实现，则由于需要对不属于地面估计平面的物体进行分割与跟踪，将消耗大量计算能力[43]。

III. 系统架构

本节描述了我们嵌入式系统的架构，该系统可帮助视障人士在进行步行和跑步时实现安全导航。所开发的系统作为视障人士的智能交通系统，依托嵌入式系统来简化并增强设计。

该架构由三个主要组件构成：
- 摄像头系统；
- 处理单元
- 触觉设备。

摄像头系统由一个全局快门单色或彩色RGB摄像头组成，用于检测线条和/或车道。

处理单元负责图像处理（如第四节所述）。该处理单元在确定允许的最大用户速度方面起着关键作用。此单元还通过使用蓝牙低功耗等低功耗无线通信技术向触觉设备发送动作指令。指令通过自定义服务发送（见III‐A）。

我们的系统的触觉设备基于一对用于左右手的手套，手套上装有定制PCB。处理单元的反馈基于编码了残障用户需执行动作的振动刺激序列。振动序列通过与振动电机连接的蓝牙低功耗设备发送。振动序列根据以下方案生成：
- 左手套：频率和强度增加表示“快速向右”；
- 右手套：频率和强度增加表示“快速向左”；
- 两只手套：2赫兹脉冲，脉冲激活持续时间0.1秒，表示“系统错误或阻挡障碍”（用于进一步开发）；
- 两只手套：在最大振动频率下，1次脉冲且脉冲激活持续时间 0.5秒表示“加速”；
- 两只手套：2次脉冲，脉冲激活持续时间0.5秒，最大振动频率表示“减速”。

如果用户偏好相反的逻辑，上述方案可以进行反转。

显然，也可以采用其他类型的方案来编码动作。我们倾向于在某一时刻仅让一只手套产生主动刺激，以避免复杂的用户交互/动作解码。其他解决方案已提出使用腕带[23]或振动电机环[16],[24]。

振动电机的频率和强度随着电源的增加以相当线性的方式传递给用户。

A. 架构实例化

考虑到上述架构，我们选择了符合我们要求的组件。

所采用的摄像头是由Matrix Vision制造的 BlueFox MLC200wC，能够以90赫兹的频率对 752 × 480帧进行彩色/灰度采集，并配备了全局快门。

处理单元采用配备全志A20双核1GHz Cortex‐A7处理器和 1GB DDR3内存的Olimex A20‐OLinuXino‐MICRO。运行的操作系统是在Debian squeeze发行版上搭载内核3.4.90的 Linux[45]。该单元能够运行我们的处理流程，实现平均跑步速度（2‐3m/s），但如果使用通用图形处理器板，性能可进一步提升。

触觉设备由一副手套表示，主要基于定制PCB上的两个组件：
- Bluegiga BLE112设备；
- Parallax C1026B002F振动电机

BLE112设备集成了多种外设，作为一个标准的微控制器，可通过Bluegiga开发的BGScript[46]脚本语言进行编程。由于振动电机的电流消耗较大（最大200mA），因此通过运算放大器和NPN射极跟随器连接至BLE112，该电路充当基本的电压转电流放大器。BLE112生成脉宽调制 (PWM)信号，随后通过RC网络滤波以驱动振动电机。

PWM频率设置为20赫兹，信号由BLE112的PWM外设直接产生。系统由电池供电，模块会监测电池电压，并在电量状态(SoC)较低时通知用户。电压与电量状态(SoC)之间的关系是通过低电流充放电曲线(0.1C)确定的。从固件（由编译开发的BGscript生成）的角度来看，我们开发了三项服务：
- 通用访问配置 profile(GAP)；
- 电池服务；
- 自定义服务

GAP profile是强制性的，可提供基本的功能性。电池服务共享手套电池的电量状态信息，而自定义服务则实现振动强度的传输/接收。处理单元使用第五节中描述的控制架构来计算振动强度和目标手套。

振动强度范围为1到20，因此每只手套仅需1字节。根据逻辑要求，在某一时刻仅有一只手套处于振动状态，除非出现误差或阻碍障碍（后续开发功能），此时两只手套将同时脉冲振动。950mAh电池可支持模块运行数小时。

在考虑标准振动功耗的情况下，典型续航时间为8‐10小时。

针对残障用户使用的智能设备存在一个问题是电池充电必须简便易行，因此我们计划集成磁性连接器，以避免复杂的连接操作。

652 IEEE智能交通系统汇刊，第19卷，第2期，2018年2月

示意图0

图1显示了一位“穿戴”整个系统的用户。

IV. 图像处理

本节介绍图像处理。图像处理流程生成横向和方向误差的估计，然后由控制器将其转换为触觉反馈，以改变速度（平移和旋转），从而正确跟踪路径。我们考虑两种类型的跟踪：线条或车道。控制器的详细信息将在下一节中介绍。

如相关工作部分所述，有多种方法可用于引导用户沿路径行进。在本研究中，我们决定使用单目摄像头来定位地面上的线条和车道（作为参考标记）。主要目标是使用户保持在线条上或车道中央。

假设标记物的颜色与地面铺面不同，以确保安全导航。

这一假设带来了一定的约束，但考虑到人行道和/或赛道涂装的成本较低，公共机构和市政部门可以轻松解决这一问题。摄像头安装在用户胸前，倾斜角约为10度。卷帘快门可能导致抖动/果冻效应，因此所选摄像头采用全局快门技术。该特性可确保在行走/奔跑过程中获得高质量图像。

视觉算法已使用C++和OpenCV库开发。整体处理流程由以下步骤组成：
- 帧采集（彩色或灰度）；
- 图像稳定；
- 裁剪至感兴趣区域(ROI)；
- 色彩空间转换（取决于赛道类型）；
- 阈值处理；
- 图像清理；
- 线条提取；
- 线条聚类与过滤；
- 误差计算。

上述处理流程利用了阈值化的优势，而不是直接使用边缘检测。边缘检测随后进行线条过滤是一种替代方法。

然而，考虑到应用场景中通常存在直射阳光和阴影的情况，使用分割算法可能会取得更好的效果。边缘分割与提取能够选择/使用最佳阈值器来提取感兴趣对象。在本例中，这一选择并非依赖于场景，而是依赖于问题，因为用户交互发生在一个结构化环境中（例如跑道、赛道）。

帧以彩色RGB24位或灰度8位格式采集，大小为 752 × 480 ，具体取决于路面情况。对于RGB帧，会进行色彩空间转换，将数据转换到HSV颜色空间。采集模式（RGB或灰度）主要根据赛道类型确定。当道路覆盖沥青材料（例如沥青）时，系统选择灰度模式，因为线条（白色）与背景（黑色）之间具有高对比度。对于彩色赛道（例如田径跑道），则选择RGB模式，以提高分割过程的质量。随后将RGB转换为HSV，以便尽可能将颜色信息（色度）与强度或光照分离。HSV颜色空间仅用于分割目的，不用于稳定化。

图像稳定旨在减少由于行走/奔跑引起的摄像头相对于地面的运动。图像稳定按以下方式进行：
- 图像缩放；
- 特征提取；
- 光流估计和刚性变换；
- 图像扭曲。

图像稳定随时间减少了行走/奔跑对图像造成的影响。

我们采用的工作流程在图像缩放后如下所示：
1. 使用 Shi‐Tomasi方法进行特征提取；
2. 使用金字塔 Lucas‐Kanade方法计算光流；
3. 估计连续帧之间的刚性变换（假设仅有平移和旋转运动；无剪切和/或缩放）；
4. 使用滑动窗口平滑运动；
5. 计算考虑了平滑后运动集合的新变换，然后应用该新变换来扭曲图像。

在特征提取之前，图像被调整为其原始尺寸的50%，以节省处理时间。使用Shi‐Tomasi方法从上一帧图像中找到的最佳跟踪特征（最多50个）被提取出来[47]。

曼奇尼等：机电系统帮助视觉障碍用户在步行和跑步期间 653

然后使用三个感兴趣区域（ROI）对扭曲（稳定）图像进行裁剪，这些区域对应路径的不同区域：区域1、区域2和区域3。区域1是最靠近的，而区域3是最远的。这些区域实现了图像的智能处理，因为图像的某些部分是无用的。生成感兴趣区域（ROI）是必要的，以限制处理区域。

我们希望处理图像底部区域的ROI，因为我们关注的是路径（赛道+线条）。这表示一种约束，既能限制区域，又能减少由背景引起的误报数量。

阈值处理阶段提取感兴趣对象，即本例中的线条。我们尝试了多种自适应方法，如大津法[48]；基于邻域值加权和的高斯方法（权重基于高斯窗口）；我们的分割方法 [49]基于韦尔纳[50]。

我们决定采用上述方法，考虑到大津法和高斯法被广泛使用。我们将这些方法与基于韦尔纳算法的方法进行了比较，后者对光照变化的敏感性较低，具有自适应阈值的效果。

大津方法是最快的，而自定义算法最慢。平均而言，两者速度之比为1:5，但自定义算法生成的结果更好。上述比例指的是不影响帧率的速度。理论上摄像头的帧率为 90帧每秒，在我们的情况下过高。可以认为，假设用户速度为2‐3米/秒，且典型响应时间为> 500毫秒，因此将20 赫兹作为目标。

形态学算子用于去除小物体（开运算）以及填充小孔（闭运算）。在这种情况下，我们应用了圆盘结构元素。

我们的分割算法基于韦尔纳方法，并对原始算法进行了修改，以提高二值化图像的精度和精确度，特别是在具有大量相邻黑色像素的区域[49]。

A. 线条提取

使用概率霍夫线变换进行线条提取，该方法比标准霍夫变换更高效，同时考虑了较少的线条交点数量、属于一条线的点的数量以及两点之间的间隙是否应被视为同一条线。通常，标准跑道由直线段和曲线组成。如果曲率半径较高，则可将曲线近似为一系列直线。因此，在提取线条之前，我们通过形态学算子增加提取线条的粗细。形态学算子有助于减少小物体的存在，从而简化场景。算子及其大小的选择基于需考虑的最小物体尺寸，这并非完全场景‐ 设备相关。显然，若摄像头类型发生变化，则需要调整核大小，但整体方法保持不变。

提取的线条需要经过验证，过于接近的线条应当合并。当两条或多条线之间的距离在像素上小于阈值dl时，即执行合并。我们认为水平线对导航不重要，因此

示意图1

它们被忽略的原因。感兴趣区域Ri由其边界框界定，该边界框由4个点Pi j=(xi j,y i j)定义，其中j= 1,…,4，区域索引i= 1,…,3，如图2所示。

距离 d(lk, lt,Ri)的计算公式为：
$$
d(lk, lt, Ri)= \max(d0(lk, lt, Ri), d1(lk, lt, Ri)) \quad (1)
$$
其中lk和lt是两条通用直线，d0和d1分别是计算出的上界和下界的距离。如果满足以下条件，则线段被合并：
$$
d(lk, lt, Ri) < dl \quad (2)
$$
对每个提取的线段都进行合并评估。在处理过程结束时，考虑合并后的线。在线条跟踪情况下，我们选择距离图像中心最近的线条。但也可以设置系统来跟踪车道而非单一线条。

在多车道情况下，如果用户发生偏离，导致另一组平行线现在更靠近图像中心，我们仍然保持对原始车道的记忆，直到构成该车道的两条线仍在场景中存在。如果其中一条线消失，用户将开始跟踪一个新的车道。在线条跟踪的情况下（车道跟踪可视为线条跟随的一种特殊情况，即创建一条虚拟线作为车道的中心线），我们将误差定义为：
$$
et = X(lk, h) - \frac{w}{2} \quad (3)
$$
其中 h 和 w 分别是图像的高度和宽度
$$
X(lk, y) = -\left(\frac{b_k y + c_k}{a_k}\right) \quad (4)
$$
与 lk 是一条通用线条，表示为 $lk: a_k x + b_k y + c_k = 0$。在车道检测的情况下，必须满足的条件是过滤后线条的数量应大于或等于2。还需设置附加约束：
$$
\left|X(lk , h) - X(lt , h)\right| \leq d_{\text{high}} L \quad \land \quad \left|X(lk , h) - X(lt , h)\right| \geq d_{\text{low}} L \
\left|X(lk , 0) - X(lt , 0)\right| \leq \left|X(lk , h) - X(lt , h)\right| \quad (5)
$$

654 IEEE智能交通系统汇刊，第19卷，第2期，2018年2月

第一个约束要求两条线条之间的距离应处于由$d_{\text{high}} L$ 与$d_{\text{low}} L$参数限定的给定范围内。第二个约束要求在用户前方必须存在一个消失点。如果满足这些约束，则检测到一条车道。$d_{\text{high}} L$与$d_{\text{low}} L$的值应根据相机焦距、传感器尺寸/ 分辨率、离地高度和车道宽度进行选择。在进行车道估计时，误差通过以下公式计算：
$$
et = \frac{X(lk, h) + X(lt, h)}{2} - \frac{w}{2} \quad (6)
$$
其中$lk$和$lt$是表示车道本身的两条线条。

我们希望评估图像底部（即最接近用户的区域）的误差。

在进行线条或车道跟踪时，方向误差$e_\theta$可通过以下公式进行估计：
$$
e_\theta(m) = et(m) - et(m - 1) \
\bar{e} \theta(m) = (1 - \alpha) \bar{e} \theta(m - 1) + \alpha et(m) \quad (7)
$$
其中 $\bar{e} \theta$是方向误差$e \theta$的指数平均，$\alpha$是遗忘因子（ $\alpha = 1$表示无记忆），$m$为计算步长，且 $\bar{e}_\theta(0) = 0$。该方向误差的指数平均值将传递给下一小节所述的控制器。

从处理角度来看，最复杂的操作是特征提取和线段/ 线段提取。使用通用图形处理器（GP‐GPU）可以缩短执行时间，尽管在集成和能耗方面的系统复杂性可能会受到负面影响。特别是使用像配备CUDA支持的GP‐GPU的替代处理板，如NVIDIA Jetson TK1或TX1，可能会提高帧率，使用户能够跑得更快。

五、控制器

本节中，我们将详细介绍控制策略。我们将人类行为建模为一个可接收平移和旋转指令的两轮差速机器人。所开发的仿真引擎以简化的方式考虑了人体动力学和疲劳因素，以推导出用于计算期望动作（速度变化、旋转速度变化）的最佳控制器策略。计算得到的动作将通过蓝牙低功耗传输，如第三节所述。

A. 仿真引擎

仿真引擎已开发用于调试控制器，这些控制器负责将用户相对于期望路径（直线或车道）的定位误差转换为传输到触觉设备的振动强度。仿真引擎将通用路径建模为直线和弧线的序列。

为了简化，我们考虑了二维情况，但扩展到三维情况是直接的。（x，y，θ）表示用户相对于参考系的位置和朝向。在某一时刻$k$，考虑平移速度$v_k$以及旋转速度$\omega_k$，可以计算用户位置在时间$k+1$ 时为：
$$
\begin{cases}
x(k+1) = x(k) + v(k) T_C \cos\left(\theta(k) + \frac{1}{2} T_C \omega(k)\right) \
y(k+1) = y(k) + v(k) T_C \sin\left(\theta(k) + \frac{1}{2} T_C \omega(k)\right) \
\theta(k+1) = \theta(k) + T_C \omega(k)
\end{cases} \quad (8)
$$
其中$T_c$表示采样时间， $|v(k)| < v_{\text{max}}$与$|\omega(k)| < \omega_{\text{max}}$。

为了模拟平移和旋转速度的非瞬时变化，我们对控制器计算出的期望速度进行了预滤波。该预滤波考虑了来自手套的蓝牙低功耗（BLE）延迟以及代码解码延迟。传递函数还考虑了影响反应能力和跟踪性能的用户疲劳度。

采用的两种方法均基于目标点的概念。目标点是位于用户当前位置前方的一个参考点，其位置等于前瞻距离。

前瞻距离$l_d$也表示确保参考路径跟踪的最大误差。前瞻距离是一个由用户的最大速度确定的参数，并且与曲率半径相关。

B. 纯追踪控制器

纯追踪控制器[51]是移动机器人路径跟踪中广泛使用的一种方法。纯追踪方法通过几何计算确定一条连接用户位置与路径前方目标点的圆弧的曲率。目标点由从用户当前位置到期望路径的前瞻距离$l_d$确定。以下方程表示旋转速度和平移速度计算的基础：
$$
\begin{cases}
\bar{x} G = (x_G - x_P) \cos\alpha + (y_G - y_P) \sin\alpha \
\bar{y}_G = -(y_G - y_P) \sin\alpha + (y_G - y_P) \cos\alpha
\end{cases} \quad (9)
$$
其中$x_G$和$y_G$是目标点坐标，而$x_P$和$y_P$是用户坐标，且 $\alpha = \pi/2 + \theta$。我们定义$r$为连接用户位置到目标点的圆弧的半径。$r$的计算方式如下：
$$
r = \frac{l_d^2}{2\bar{x}_G} \quad (10)
$$
$\bar{l}$，然后可以根据以下公式计算所需的长度$\bar{l}$和参考平移速度/旋转速度$v$与$\omega$：
$$
\bar{l} = 2r \arcsin\left(\frac{l_d}{2r}\right) \
v_c = v {\text{max}} \frac{K}{r} \
\begin{cases}
v = v_c & \text{if } v_c < v_{\text{max}} \
v = v_{\text{max}} & \text{if } v_c \geq v_{\text{max}}
\end{cases} \
\omega = \frac{v}{r} \quad (11)
$$

曼奇尼等：帮助视觉障碍用户在步行和跑步过程中的机电系统 655

控制器的增益基于前瞻距离$l_d$，该距离可动态适应用户速度。在跟踪过程中，前瞻参数起着关键作用。

有必要在减小跟踪误差和振荡之间找到最佳折衷方案。

较小的前瞻距离会产生较低的跟踪误差，但可能出现振荡，并且会向用户发送过多的校正，导致混淆和压力。

较大的$l_d$值可确保更平滑的路径跟踪，但会导致更大的跟踪误差。在这种情况下，指令更容易理解。我们需要记住，用户通常更倾向于接收平滑的指令，即在手套之间的过渡较为柔和。振荡会引起手套之间频繁切换。此外，路径/轨迹应设计为平滑转弯，以确保较大的曲率半径。

这样可以使路径跟踪更加容易。

C. 模糊控制器

还设计了一个模糊控制器，用于推导用户为跟踪期望路径所需执行的平移和旋转速度。该模糊控制器需要两个输入，分别表示横向误差和方向误差（$e_t$ 和 $e_\theta$）。

模糊模型生成两个输出，分别表示平移和旋转速度（$v$ 和 $\omega$）。方向误差$e_\theta$ 根据以下公式计算：
$$
e_\theta = (\theta - \theta_v) \cdot \text{sign}(\bar{x}_G) \quad (12)
$$
其中
$$
\theta_v = \arctan\left(\frac{\bar{y}_G}{\bar{x}_G}\right) \quad (13)
$$
为横向和方向误差设计了一组隶属度函数，用于对误差的低、中、高值进行建模。

关于平移速度，我们使用了三种函数来建模减小、保持和增加操作；而对于旋转速度，我们使用了保持、低速转弯_和高速转弯_。图3显示了所采用的隶属度函数（一组三角形和梯形函数）。这些函数能够根据横向和方向误差的幅值进行推理，得出平移和旋转速度，并将其转换为相应幅值的振动。

表I 总结了速度控制器的规则集，其中$e_t$是横向误差，$e_\theta$是方向误差。

结合输入变量以生成期望输出的规则使用了与操作符。

表I中的第一条规则可以解释为：如果($e_t$为低与 $e_\theta$为低) 那么 $v$为高；$\omega$为保持 AND 通过最小值方法计算，而解模糊化则通过计算质心来完成。

VI. 实验试验

在本节中，我们首先提供纯追踪控制器的结果，然后展示帧处理流程应用于采集的真实数据轨迹上的结果。

示意图2

A. 纯追踪与模糊控制器的评估

我们在不同路径上进行了多次仿真，纯追踪控制器在大多数情况下均获得了最佳的跟踪误差性能（考虑最大值、平均值和标准差）。图4和图5分别展示了纯追踪控制器与模糊方法的控制器性能。路径为标准跑道。我们考虑了$T_c = 0.1$s，$l_d = 10$m ，且用户初始位置在启动时为$(0,-2)$ 和 $\theta = -3/4$。纯追踪控制器在初始阶段也能确保更好的跟踪性能。

656 IEEE智能交通系统汇刊，第19卷，第2期，2018年2月

示意图3

示意图4

表I 控制器的模糊规则；输入通过使用与操作符进行组合

当需要补偿方向误差时，模糊控制器在补偿初始误差方面较慢，且振荡高于追踪控制器。这种行为在其他类型的路径上也有所体现，例如S形路径和U形转弯。如第V小节所述，目标点以及前瞻距离起着关键作用。如果误差超过前瞻距离，跟踪可能会失败。在这种情况下，有必要增加 $l_d$的值，直到用户能够跟踪路径为止。

B. 跑道车道检测

在本小节中，我们展示了在真实（田径）跑道上采集的数据集中一些具有代表性的帧处理结果，包括在强烈阳光和阴影存在的情况下的结果。图像处理流程已配置为用于检测车道。图像以10帧每秒的速度采集。我们的阈值算法参数为：$S=w/2$,$T= 0.35$, $S1= w/16$ 和 $T1= 0.5$。参数$S1$ 和 $T1$ 源自我们之前的算法[49]，用于在大面积区域被分类为黑色或白色时提高二值化图像的精度和精确度。

示意图5 (d) 原始图像；(b)(e) 分割图像；(c)(f) 提取的车道。)

表II 从实验试验中得出的学习曲线

测试在慢跑过程中进行，速度范围约为2至3m/s。已对5人小组进行了测试，以评估系统的性能。最重要的反馈与从左手套切换到右手套以及相反的次数有关。这使得可以调整$l_d$参数，以确保更“舒适”的路径跟踪。

图7展示了在阴天时于真实赛道上进行帧处理的样本。

图7中的每一行代表一个难度递增的不同帧，即存在额外的线条/物体，但并未对需跟随车道的正确识别产生负面影响。

左列为原始帧，中间列显示从提取的感兴趣区域进行的分割，右列则展示最终结果（车道）。黄色和绿色线段表示相对于$w/2$的距离。图8展示了使用多种算法进行阈值处理的结果：二值法、大津法、自适应高斯以及我们的分割算法。采用我们的方法对图像进行分割所需的计算时间比其他方法更长，但在阴影或直射阳光等恶劣条件下，其表现优于其他算法。

图9显示了在直射阳光造成的挑战性条件下获取的帧处理结果。图10表明，即使存在阳光等外部干扰，我们的分割算法仍能够正确阈值化图像。结果的呈现方式与图7 类似，不同之处在于由于直射阳光导致帧过曝。在我们的测试中，由于直射阳光引起的信噪比低，在某些情况下部分帧的车道检测失败（见图6）。

在所有试验期间，80%的时间内导航误差被限制在车道宽度范围内。剩余的20%超出了

曼奇尼等：机电系统帮助视觉障碍用户在步行和跑步过程中 657

示意图6

示意图7 原始图像。分割算法：(b) 二值法 (c) 大津法 (d) 自适应高斯 (e) 我们的分割算法 .)

即使车道宽度低于两条车道的宽度（典型车道宽度为 1.22米），这些数值也是基于一组5名用户完成田径跑道（总长度400米）完整圈数所获得的。每位用户完成了10圈，每完成2圈后暂停一次。

在直射阳光下的导航是为视障用户完全保障安全导航最难以解决的问题之一。与触觉设备的交互表明，学习曲线较短，但前瞻距离的错误取值可能导致一系列频繁的指令

在曲率半径中等至较高的路径上，控制器能够引导用户沿正确路线行进。如上所述，左右手套之间的切换次数可能导致方向迷失，且滞后效应可能影响整个系统的可用性。

测试得出的另一项反馈是，当用户速度在大半径曲线路径上超过2m/s 、在直线路径上超过3m/s时，有必要增加帧率。目前帧率为恒定值，如前文所述，表现最佳的选择为 20赫兹。学习曲线较为平缓，用户很快就能适应。

658 IEEE智能交通系统汇刊，第19卷，第2期，2018年2月

示意图8

示意图9

用户能够成功完成两到三圈完整赛道行走。另一个有趣的反馈是考虑使用远程操作员，通过视觉反馈引导残障用户沿期望路径行进。表II总结了从试验中得出的学习曲线。

当用户偏离车道超过2秒时，即发生停止与重启事件。表 II矩阵中的每个值代表在特定速度（行）和转弯次数（列）组合下，停止与重启事件的平均值。

学习曲线表明，当增加速度时，在达到较低数值之前需要完成的圈数增多

停止与重启事件的概率高于低速行走。在这种情况下，用户有更高的几率保持在赛道上。

VII. 结论与未来工作

本文提出的工作聚焦于视障人士进行步行和跑步活动的问题。所提出的架构依赖于单目摄像头的数据，通过降低功耗、尺寸、重量和侵入性，简化了系统复杂性。

实际上，视觉系统充当了一种虚拟白手杖，能够检测地面上的车道或线条。主要原因是

曼奇尼等：用于帮助视觉障碍用户在步行和跑步期间的机电系统 659

使用这些路径可以确保较高的安全标准。考虑到用户将跟踪这些标记，准确且精确地检测车道或线条非常重要。然而，该方法也可以扩展到检测其他感兴趣的特征。使用自然地标的一大优势在于无需进行系统设置，而检测车道/线条则需要对地面进行涂装。所开发的系统适用于户外环境中的步行和慢跑。其中最关键的环节之一是线条和车道的提取，这一过程可能受到阳光或路径上阴影的显著影响。

所采用的策略通过使用基于我们先前工作[49]的自适应阈值技术，最大限度地减少了提取误差。此外，我们借鉴移动机器人学中的差动轮式模型设计了一个控制器，并提出了两种分别基于前瞻距离和模糊逻辑的方法。

在今后的工作中，我们将减小系统的整体尺寸和重量。

我们还计划结合基于视觉的系统与其他传感器（如小型雷达和紧凑型RTK L1 GPS接收器）来检测路径上的障碍物，以尽可能减少干扰。该问题会影响户外环境；使用L1 RTK接收器提供绝对定位数据，将当前位置与认证路径进行匹配，可降低跟踪错误路径的概率。

还将测试振动手环，以评估用户对振动的敏感度，从而提升用户体验。同时将开发无线充电电路，以简化手套/ 手环电池的充电过程。

使用摄像头对路径上的障碍物进行检测也将在“拥挤” 场景下进行测试，以提高残障用户在行走/奔跑时的安全性。