助力盲人空间定向:创新技术与解决方案
1. 背景与问题提出
现代科技发展为盲人的独立行动带来了诸多解决方案,但目前仍缺乏能帮助年轻盲生或新失明成年人学习空间定向技能的电子智能辅助系统。现有的多数系统,如 TotuPoints,通常仅支持已有高级空间定向技能的人群,且是在真实环境中直接发挥作用,而模拟环境下学习空间定向的解决方案几乎空白。
为解决这一问题,我们提出了一种新技术,旨在让盲生学习空间定向技能,同时辅助培训师完成教学任务。该技术基于几个主要现象和组件,利用约 50%盲人具备的回声定位能力、双耳声音以及语义技术,构建了特殊的对象地图本体,助力盲生进行空间识别和导航。
2. 相关工作与方法
在出行前,人们常使用谷歌地图等服务查找路线,通过谷歌街景等虚拟环境提前探索未知地点,但这些虚拟环境对盲人往往不可访问。为解决这一问题,人们尝试了多种方法:
-
游戏学习法
:如在某个项目中使用基于声音的电脑游戏“太空模拟器”帮助盲人学习空间定向。实验表明,该软件的趣味性促使盲人用户积极探索虚拟环境,并将技能迁移到现实世界。
-
智能拐杖
:逐渐取代传统白色拐杖,配备电子设备,能通过振动或语音实时提醒用户前方障碍物信息,还可安装 GPS 模块或与智能手机通信,提升用户的独立性和安全性。
-
虚拟现实系统
:为新失明人群的定向和移动训练而开发,用户可通过听觉和触觉反馈与虚拟结构和对象进行交互。
-
其他辅助技术
:包括基于单传感器的小型可穿戴设备(如 BuzzClip)、利用声音信号辅助导航的电子设备、感官替代设备、智能手机应用(如基于 GPS 的旅行辅助应用)以及配备复杂传感器的设备等。
| 解决方案 | 特点 |
|---|---|
| 游戏学习法 | 趣味性强,促进技能迁移 |
| 智能拐杖 | 实时提醒,可拓展功能 |
| 虚拟现实系统 | 提供交互体验 |
| 其他辅助技术 | 形式多样,满足不同需求 |
3. VRS 系统介绍
为方便盲人空间定向的学习和教学,我们提出了基于虚拟现实声音(VRS)概念的系统。
3.1 系统工作原理
以一名一年级盲生约翰为例,他想学习从所在大学的计算机科学学院大楼到火车站的路线,可借助空间定向培训师和 VRS 系统。具体步骤如下:
1. 培训师运行 VRS 系统中的应用程序,可使用任何基于 GPS 坐标的程序创建路线,然后将路线导入 VRS 系统。
2. 培训师补充与路线相关的其他对象和数据,如街道过渡点、警报、路灯、草坪、公交站、围栏柱等。
3. 系统将生成的路线处理成一系列双耳声音和文本描述。
4. 培训师向学生播放路线的声音 - 文本表示,例如:
- 文本:打开计算机科学学院的出口门。
- 声音:学生前方传来车辆左右行驶的声音。
- 文本:向左转 90 度,沿街道前行约 80 米到达最近的十字路口。
- 声音:学生右侧传来车辆前后行驶的声音。
- ……
学生在熟悉几乎整个路线后,就可以安全地在现实环境中独立完成该路线。
graph LR
A[培训师创建路线] --> B[导入 VRS 系统]
B --> C[补充相关数据]
C --> D[处理成声音和文本描述]
D --> E[播放给学生]
E --> F[学生熟悉路线]
F --> G[独立完成现实路线]
3.2 VRS 系统概念
该系统主要基于对象地图本体,拥有分别为培训师和学生设计的用户界面。
-
培训师界面
:可使用图形小部件或外部应用程序(如 SketchUp 或谷歌地图)为学生创建路线,生成路线的图形表示,再转换为本体的个体和关系形式。通过系统的推理层,为地图上的特定对象配备预录制的双耳声音样本和文本描述。
-
学生界面
:由安装在智能手机上的应用程序和耳机组成,可播放生成路线的双耳声音和文本描述,让学生在出行前熟悉路线。
助力盲人空间定向:创新技术与解决方案
4. 本体实现、对象地图结构与模式
为满足盲人空间定向培训的需求,我们采用本体来描述相关知识,并选择 OWL(网络本体语言)作为描述语言。我们提出了专门开发的对象地图本体和双耳声音分类集。
4.1 本体的类结构
本体中的类代表了对盲人用户重要的城市空间元素,主要分为以下几类:
1.
城市组件
:代表城市的物理和固定元素,包括城市建筑元素和行人基础设施。
-
城市建筑元素
:如广告栏、自动取款机、护柱、公交站、电线杆、路标、交通灯、垃圾桶等。
-
行人基础设施
:如电梯、人行道、人行横道、楼梯、道路基础设施(包括桥梁、十字路口、街道、交通环岛、隧道等)。
2.
位置
:每个城市建筑元素通常都有其位置(地址)和地理定位坐标。
3.
房地产
:可以是目的地或兴趣点,如银行、火车站、学校、商店等。
4.
车辆
:代表移动对象,如公交车、汽车等,每个对象都有其特定的声音。
5.
声音
:每个路线上的地点都可以分配一个双耳声音,如 MP3 或 WAV 格式的文件。
| 类别 | 具体元素 |
|---|---|
| 城市组件 | 城市建筑元素(广告栏、ATM 等)、行人基础设施(电梯、人行道等) |
| 位置 | 地址、GPS 坐标 |
| 房地产 | 银行、火车站、学校、商店等 |
| 车辆 | 公交车、汽车等 |
| 声音 | MP3、WAV 格式文件 |
以下是部分类的层次结构:
1. 顶层为 owl:thing 类,其下继承的类有:
- 城市组件:
- 城市建筑元素:
- 广告栏
- ATM
- 护柱
- 公交站
- 电线杆
- 路标
- 交通灯
- 垃圾桶
- 行人基础设施:
- 电梯
- 人行道
- 人行横道
- 楼梯
- 道路基础设施(桥梁、十字路口等)
- 位置
- 房地产
- 车辆
- 声音
4.2 本体的个体
OWL 个体代表我们感兴趣的领域中的对象。目前,为了实现从计算机科学学院到火车站的简单短路线,我们确定了 35 个个体,例如:
-
用于设置路线的个体
:如 Sienkiewicza 街左侧人行道的第一段 pavementSienkiewicza1、Armii Krajowej 街左侧人行道的第二段 pavementArmiiKrajowej2、3Maja 街与 Armii Krajowej 街交汇处的第一个人行横道 pedestrianCrossing3Maja1。
-
可能成为障碍物的个体
:如位于人行道边缘街道一侧的垃圾桶 trashCanSienkiewicza1、位于人行道中间的公交站 busStop01SiedlceArmiiKrajowejSienkiewicza、位于人行道边缘街道一侧的路灯 poleArmiiKrajowej、位于草坪一侧人行道边缘的大直径广告栏 advertisingColumnArmiiKrajowej3Maja。
-
提供移动信息的个体
:如交通灯 trafficLightArmiiKrajowej3Maja1,告知用户安全过马路的可能性。
-
用户可使用的个体
:如用于取款买票的自动取款机 atmSiedlceArmiiKrajowej。
-
可通过声音识别的个体
:如带有停车和开门声音的公交车 bus1scania。
通过将现实世界中的物理对象映射到个体,我们可以创建城市的本体表示。
4.3 本体的数据属性和对象属性
- 数据属性 :定义了可以分配给域(在这种情况下是 OWL 类)的数据类型。例如,地址类具有 address_country_name(xsd:string)、address_post_code(xsd:string)等数据属性;停车类有 parking_capacity 数据属性;声音类有 filename、filePath、fileURI 和 fileType 等数据属性,代表录制的声音。
-
对象属性
:是 OWL 个体之间的二元关系,用于更智能和更好地描述环境。相关关系定义如下:
- appliesToPedestrian :用于确定一个事物对另一个事物的应用。例如,交通灯类的一个对象只能应用于人行横道类的一个对象。
- hasDirectNeighbor :对称属性,当 pavementSienkiewicza 个体通过该属性与 pavementArmiiKrajowej 个体相关联时,pavementArmiiKrajowej 也必须通过该属性与 pavementSienkiewicza 相关联,用于确定路线的下一个元素。
- hasLocation :每个对象(个体)在地图上有且只有一个位置,由地址和/或 GPS 坐标表示。
- isLocatedOn :主要用于表示某个事物位于盲人移动的路线上。例如,垃圾桶位于人行道上,可能成为障碍物。
- recordedInTheLocation :用于将声音分配到特定位置。例如,代表街道上汽车行驶的声音,可根据用户移动方向在左或右声道播放。
graph LR
A[OWL 类] --> B[数据属性]
A --> C[对象属性]
B --> D[地址类属性]
B --> E[停车类属性]
B --> F[声音类属性]
C --> G[appliesToPedestrian]
C --> H[hasDirectNeighbor]
C --> I[hasLocation]
C --> J[isLocatedOn]
C --> K[recordedInTheLocation]
5. 总结
通过提出基于 VRS 概念的系统和构建对象地图本体,我们为盲人空间定向的学习和教学提供了一种新的解决方案。该系统利用盲人的回声定位能力、双耳声音和本体技术,帮助盲生在模拟环境中学习空间定向技能,提高他们在现实环境中的独立移动能力。未来,我们可以进一步完善本体,增加更多的城市元素和声音样本,以更好地满足盲人的需求。同时,还可以对系统进行更多的实验和优化,提高其准确性和实用性。
超级会员免费看
145

被折叠的 条评论
为什么被折叠?



