边缘数据分发处理与里斯本共享单车停靠站识别研究
1. 边缘数据分发与处理实验
在车辆速度和长度测量的实验中,采用了三个不同角度(30°、45°和90°)的控制节点(CN)搭配超声波传感器(US)来对单个模块进行特性分析。实验使用了一辆实际长度为3.7米的车辆,让其以10米/秒(36千米/小时)的速度分别通过测量模块十次。
实验测试了两种不同的数据处理情况:
-
集中处理
:30°和45°的模块将测量距离的原始数据传输到90°模块。这种情况属于分层模型,其中30°和45°的CN节点负责数据收集,而90°节点则负责收集数据以及计算最终的速度和长度。相关结果如下表所示:
| | CN 30 | CN 45 | CN 90 Results | CN 90 |
| — | — | — | — | — |
| tControl (AVG) | 32.34 | 28.97 | 235.73 | |
| tControl (STD) | 3.85 | 2.15 | 18.93 | |
| tResponse (AVG) | 51.38 | 31.38 | 276.54 | |
| tResponse (STD) | 3.18 | 2.18 | 20.49 | |
| tLatency (AVG) | 1340.81 | 1362.25 | | |
| tLatency (STD) | 90.90 | 87.34 | | |
| Speed (AVG) | | | | 10.12 |
| Speed (STD) | | | | 1.17 |
| Speed (Rel.E) | | | | 5.79% |
| Length (AVG) | | | | 3.76 |
| Length (STD) | | | | 0.15 |
| Length (Rel.E) | | | | 1.61% |
-
分布式处理
:30°和45°的CN节点计算速度和长度的平均值以及标准差,然后将这些信息发送给90°模块。结果如下表:
| | CN 30 | CN 45 | CN 90 |
| — | — | — | — |
| tControl (AVG) | 45.51 | 49.65 | 113.04 |
| tControl (STD) | 5.34 | 1.44 | 1.06 |
| tResponse (AVG) | 105.16 | 56.67 | 132.22 |
| tResponse (STD) | 1.77 | 4.77 | 12.06 |
| tLatency (AVG) | 1339.41 | 1362.65 | NA |
| tLatency (STD) | 92.30 | 85.94 | NA |
| Speed (AVG) | 10.55 | 12.92 | 10.08 |
| Speed (STD) | 1.01 | 1.18 | 0.97 |
| Speed (Rel.E) | 5.79% | 17.77% | 4.12% |
| Length (AVG) | NA | NA | 3.71 |
| Length (STD) | NA | NA | 0.09 |
| Length (Rel.E) | NA | NA | 0.78% |
实验结果显示,90°模块计算出的速度和长度在两种情况下具有相似的准确性。不过,实验的重点在于比较两种情况下的总时间。集中处理时,设备处理的总时间为315.04毫秒,响应时间(通信时间和处理时间之和)为359.3毫秒;而分布式处理时,总处理时间为208.00毫秒,响应时间为294.05毫秒。这表明分布式处理节省了约22%的处理和通信时间。
分布式处理能够减少整体处理时间,虽然延迟时间没有显著变化,但由于模块在I2C网络中工作,集中处理时需要传输大量数据。因为每传输一条包含瞬时速度的消息,就必须传输五条包含测量距离的消息。而传输最终速度或最终长度时,这种差异会更大。在发送数据之前减少消息数量和处理数据,对于降低处理时间和网络负载导致的功耗具有重要意义。
2. 里斯本共享单车停靠站识别研究
2.1 研究背景与意义
在城市发展中,清洁出行方式对环境、经济和社会都有着巨大的影响。软出行方式,尤其是共享单车服务,为城市内的燃油车辆提供了替代方案,在可持续交通中发挥着关键作用。然而,确定共享单车停靠站的最佳位置并非易事,需要考虑诸多因素,如与自行车道的接近程度、兴趣点、交通枢纽、学校等。同时,个人手机的移动数据可以提供有关人口统计率、交通轨迹、起点/终点等关键信息,有助于软出行平台的安装。
2.2 里斯本共享单车情况
里斯本拥有世界上常见且知名的共享单车计划(BSS),即2017年在市中心推出的公共共享单车服务(Lisbon Bicycles)。经过在Parque das Nações的试点阶段后,由市政交通和停车公司运营。到2018年底,骑行次数达到了100万次,如今已超过350万次。随着受欢迎程度的持续上升,预计今年停靠站和自行车的数量将随着未来几年对自行车道的投资而增加。目前,该服务除了Parque das Nações,还计划在另外两个教区(Marvila和Beato)推出,这些新地点有多个旅游景点和公共交通枢纽,并且正在建设新的自行车道。
2.3 相关研究
近年来,共享单车系统受到了广泛而持续的研究。安全性对所有用户都至关重要,同时共享单车的使用可替代短途出行和解决首/末英里问题,并与其他现有出行服务的数据相关联。高质量的自行车道与自行车使用之间存在直接关系,因此在规划共享单车停靠站时,自行车研究至关重要。
许多研究人员在过去几年中使用聚类技术进行城市出行研究。例如,使用K - medoids、谱聚类算法和凝聚聚类等算法,可以找到具有相似位置模式的轨迹。还有研究通过聚类过程将所有站点分类,并展示了工作日高峰时段的聚类时间模式。经过分析,k - means聚类应用被证明是绘制共享单车服务地图的重要方法,本研究也采用了该方法。
2.4 研究方法
本研究主要分为两个部分:数据验证和处理过程。
-
数据
:全球的电信运营商会产生大量数据,每个移动设备都可作为跟踪设备,提供有关设备位置的重要信息。但这些数据涉及个人隐私,需遵循通用数据保护条例(GDPR)以及道德和传统原则。在葡萄牙,一家运营商在2020年1月的记录超过70000条。高人口聚集信息以矢量形式(多边形)在地理信息系统(GIS)中表示,也称为Bin或S2单元。不过,这些数据存在一些限制:
1. 一个设备可能在数据集中的多个条目中被检测到。
2. 区域的地理定义可能受到GPS误差和限制的影响。
3. 速度是唯一可用于出行目的的属性(如步行、跑步、骑行、停止等)。
数据集中每个条目的信息可总结如下表:
| 列名 | 数据类型 | 含义 |
|---|---|---|
| 标识符 | 整数 | 数据集中每个记录的唯一标识符,与设备标识无关 |
| 日期 | 日期 | 设备在给定区域被检测到的日期 |
| 小时 | 整数 | 对应一天中所有可用的时间框架,所有记录的时间粒度 |
| 速度 | 浮点数 | 给定区域内检测到的设备的平均速度 |
| 设备数量 | 整数 | 数据集中指定条目中聚合的设备数量 |
| Bin | 多点S2单元,由ESPG:4326中的点列表定义 | 定义一个类似于50×50米正方形的区域 |
-
处理过程
:
- 从葡萄牙电信运营商获取移动数据后,首先开发了一个方法管道,包括数据收集、清洗和分析。
- 保留了一些用于分析和清洗过程的参数,去除了可能影响出行模式的参数(如数据的时间框架可用性、外部因素、公共假期等)。
- 由于隐私政策和GDPR的限制,无法使用精确的地理坐标,因此将每个Bin作为每个记录的地理特征(区域)。但由于每个记录涉及多个点,导致分析复杂度增加,因此需要进行复杂度降低(质心计算),借助GIS软件找到每个多边形的中心。
- 为了实现设备点的均匀分布,进行了展开操作,即每个条目在数据集中重复N次,N为该条目中考虑的设备数量。
- 由于研究区域(Beato、Marvila和Parque das Nações)的地理不对称性,且只有Parque das Nações有软出行解决方案,因此需要进行比较分析以验证算法。
- 为了对每个教区进行单独研究,进行了地理处理操作,以界定所有停靠点的地理分布。
- 算法开发中,使用了20千米/小时的平均速度,不考虑用户性别、身体状况、天气条件等因素。
- 采用K - means算法,首先确定聚类的数量,使其与Parque das Nações已安装的共享单车停靠站数量(14个)相匹配,并使用Elbow方法确定K - means算法的参数。
优化共享单车停靠站的伪代码如下:
Result: List of docking stations nearby bike paths
Apply K-Means algorithm on specific council parish;
Define threshold for otimization (in meters);
For each centroid(c) output from k-Means do
For each segment(seg) of bike-path do
Project c in seg, output is np, following nearest point definition;
Calculate distance(d) from np and c;
If the minimum distance from d to np is lower than threshold;
Adopt the point in segment as optimal point (located in bike-path);
EndDo;
EndDo;
Print optimised points;
综上所述,通过边缘数据的分布式处理可以有效提高数据处理效率,减少处理和通信时间;而利用移动数据和聚类技术来识别里斯本共享单车停靠站的方法,为合理规划停靠站位置提供了科学依据,有助于推动城市的可持续交通发展。
3. 方法流程总结
为了更清晰地展示里斯本共享单车停靠站识别研究的方法流程,下面使用 mermaid 流程图进行说明:
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;
A([开始]):::startend --> B(获取移动数据):::process
B --> C(开发方法管道):::process
C --> D(数据清洗与参数筛选):::process
D --> E(考虑隐私采用 Bin 地理特征):::process
E --> F(质心计算降低复杂度):::process
F --> G(展开操作实现均匀分布):::process
G --> H(比较分析验证算法):::process
H --> I(地理处理界定停靠点分布):::process
I --> J(确定平均速度):::process
J --> K(使用 K - means 算法):::process
K --> L(定义优化阈值):::process
L --> M(遍历质心和自行车道段):::process
M --> N{距离是否小于阈值}:::decision
N -- 是 --> O(采用最优停靠点):::process
N -- 否 --> M
O --> P([输出优化停靠站列表]):::startend
这个流程图详细展示了从获取数据到最终输出优化共享单车停靠站列表的整个过程,各个步骤之间逻辑清晰,有助于理解整个研究方法的执行顺序和关键环节。
4. 研究成果与展望
通过上述实验和研究,取得了以下重要成果:
-
边缘数据处理方面
:分布式处理在车辆速度和长度测量实验中展现出显著优势,能够节省约 22%的处理和通信时间。这一结果表明,在数据处理中合理分配处理任务到边缘节点,可以有效提高系统的整体效率,减少不必要的数据传输和处理开销,对于降低功耗、减轻网络负载具有重要意义。
-
共享单车停靠站识别方面
:利用移动数据和 K - means 聚类算法,为里斯本共享单车停靠站的规划提供了科学的方法。通过考虑多种因素和数据的处理与分析,能够更准确地确定停靠站的位置,满足城市居民的出行需求,促进共享单车服务的发展,推动城市可持续交通的进步。
展望未来,还有许多方面值得进一步研究和探索:
-
边缘数据处理
:可以深入研究如何根据不同的应用场景和数据特点,更灵活地分配处理任务到边缘节点,进一步优化分布式处理的效果。同时,探索如何结合人工智能和机器学习算法,提高边缘节点的数据处理能力和智能决策水平。
-
共享单车停靠站识别
:可以考虑纳入更多的因素,如居民的收入水平、教育程度、气候条件等,以更全面地评估停靠站的需求和合理性。此外,还可以研究如何将共享单车停靠站与其他交通方式(如公交、地铁等)进行更好的整合,实现城市交通的无缝衔接。
总之,边缘数据的分布式处理和共享单车停靠站的识别研究为城市的智能化和可持续发展提供了重要的支持和方向。未来的研究将不断完善和拓展这些方法,为城市的发展带来更多的便利和效益。
5. 总结
本文围绕边缘数据分发处理和里斯本共享单车停靠站识别展开了深入研究。在边缘数据处理实验中,对比了集中处理和分布式处理两种方式,结果表明分布式处理在时间效率上具有明显优势,能够有效减少处理和通信时间,降低系统的功耗和网络负载。在里斯本共享单车停靠站识别研究中,通过收集移动数据,运用 K - means 聚类算法和一系列数据处理步骤,为停靠站的规划提供了科学依据,有助于提高共享单车服务的质量和覆盖范围,推动城市清洁出行的发展。
通过这两项研究,我们看到了技术在城市发展中的重要作用。边缘数据处理技术的应用可以提高数据处理的效率和智能性,而基于移动数据的聚类分析则可以为城市基础设施的规划提供更精准的决策支持。未来,我们期待这些技术能够在更多的领域得到应用和推广,为城市的可持续发展做出更大的贡献。
同时,我们也应该认识到,这些研究还存在一定的局限性。例如,在边缘数据处理中,延迟时间的优化还需要进一步探索;在共享单车停靠站识别中,考虑的因素还可以更加全面。因此,未来的研究需要不断地改进和完善,以适应城市发展的不断变化和需求。
希望本文的研究成果能够为相关领域的研究人员和决策者提供有益的参考,共同推动城市的智能化和可持续发展。
超级会员免费看

被折叠的 条评论
为什么被折叠?



