环形线性流场图的运动模式建模评估
1. 稳定性图
稳定性图用于展示在多次测量过程中哪些区域存在稳定的流。其基本思路是为每次测量构建一个流图,然后使用Kullback - Leibler散度(KLD)进行比较。
1.1 稳定性评估公式
为了评估稳定性$I(k)$,需要计算所有对应地图之间的成对对称Kullback - Leibler散度之和(sKLD):
$I(k) = \sum_{i,j\in n} sKLD(k)_{i,j}$
其中,$n$是地图的数量,$k$是当前评估的单元格,$i$和$j$是当前评估地图的索引。
1.2 KLD和sKLD的计算
KLD在离散状态空间$\Omega_{\theta,P}$中计算,每个状态是方向和速度的元组$\gamma = (\theta, P)$,其中$\theta \in {\theta_{min}, \theta_{min} + \Delta\theta, \ldots, \theta_{max}}$,$P \in {P_{min}, P_{min} + \Delta P, \ldots, P_{max}}$。对于地图中第$k$个元素的KLD定义为:
$KLD(\mathbf{x}
i(k)||\mathbf{x}_j(k)) = \sum
{\gamma \in \Omega} x_{i\gamma}(k) \log \frac{x_{i\gamma}(k)}{x_{j\gamma}(k)}$
每个单元格$(k)$的sKLD计算为:
$sKLD(k)_{i,j} = KLD(\mathbf{x}_i(k)||\mathbf{x}_j(k)) + KLD(\mathbf{x}_j(k)||\mathbf{x}_i(k))$
2. CLiFF - 图的评估
2.1 CLiFF - 图玩具示例
CLiFF - 图的主要特点是能够捕捉流的多模态特征,通过两个玩具示例可以展示其关键特性。
2.1.1 方向分离
通过对模拟测量数据进行离散化处理,可以构建分布。CLiFF - 图能够保留流的正确方向和速度信息,即使在流相交的部分,也能保留两个运动方向的信息,但由于地图分辨率的原因,可能会出现轨迹变宽的伪像。
2.1.2 速度分离
此示例展示了CLiFF - 图能够保留不同速度的信息,在同一位置正确建模来自不同速度的两种模式,同样会因地图离散化出现类似伪像。
2.2 映射评估
主要研究不同的EM初始化方法与所得地图质量之间的依赖关系,使用两个真实世界的数据集进行评估:
- 爱丁堡行人数据集
- 无人机风数据集
2.2.1 爱丁堡行人数据
数据集描述
该数据集于2009年8月24日至2010年8月1日期间,在爱丁堡大学信息学院收集,记录了超过95998条行人轨迹。相机固定在约23米高处,图像分辨率为640×480,每秒约捕获9帧。基于连续观测之间的平移估计速度测量值,并构建表示流的地图用于评估。
结果地图概述
从数据集中提取的速度测量值对应行人的路径,主要路径有A - E、A - D、B - C、E - D、E - C、C - D。学习到的运动方向与这些模式相符。通过根据混合因子拆分模式,可以提取主导运动模式,同时表明CLiFF - 图能够以适当的方式学习和表示罕见事件。
定性示例
分析单个SWGMM的参数计算方式,讨论了三种聚类方法(MS、k - means、OPTICS),分为各向同性和非各向同性方法。不同聚类方法的结果差异较大,例如非各向同性核在速度差异上的惩罚小于各向同性核,OPTICS聚类通常产生较少的簇。
使用不同方法获得初始簇后,用EM拟合SWGMM。最终模式的位置与初始簇的位置并不对应,各向同性MS初始化不仅能根据速度区分模式,还能根据方向区分。
定量评估
使用爱丁堡数据集的前9天进行定量评估,目标是评估表示质量并衡量不同聚类方法对表示质量的影响。使用三种指标评估地图质量:Wang散度、BIC和k - CV,同时评估每种初始化方法生成的簇数量。结果表明:
- 簇越多,散度越小,但过多的簇会导致过拟合,而过少的簇会导致欠拟合。
- 交叉验证更倾向于中等数量簇的模型。
- BIC在这种数据类型下可能不是最佳的模型选择标准。
- 连续表示比离散表示更适合准确表示底层数据。
| 初始化方法 | 平均散度(排序) | 平均簇数量 |
|---|---|---|
| 各向同性k - means | [具体值1] | [具体值1] |
| 非各向同性k - means | [具体值2] | [具体值2] |
| 各向同性MS | [具体值3] | [具体值3] |
| 非各向同性MS | [具体值4] | [具体值4] |
| 各向同性OPTICS | [具体值5] | [具体值5] |
| 非各向同性OPTICS | [具体值6] | [具体值6] |
graph LR
A[数据集] --> B[聚类方法]
B --> C[初始簇]
C --> D[EM拟合]
D --> E[SWGMM模型]
E --> F[评估指标]
F --> G[评估结果]
2.2.2 无人机风数据
数据描述
该数据集由无人机在室外环境的多个预定义位置收集风测量值得到,每个位置测量约20秒。
定量评估
使用与爱丁堡行人数据集相同的方法评估地图质量。结果显示:
- 初始化方法的排序与模型质量(以散度衡量)相关,同时散度与簇数量有关,用户可以根据需求选择合适的初始化方法。
- 与行人数据集不同,无人机数据集的良好预测能力对应于具有更多模式的模型。
- BIC在行人数据集和无人机数据集上的表现不同,无人机数据集更倾向于具有更多簇的模型。
- 多数情况下,模型与数据之间的散度小于直方图,再次证明多模态模型更适合建模与流相关的现实世界现象。
3. 致密化评估
致密化过程的目标是估计未观测位置的测量值,并据此计算动态模式的模型。使用三个数据集进行评估:行人数据集、无人机数据集和铸造厂数据集。
3.1 行人数据
通过对原始地图进行子采样,使用MC和NW插补方法构建完整地图。
- MC插补(核大小0.25m):能够保留主导对角线方向,正确估计左上角的静止区域,底部和左侧边缘的垂直和水平运动模式仍然可见。
- NW插补(核大小0.25m):结果质量较低,地图被明显分割成两个区域,运动模式在大区域上被平均。
当仅使用3%的原始观测位置时,MC插补的结果在定性上仍然正确,但会丢失右下角的运动信息;NW插补结果类似,存在明显分割和过度平滑问题。
通过计算学习到的SWGMM与原始数据之间的散度来定量评估致密化质量。结果表明,致密化质量与数据插补方法和核大小有关,MC方法总体上优于NW方法,但在某些小核情况下,NW方法更好。随着核大小的增加,MC致密化质量提高,而NW致密化质量下降。
3.2 无人机数据
由于无法获取任意密集的数据集,采用留一位置法(LOLO)进行致密化评估。结果显示,MC致密化的中位散度不随核大小变化,且误差差异随核大小增加而减小;而NW致密化的散度随核大小增加而明显增加,误差分散度也增加。这表明NW方法试图平滑数据,而MC方法试图保留建模流的湍流特征。
3.3 铸造厂数据
使用机器人在铸造厂收集的风数据,环境大小为40m×70m,机器人在不同航点停留120秒收集测量值。由于没有更密集的测量数据进行比较,使用稳定性图进行定性评估。
- MC插补致密化的地图能够区分不同风向的区域,且不同气流方向区域之间有清晰的边界。
-
NW插补致密化的地图中,相似运动方向的区域可见,但区域之间的边界不明显,气流变化较为平滑。
通过7次不同测量会话获得的数据集构建的稳定性图显示,尽管使用了不同的插补方法,但大部分区域的稳定性水平相同。
graph LR
A[数据集] --> B[子采样/留一位置]
B --> C[插补方法(MC/NW)]
C --> D[致密化地图]
D --> E[评估(散度/稳定性图)]
E --> F[评估结果]
综上所述,CLiFF - 图在处理多模态运动模式方面表现出色,不同的初始化方法和致密化方法对模型质量有显著影响。在实际应用中,需要根据具体需求选择合适的方法,以获得高质量的模型。
4. 不同数据集评估总结
| 数据集 | 数据特点 | 合适的初始化方法 | 合适的致密化方法 | 评估指标表现 |
|---|---|---|---|---|
| 爱丁堡行人数据集 | 行人轨迹数据,速度分布不对称,数据较均匀分布在单位圆柱上 | 中等数量簇的初始化方法,避免过拟合和欠拟合 | MC方法总体较好,大核时优势明显 | 簇数量与散度有关,交叉验证倾向中等簇数量,BIC不太适合 |
| 无人机风数据集 | 风数据,存在湍流,有多个小数据簇 | 能产生较多簇的初始化方法 | MC方法,保留湍流特征 | 较多簇的模型预测能力好,BIC倾向多簇模型 |
| 铸造厂数据集 | 复杂的风数据,无地面真值 | 无明确最优初始化方法 | MC方法能区分风向区域,NW方法气流变化平滑 | 用稳定性图定性评估,不同插补方法部分区域稳定性相同 |
5. 方法选择建议
5.1 初始化方法选择
- 高精度需求 :如果需要高精度的模型,对数据细节要求高,可选择能产生较多簇的初始化方法,如各向同性MS初始化,虽然可能会增加内存消耗,但能更准确地表示数据模式。
- 内存效率优先 :若内存有限,希望模型更简洁,可选择产生较少簇的初始化方法,如OPTICS聚类方法,不过可能会牺牲一定的模型精度。
- 平衡精度和内存 :对于大多数情况,选择能生成中等数量簇的初始化方法,既能保证一定的精度,又不会过度消耗内存,可通过交叉验证来确定合适的簇数量。
5.2 致密化方法选择
- 保留湍流特征 :当数据集具有明显的湍流特征,如无人机风数据和铸造厂数据,MC方法更适合,它能保留数据的局部特征和变化。
- 平滑数据需求 :如果希望数据在致密化过程中被平滑处理,可考虑NW方法,但要注意可能会导致运动模式的平均化和信息丢失。
6. 未来展望
虽然CLiFF - 图在处理多模态运动模式方面取得了一定的成果,但仍有一些可以改进和拓展的方向。
-
模型优化
:进一步研究更适合不同数据类型的模型结构和参数估计方法,提高模型的准确性和泛化能力。例如,探索新的聚类算法或改进现有的聚类方法,以更好地处理复杂的数据分布。
-
实时处理
:开发能够实时处理大规模数据的算法,以满足实际应用中对实时性的要求。例如,在交通监控、无人机导航等领域,需要快速准确地分析和预测运动模式。
-
多源数据融合
:将CLiFF - 图与其他数据源(如传感器数据、图像数据等)进行融合,以获取更全面的信息。例如,结合摄像头图像和运动传感器数据,更准确地分析行人或物体的运动。
7. 总结
本文围绕CLiFF - 图的评估展开,介绍了稳定性图的计算方法,通过多个玩具示例展示了CLiFF - 图的多模态特征捕捉能力。使用爱丁堡行人数据集、无人机风数据集和铸造厂数据集进行映射评估和致密化评估,分析了不同初始化方法和致密化方法对模型质量的影响,并给出了方法选择的建议。
在实际应用中,用户应根据具体需求和数据特点,选择合适的初始化方法和致密化方法,以获得高质量的运动模式模型。未来,随着技术的发展,CLiFF - 图有望在更多领域得到应用和进一步的优化。
graph LR
A[数据类型] --> B[初始化方法选择]
A --> C[致密化方法选择]
B --> D[模型构建]
C --> D
D --> E[模型评估]
E --> F[结果反馈]
F --> B
F --> C
通过以上的流程,不断优化模型,使其更符合实际需求。在实际操作中,可按照以下步骤进行:
1.
数据收集
:获取所需的运动数据,如行人轨迹、风数据等。
2.
数据预处理
:对数据进行清洗、离散化等操作。
3.
初始化方法选择
:根据数据特点和需求,选择合适的初始化方法。
4.
致密化方法选择
:根据数据的湍流特征和平滑需求,选择合适的致密化方法。
5.
模型构建
:使用选定的方法构建CLiFF - 图模型。
6.
模型评估
:使用评估指标(如散度、交叉验证等)评估模型质量。
7.
结果反馈与调整
:根据评估结果,调整初始化方法和致密化方法,重复步骤3 - 6,直到获得满意的模型。
超级会员免费看
1万+

被折叠的 条评论
为什么被折叠?



