地图解读与无监督降维应力函数
1. 地图解读
1.1 地图展示与邻域理解
与逐点聚合相比,图形展示能直观呈现特定 κ 值下邻域的范围,有助于解读相关质量指标的地图值,因为有效邻域大小并非总是显而易见,尤其是通过邻居数量而非固定半径来定义时。
1.2 失真度量的影响
失真度量指标定义了如何衡量失真情况,它可分解为失真严重程度和关键权重:
- 失真严重程度 :评估一对关系中失真的严重性,主要取决于图像排名(F 的 ρij 和 M 的 rij),取值范围在 0 到 N - 1 之间。对于精度和召回率,严重程度是二元度量,区分图像排名高于或低于 κ 的值。而可信度和连续性引入了更细致的度量,通过计算邻域外排名的正部分,能区分轻度和重度失真,有助于发现可靠的地图聚类。MRRE 失真度量使用排名误差的正部分,与 κ 无关,但对于小 κ 值,其严重程度度量与可信度和连续性的差异不大。
- 关键权重 :考虑了在映射中保留该关系的重要性,通过边的宽度编码。在 MRRE 失真度量中,检索图中相邻地图邻居和相关性图中相邻数据邻居之间的边比其他边更粗。
1.3 视觉杂乱问题及解决方法
1.3.1 视觉杂乱问题
当点的数量 N、邻居数量 κ 或失真程度增加时,MING 图由于表示的视觉杂乱而变得难以阅读,许多边的交叉和重叠使得难以跟踪单个边,尤其是相关性图中不可靠的边。
1.3.2 解决方法
- 交互式边过滤 :分析人员在探索