数据降维中的映射解读与应力函数
1. 映射解读相关内容
1.1 图显示的优势
与逐点聚合相比,图的显示能直观呈现对于给定的 κ 值,邻域的范围大小。这有助于解读相关质量指标的映射值,因为有效邻域大小并非总是显而易见,尤其是当邻域由邻居数量而非固定半径定义时。
1.2 失真度量的影响
失真度量指标用于衡量失真情况,它可分解为失真严重程度和关键权重:
- 失真严重程度 :评估一对关系中失真的严重程度,主要取决于图像排名(如 F 的 ρij 和 M 的 rij,范围在 0 到 N - 1 之间)。对于精度和召回率,严重程度是二元度量,区分图像排名高于或低于 κ 的值。这会导致轻度失真和最严重失真表现相同,与无失真情况差异很大,影响可靠映射簇的识别。而可信度和连续性引入了更连续的严重程度度量,通过计算邻域外排名的正部分,能区分轻度和重度失真,便于发现可靠映射簇。
- 关键权重 :考虑在映射中保留该关系的重要性。在 MRRE 失真度量中,关键权重随参考排名变化,通过边的宽度编码,使得检索图中相邻映射邻居和相关性图中相邻数据邻居之间的边比其他边更粗。
1.3 视觉杂乱问题及解决方法
1.3.1 视觉杂乱问题
当点的数量 N、邻居数量 κ 或失真程度增加时,MING 图由于视觉杂乱变得难以阅读,大量的边交叉和重叠使得难以跟踪单个边,尤其是相关性图中不可靠的边。
1.3.2 解决方法
- 交互式边过滤 :
超级会员免费看
订阅专栏 解锁全文
917

被折叠的 条评论
为什么被折叠?



