17、数据转换、映射与总结：全面解析与应用

最新推荐文章于 2025-10-30 08:47:17 发布

老板来份香菜

最新推荐文章于 2025-10-30 08:47:17 发布

阅读量32

点赞数

CC 4.0 BY-SA版权

分类专栏：解码数据可视化的基石文章标签：数据转换数据映射数据总结

本文链接：https://blog.youkuaiyun.com/hadoop5ranger/article/details/151671779

解码数据可视化的基石专栏收录该内容

43 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

数据转换、映射与总结：全面解析与应用

1. 数据嵌入方法的替代策略

在数据处理中，除了保留点与点之间的距离，还可以将嵌入问题视为保留数据密度。t - sne嵌入方法就是基于这个策略，它通过非参数密度估计来计算局部概率密度，并构建目标坐标Y，使得每个点附近的点密度相似。这种方法广泛应用且通常有效，但会保留或增强数据中的聚类（聚类区域数据密度较高）。

另一种MDS类方法适用的情况是：数据点本身没有坐标，但距离或相似度信息容易获取，这在图布局问题中很常见。图的边通常带有权重，代表不相似度（近似距离）或相似度（内积）。例如，顶点关联着信号，像政治家的投票模式、城市或气象站的天气模式，或者生物学中基因、分子或生物体之间的相互作用。在这些情况下，将图的顶点嵌入二维空间进行可视化有时很有帮助。通常，相似度或距离是计算顶点二维坐标的一部分，应力最小化是常用方法，因为它可以与其他标准结合。图布局问题研究广泛，有效的解决方案除了考虑距离，还会关注边交叉、边/顶点密度等问题。