距离计算
用于计算数据集中行或列之间的距离。
输入
● 数据:输入数据集
输出
● 距离:距离矩阵
"距离"小部件可计算数据集中行或列之间的距离。默认情况下,数据会进行归一化处理,以确保各特征被平等对待。归一化始终按列进行。
稀疏数据仅支持欧几里得、曼哈顿和余弦距离度量。
生成的距离矩阵可进一步用于以下场景:
- 层次聚类(发现数据中的分组);
- 距离热图或距离矩阵(可视化距离,但距离矩阵在处理较大数据集时可能较慢);
- MDS(多维缩放)(利用距离矩阵映射数据实例);
- 通过保存距离矩阵存储结果,或通过加载距离文件读取已保存的距离矩阵。
此外,距离矩阵可与 Orange 插件协同使用:
- 从距离生成网络(Network 插件):将矩阵转换为图结构;