t-SNE
使用 t-SNE 进行二维数据投影。
输入
● 数据:输入数据集
● 距离矩阵:预计算的距离矩阵
● 数据子集:实例的子集
输出
● 选定数据:从图中选中的实例
● 数据:包含 t-SNE 坐标的原始数据,并新增一列标记点是否被选中
t-SNE 小部件通过 t-分布随机邻域嵌入(t-SNE)生成可视化结果。t-SNE 是一种类似于多维缩放(MDS)的降维技术,通过概率分布将数据点映射到二维空间。
该小部件支持输入数据表或距离矩阵。若输入数据表,小部件将根据预处理选项计算内部距离。
- 预处理
在 t-SNE 计算数据点间距离前应用预处理步骤(若输入为距离矩阵,则忽略这些参数):
- 数据标准化:对每列数据减去均值并除以标准差,以标准化数据。
- 应用 PCA 预处理:对于高维(如 100 或 1000 维)或变量高度相关的数据集,可通过 PCA 预处理加速计算并消除相关性。
- 主成分数量:PCA 预处理时使用的主成分数目。