组件描述
数据行即使在某些或全部原始变量被来自原始变量的计算变量替换时,也保持其身份。
此小部件获取两个数据表(“数据”和“数据子集”),它们可以追溯到同一来源。基于行身份而非实际数据,它会从“数据”中选择所有出现在“数据子集”中的行。
输入
数据:参考数据集
子集数据:要匹配的子集
输出
匹配数据:参考数据集中的子集与子集数据中的索引匹配
不匹配的数据:参考数据集中的子集与子集数据中的索引不匹配
带批注的数据:参考数据集,带有定义匹配项的附加列
按数据索引选择(Select by Data Index) 的典型用法是在转换后检索原始数据
使用PCA组件转换数据,在散点图中投影转换后的数据,在这里我们只能看到PCA 转换后的数据,而看不到原始特征。PCA通过将相关要素组合到新要素中,将较高维度的数据投影到较低维度。
相互关联的功能在视觉上模糊了群集,无助于训练模型并增加了复杂性。最佳拟合线称为PC1(主要组件1)。PC2是垂直于PC1(垂直相交)的最佳拟合线。
示例流程