应用域
给定数据集和模板,将数据集进行转换。
输入
• 数据:输入数据集
• 模板数据:用于转换数据集的模板
输出
• 转换后的数据:经过转换的数据集
Apply Domain 将新数据映射到转换后的空间中。例如,如果我们使用 PCA 对数据进行转换,并希望在新数据上观察相同的空间,则可以通过 Apply Domain 将新数据映射到基于原始数据生成的 PCA 空间中。
该组件接收一个数据集和一个用于转换的模板数据集。
补充说明
域转换通过使用模板数据中的信息实现。例如,对于 PCA 而言,仅保留主成分是不够的。转换还需要以下信息:
- 每列的均值(数据居中处理)
- 方差(如果数据已标准化)
- 数据的预处理方式(连续化、缺失值填充等)。
示例
本示例使用 File 组件中的鸢尾花数据集(iris)。
- 通过 Select Rows 组件设置条件 <