数据采样器
从输入数据集中选择部分数据实例的子集。
输入
• 数据:输入数据集
输出
• 数据样本:采样的数据实例
• 剩余数据:未包含在样本中的其他数据
数据采样器部件支持多种数据采样方法。它会输出一个采样数据集和一个互补数据集(包含输入数据集中未被采样的实例)。在提供输入数据集并点击“采样数据”按钮后,输出将被处理。
- 输入和输出数据集的信息。
- 支持的采样方法:
• 固定比例:按比例选择数据(例如选取70%的完整数据)。
• 固定样本量:选择指定数量的数据实例,支持“有放回抽样”(从整个数据集重复采样,可能生成超过原数据集数量的样本)。
• 交叉验证:将数据划分为指定数量的互补子集。用户选择的子集作为“剩余数据”,其余所有子集合并为