去重 移除重复的数据实例。 输入 • 数据:数据表 输出 • 数据:去重后的数据表 该组件用于移除重复的数据实例。用户可选择一组观测变量,使得两个实例即使在其他忽略变量上存在差异,仍会被视为重复。 选择用于比较数据实例的变量:指定哪些变量参与重复性判断。 保留策略:选择保留哪个重复实例。可选策略包括: 保留第一个实例 保留最后一个实例 保留中间实例 随机保留一个实例 不保留任何实例(即完全删除所有重复项) 示例\text{示例}