数据挖掘
文章平均质量分 85
耍编程
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
子集筛选(Select by Data Index)组件研究
本文介绍了Orange软件中的Select by Data Index组件(子集筛选组件)的功能与应用。该组件通过行标识匹配,可准确筛选同源但处理路径不同的数据子集,适用于特征工程数据对齐、多步骤分析数据衔接等场景。文中以Iris数据集为例,展示了从主成分分析结果中筛选样本并回溯原始特征的全过程,包括150个样本通过PCA降维后,在散点图中筛选3个样本并成功匹配原始数据的完整操作流程。实例文件已开源,为特征对齐等数据挖掘任务提供了实用解决方案。原创 2025-06-15 16:09:24 · 960 阅读 · 0 评论 -
扩展数据(Concatenate)组件研究
本文聚焦 Orange软件的 Concatenate 组件,介绍其在数据挖掘中用于纵向整合数据、增强实例数量的功能,适用于分段、分组、多端等多源同构数据整合场景。该组件有主数据和辅数据两种模式,辅数据模式下可选择变量并集或交集,主数据模式下能按主数据列名或位置匹配变量,文中通过股价数据实例展示了不同配置下的输出效果。原创 2025-06-02 15:40:14 · 948 阅读 · 0 评论 -
合并数据(Merge Data)组件研究
在数据挖掘领域,数据合并是预处理阶段的核心操作,通过特征补全、样本连接、特征拼接三种模式实现多源信息融合。特征补全以主数据为基准补充辅数据特征并保留主数据全样本,未匹配特征标记为缺失,从而丰富主数据的信息维度;样本连接通过交叉验证剔除多源数据中不匹配的样本,仅保留满足共同约束的高质量样本,确保融合数据的一致性;特征拼接则保留多源数据的所有样本,通过共享特征标识合并,未匹配特征标记为缺失以区分跨场景信息差异。本文详细介绍了Orange软件的Merge Data组件的数据合并功能。原创 2025-05-26 10:47:47 · 1187 阅读 · 0 评论 -
转置(Transpose)组件研究
详解开源数据挖掘软件Orange的Transpose组件功能。原创 2025-05-19 08:02:23 · 702 阅读 · 0 评论 -
Select Rows组件研究
详解Orange软件中Select Rows组件的功能。原创 2025-05-06 17:07:19 · 973 阅读 · 0 评论 -
Select Columns组件研究
详细介绍Orange数据挖掘软件的Select Columns组件。原创 2025-04-14 09:05:06 · 918 阅读 · 0 评论 -
Data Sampler组件研究
详细介绍Orange的Data Sampler数据抽样组件功能原创 2025-04-10 09:48:05 · 1118 阅读 · 0 评论 -
数据处理知识图谱
原创 2018-03-27 11:23:40 · 878 阅读 · 0 评论
分享