一、数据挖掘(Data Mining,DM),又称为数据库中的知识发现(Knowledge Discover in Database,KDD),决策支持过程,主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,分析、归纳、推理,挖掘潜在的模式,帮助决策者调整市场策略,减少风险,做出正确决策。
知识发现的的三个阶段:1、准备数据; 2、数据挖掘; 3、结果表达和解释
最著名的数据挖掘标准流程:CRISP-DM
全称为跨行业数据挖掘标准流程,分为6个阶段:业务理解、数据理解、数据准备、建模、评估、发布
(1) 业务理解:分析需求、初步收集数据和指标
(2)数据理解:理解各个数据字段的含义所记录的业务信息。
(3)数据准备:数据清洗、提出、转换,提取样本,清除噪声,处理缺失数据,数据标准化。
(4)建模:参数调整使模型最优。
(5)

数据挖掘,又称KDD,结合了人工智能、统计学等技术,通过CRISP-DM或SEMMA流程来发现数据潜在模式。CRISP-DM包括业务理解、数据理解、数据准备、建模、评估和发布六个阶段;SEMMA则涉及数据取样、探索、修正、建模和评估。关键步骤包括数据预处理、模型构建和效果评估。在实践中,明确问题、设定评估标准和团队协作至关重要。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



