学习实践平台:头歌实践教学平台
知识发现与数据挖掘(KDD‘95 in Kanada):knowledge discovery and data mining
“数据爆炸但知识贫乏”
商业数据到商业智能,用数据预测
啤酒与尿布的故事
多学科交叉产物:统计学、数据库、可视化、机器学习、人工智能、高性能计算
数据--信息--知识 三个词的递进关系
异构:这个词语解释比较多,大致意思是不同形式的组成,如操作系统的异构:windows/ios/unix/linux;存储位置的异构:北京、上海、广州..
聚类:非监督式机器学习:K均值、层次聚类、密度聚类
分类:监督式机器学习:决策树分类、贝叶斯分类、最近邻分类、支持向量分类、罗吉斯特分类、神经网络分类...
离散标签预测:标签分类
连续标签预测:数值预测(房价预测)
关联规则:Apriori、FPGrowth、PCY、多阶段、多哈希、XFP...
本文探讨了数据挖掘与知识发现的重要性,揭示了在数据爆炸的时代如何将商业数据转化为商业智能。介绍了啤酒与尿布的故事作为案例,展示了数据背后的关联性。同时,概述了数据挖掘的主要技术,包括聚类、分类和关联规则,并提及了KDD过程。此外,还讨论了数据、信息和知识之间的递进关系,以及在信息技术领域的异构和数据预测应用。
2554

被折叠的 条评论
为什么被折叠?



