学习实践平台:头歌实践教学平台
知识发现与数据挖掘(KDD‘95 in Kanada):knowledge discovery and data mining
“数据爆炸但知识贫乏”
商业数据到商业智能,用数据预测
啤酒与尿布的故事
多学科交叉产物:统计学、数据库、可视化、机器学习、人工智能、高性能计算
数据--信息--知识 三个词的递进关系
异构:这个词语解释比较多,大致意思是不同形式的组成,如操作系统的异构:windows/ios/unix/linux;存储位置的异构:北京、上海、广州..
聚类:非监督式机器学习:K均值、层次聚类、密度聚类
分类:监督式机器学习:决策树分类、贝叶斯分类、最近邻分类、支持向量分类、罗吉斯特分类、神经网络分类...
离散标签预测:标签分类
连续标签预测:数值预测(房价预测)
关联规则:Apriori、FPGrowth、PCY、多阶段、多哈希、XFP...