数据准备
缺失值处理
直接删除
不处理
填充
平均值填充 Mean/Model Completer
热卡填充 Hot Deck Imputation
K邻近 KNN
使用所有可能的值填充 Assigning All Possible values of the Attribute
组合完整化方法 Combinatorial Completer
线性回归
多重填充
期望值最大化方法(Expectation maximization,EM)
多重填补(Multiple Imputation,MI)
C4.5方法
粗糙集方法
关联规则
神经网络
贝叶斯网络
ETL降维
主成份分析 PCA
线性判别分析 LDA
等距映射 LPP
局部线性嵌入 Isomap
特征映射 LLE
局部保留投影 Laplacian
局部切空间排列 LTSA
最大方差展开 MVU
奇异值分解 SVD
数据挖掘过程
关联规则
Apriori
Eclat
相关性分析
皮尔森相关参数
聚类
基于中心点的聚类算法
K-means
基于层次的聚类算法基于密度的聚类算法
DBScan
基于网格的聚类算法
基于模型的聚类算法
谱聚类时间序列分析
线性回归
二次滑动平均
一次平滑
二次指数平滑
三次指数平滑
ARIMA模型
ARCH和GARCH模型
干扰和ARIMAX模型
多元协整和误差修正模型
门限自回归模型
回归
线性回归
逻辑回归
分类
决策树
Classification and Regression Tree (CART)
Iterative Dichotomiser 3 (ID3)
C4.5
Chi-squared Automatic Interaction Detection (CHAID)
Decision Stump
Random Forest
Multivariate Adaptive Regression Splines (MARS)
Gradient Boosting Machines (GBM)
逻辑回归
核方法
Support Vector Machines (支持向量机SVM)
Radial Basis Function (RBF)
Linear Discriminate Analysis (LDA)
神经网络
Perceptron
Back-Propagation
Hopfield Network
Self-Organizing Map (SOM)
Learning Vector Quantization (LVQ)
深度学习
Restricted Boltzmann Machine (RBM)
Deep Belief Networks (DBN)
Convolutional Network
Stacked Auto-encoders
异常检测
推荐
基于内容的推荐
协同过滤推荐
基于关联规则推荐
基于效用推荐
基于知识推荐
组合推荐(上述)
加权
变换
混合
特征组合
层叠
特征扩充
元级别
可视化
这篇博客涵盖了数据挖掘的主要步骤和模型,包括数据准备时的缺失值处理(如平均值填充、KNN填充)、线性回归、降维技术(如PCA、LDA)、聚类算法(如K-means、DBScan)、分类方法(如逻辑回归、SVM、神经网络)以及深度学习(如RBM、DBN、卷积网络)。此外,还讨论了异常检测和推荐系统的基本原理。
4592

被折叠的 条评论
为什么被折叠?



