数据挖掘基本模型一览

这篇博客涵盖了数据挖掘的主要步骤和模型,包括数据准备时的缺失值处理(如平均值填充、KNN填充)、线性回归、降维技术(如PCA、LDA)、聚类算法(如K-means、DBScan)、分类方法(如逻辑回归、SVM、神经网络)以及深度学习(如RBM、DBN、卷积网络)。此外,还讨论了异常检测和推荐系统的基本原理。

数据准备

    缺失值处理

          直接删除

          不处理

          填充

                   平均值填充 Mean/Model Completer

                   热卡填充 Hot Deck Imputation

                   K邻近 KNN

                   使用所有可能的值填充 Assigning All Possible values of the Attribute

                   组合完整化方法 Combinatorial Completer

                   线性回归

                   多重填充

                   期望值最大化方法(Expectation maximization,EM)          

                   多重填补(Multiple Imputation,MI)         

                  C4.5方法

                   粗糙集方法

                   关联规则

                   神经网络

                   贝叶斯网络

    ETL

    降维             

         主成份分析 PCA

         线性判别分析 LDA

         等距映射 LPP

         局部线性嵌入 Isomap

         特征映射 LLE

         局部保留投影 Laplacian

         局部切空间排列 LTSA

         最大方差展开 MVU

         奇异值分解 SVD              
数据挖掘过程
    关联规则  

         Apriori

         Eclat 

    相关性分析
         皮尔森相关参数

    聚类

        基于中心点的聚类算法

               K-means

        基于层次的聚类算法

        基于密度的聚类算法 

              DBScan

        基于网格的聚类算法

        基于模型的聚类算法

        谱聚类
    时间序列分析
        线性回归
        二次滑动平均
        一次平滑
        二次指数平滑
        三次指数平滑 
        ARIMA模型
        ARCH和GARCH模型
        干扰和ARIMAX模型
        多元协整和误差修正模型
        门限自回归模型
    回归
        线性回归
        逻辑回归
    分类
        决策树
            Classification and Regression Tree (CART)
    Iterative Dichotomiser 3 (ID3)
            C4.5
            Chi-squared Automatic Interaction Detection (CHAID)
            Decision Stump
            Random Forest
            Multivariate Adaptive Regression Splines (MARS)
            Gradient Boosting Machines (GBM)

        逻辑回归

        核方法

            Support Vector Machines (支持向量机SVM)
            Radial Basis Function (RBF)
            Linear Discriminate Analysis (LDA)

         神经网络

            Perceptron
            Back-Propagation
            Hopfield Network
            Self-Organizing Map (SOM)
            Learning Vector Quantization (LVQ)

         深度学习

            Restricted Boltzmann Machine (RBM)
            Deep Belief Networks (DBN)
            Convolutional Network
            Stacked Auto-encoders  

    异常检测

    推荐

          基于内容的推荐

          协同过滤推荐

          基于关联规则推荐

          基于效用推荐

          基于知识推荐

          组合推荐(上述)

                 加权

                 变换

                 混合

                 特征组合

                 层叠

                 特征扩充

                 元级别

               

可视化

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值