HCIE-BigData学习笔记-数据挖掘预测建模概念

本文深入探讨了预测问题中的两大核心类型——分类与回归。分类旨在预测离散的类别值,构建模型或分类器对数据进行分类;回归则侧重于预测连续数值,构造预测器以分析有序值。文章详细讲解了分类的学习阶段与分类阶段,以及回归分析在数值预测中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分类回归是预测问题的两种主要类型,分类的输出是离散的类别值, 而回归的输出是连续数值。

分类构造一个模型或分类器(Classifer)来预测类标号
数据分类是一个两阶段过程:

  • 学习阶段:建立描述预先定义的数据类或概念集的分类器。
    分类算法通过分析或从训练集“学习”来构造分类器。
    若训练集中每个训练元组的均有类标号,这一阶段也称为监督学习
    若训练集中每个训练元组都没有类标号,称为无监督学习
    若训练集中的训练元组既有包含类标号也有没有类标号的,称为半监督学习
  • 分类阶段:使用模型进行分类。
    首先利用检验集评估分类的预测准确率,如果认为分类器的准确率是可以接受的,那么 就可以用它对类标号未知的数据元组进行分类。

回归所构造的模型预测一个连续值函数或有序值,而不是类标号。这种模型是预测器(Predictor)。回归分析(Regression Analysis)是数值预测最常用的统计学方法,因此这两个词常常作为同义词使用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值