数据挖掘 模型的衡量标准与建模

本文探讨了模型评估的三大核心标准:生成优质模型的准确性、稳定性和推广性;使用便利性,包括模型的适用性、预测能力及算法切换的灵活性;特征选择的重要性。同时,文章详细介绍了回归、分类和聚类问题的多种算法,如神经网络、逻辑回归、SVM等,为读者提供了全面的模型分类指南。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一般来说,建模是循环做的。

一、模型的衡量标准

1、generating a good model

准确性Accurate
稳定性stable

对同一个样本的预测值是唯一的,稳定的

推广性general

建模使用的数据决定了模型的推广性。

2、Ease of Use 是否好用

generate a fit
measure accuracy

分类:混淆矩阵,ROC、AUC;
回归:均方差;

make predictions

预测

switch algorithm

神经网络一组模型,可以自己设计出一套模型

share results

模型的可解释性

3、Feature selection

变量的筛选,过滤无关变量,保证模型的效果

uncorelated predictor:
corelated predictor:

二、模型分类:

1、回归问题

得到一个数字(x,y)

多元线性回归
多元非线性回归
广义线性回归模型

(eg 逻辑回归,不满足线性回归条件,但是很解决。y值不连续)

神经网络***
曲线拟合

2、分类问题

得到一个类别 (x,y)

神经网络
逻辑回归

(逻辑回归得到一个概率值,可以用作分类。判断阈值可以根据业务条件进行设置)

判别分析
朴素贝叶斯分类
SVM
决策树
组合算法

3、聚类问题

得到一推样本 (x) 将样本聚成几堆,不清楚什么是y

K均值聚类
系统聚类
神经网络
模糊C均值聚类
高斯混合算法
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值