33、云与雾中的数据分析和机器学习:常见模型与算法解析

云与雾中的数据分析和机器学习:常见模型与算法解析

1. 回归分析

回归分析用于预测连续值,与分类预测离散值不同。例如,可根据周边房屋售价预测自家房屋的平均售价。常见的回归分析技术有:
- 最小二乘法
- 线性回归
- 逻辑回归
- 随机森林

随机森林是决策树机器学习模型的一个子集。决策树是一组统计学习算法,它综合考虑多个变量并输出一个分类结果。每个被评估的元素构成一个集合,决策树根据输入生成一组路径概率。1983 年 Breiman 开发的分类与回归树(CART)就是决策树的一种形式。

在训练决策树时,单棵决策树容易受到噪声干扰而产生偏差。通过训练多棵决策树(随机森林)可以减少这种偏差。每棵树会随机选取训练数据或样本。随机森林不仅随机选择样本集,还会选择部分特征进行训练,这看似与使用尽可能多的数据进行训练的直觉相悖,但有其合理性:
- 大多数树是准确的,能对大多数数据提供正确预测。
- 决策树的错误可能出现在不同树的不同位置。

这遵循群体思维和多数决策规则。例如,在一个包含四棵树的随机森林中,三棵树输出结果为 9,而第四棵树输出不同结果,最终会以多数结果 9 为准,这样形成的模型比单棵决策树模型的方差更小。

2. 贝叶斯模型

贝叶斯模型基于 1812 年的贝叶斯定理。该定理根据系统的先验知识描述事件发生的概率。例如,根据设备温度预测机器发生故障的概率。

贝叶斯定理表达式为:$P(A|B)=\frac{P(B|A)P(A)}{P(B)}$,其中 A 和 B 是感兴趣的事件,$P(A|B)$ 表示在事件 B 发生的情况下事件 A 发生的概率,

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值