33、云与雾中的数据分析和机器学习技术解析

云与雾中的数据分析和机器学习技术解析

1. 回归分析

回归分析用于预测连续值,与分类预测离散值不同。例如,可根据周边房屋售价预测自家房屋的平均售价。回归分析有多种技术:
- 最小二乘法
- 线性回归
- 逻辑回归
- 随机森林

随机森林是决策树机器学习模型的一个子集。决策树会综合考虑多个变量,输出一个分类结果,并给出基于输入的路径概率。其中一种决策树是1983年Breiman开发的分类与回归树(CART)。

在训练单个决策树时,容易受到噪声影响而产生偏差。而训练多个决策树能减少偏差,每个树会随机选取训练数据或样本。随机森林不仅随机选择样本集,还会选择部分特征进行训练。多数树的预测是准确的,且不同树的错误可能出现在不同位置。通过多数决策原则,当多个树的结果一致,而单个树为异常值时,会遵循多数结果,从而形成低方差的模型。

随机森林示例

假设有一个包含四棵树的随机森林,每棵树基于不同子集的数据和随机变量进行训练。结果三棵树输出为9,第四棵树输出不同结果,但最终遵循多数决策,结果为9。

2. 贝叶斯模型

贝叶斯模型基于1812年的贝叶斯定理,该定理根据系统的先验知识描述事件发生的概率。例如,根据设备温度预测机器故障的概率。

贝叶斯定理表达式为:
[P(A|B)=\frac{P(B|A)P(A)}{P(B)}]
其中,A和B是感兴趣的事件,(P(A|B))表示在事件B发生的情况下事件A发生的概率,它们相互独立且互斥。

贝叶斯定理应用示例

假设有两台机器生产相同的零件,机器A在温度超

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值