27、物流回归分析:从基础到多分类问题的全面解析

物流回归分析:从基础到多分类问题的全面解析

一、航班准时情况预测

在分析航班是否准点时,如果目标是预测航班是否会延误,可能需要使用不包含天气因素的模型;而如果是为了分析延误航班和准点航班的特征差异,则可以将天气因素纳入模型,以便在控制天气条件的情况下评估其他因素的影响。基于2004年1月的数据构建的模型显示,从华盛顿特区到纽约的航班,在周二至周六中午左右,乘坐达美航空、科默尔航空、联合航空或美国航空,准点的概率最高,并且良好的天气条件显然更有利。

二、线性回归用于分类结果的问题

2.1 线性概率模型的异常情况

虽然技术上可以将多元线性回归模型应用于二分类结果问题,将结果变量Y视为连续变量,即线性概率模型,但会出现以下异常:
1. 预测值非0或1 :使用该模型预测每个记录的Y值(或进行分类)时,得到的预测值不一定是0或1。
2. 违反正态分布假设 :查看残差的直方图或概率图会发现,结果变量(或残差)服从正态分布的假设被违反。因为Y只能取0和1两个值,所以它不可能服从正态分布,更适合的分布是二项分布,其中p = P(Y = 1)。
3. 方差非恒定 :Y的方差在所有类别中恒定的假设被违反。由于Y服从二项分布,其方差为np(1 - p),这意味着在采用概率p接近0.5的类别中,方差会比接近0或1的类别更高。

2.2 示例分析

以通用银行的个人贷款数据为例,对个人贷款(PL,接受贷款为1,未接受为0)与三个预测变量(收入、家庭人数和定期存款账户)进行多元线性回归,估计模型为:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值