# 转换成95%的置信区间

# 设置管道参数
            model.set_params(StandardScaler__with_mean=s) # 标准化的时候是否要中心化
            model.set_params(Poly__degree=d) # 多项式拓展的阶数
            model.set_params(LinearRegression__fit_intercept=r) # 回归的时候是否考虑截距 
            # cross-validation 训练
            cv_results = cross_validate(model, x_train, y_train, cv=5,return_train_score=False)
            # 输出cross_validation结果 
            print(cv_results['test_score'])
            # 转换成95%的置信区间
            scores = cv_results['test_score']
            print("Accuracy: %0.2f (+/- %0.2f)" % (scores.mean(), scores.std() * 2))
            ical +=1
 ———————————————— 

 

 

 

一文快速搞懂对95%置信区间的理解

 

综合知乎上各大神的解答和网络资料得到本文对95%置信区间的理解


先给出结论

  • 最常出现的对置信区间的错误理解:

在95%置信区间内,有95%的概率包括真实参数  (错误!!)

在95%置信区下构建的模型,意味着模型参数对于试图近似的函数有95%的概率是真实值的估计值(错误!!)

  • 正确解释应为:

95%置信区间,意味着如果你用同样的步骤,去选样本,计算置信区间,那么100次这样的独立过程,有95%的概率你计算出来的区间会包含真实参数值,即大概会有95个置信区间会包含真值。

而对于某一次计算得到的某一个置信区间,其包含真值的概率,我们无法讨论。

 

我们平常使用的频率学派(frequentist)95% 置信区间的意思并不是真值在这个区间内的概率是 95%。真值要么在,要么不在。由于在频率学派当中,真值是一个常数,而非随机变量(后者是贝叶斯学派) ,所以我们不对真值做概率描述。对于这个问题来说,理解的关键是我们是对这个构造置信区间的方法做概率描述,而非真值,也非我们算得的这个区间本身。

换言之,我们可以说,如果我们重复取样,每次取样后都用这个方法构造置信区间,有 95% 的置信区间会包含真值 。然而(在频率学派当中)我们无法讨论其中某一个置信区间包含真值的概率。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值