18、数值数据预测——回归方法

数值数据预测——回归方法

在之前的基础上,我们开始将回归知识应用到更具挑战性的学习任务中,以预测医疗费用为例,详细介绍线性回归的应用。

预测医疗费用的背景

健康保险公司要盈利,需使年度保费收入高于为受益人支付的医疗费用。因此,保险公司投入大量时间和金钱开发能准确预测参保人群医疗费用的模型。医疗费用难以估算,因为高成本病症罕见且看似随机,但某些病症在特定人群中更普遍,如吸烟者患肺癌概率更高,肥胖者患心脏病概率更大。分析目标是用患者数据估算特定人群的平均医疗费用,这些估算可用于创建精算表,根据预期治疗成本调整年度保费价格。

步骤 1:收集数据

我们使用包含美国患者假设医疗费用的模拟数据集,该数据基于美国人口普查局的人口统计数据创建,大致反映现实情况。若要交互式操作,可从相关网站下载 insurance.csv 文件并保存到 R 工作文件夹。

insurance.csv 文件包含 1338 个参保受益人示例,包含患者特征和年度医疗总费用,具体特征如下:
- age :主要受益人的年龄(不包括 64 岁以上人群,他们通常由政府承保)。
- sex :投保人的性别,分为男性和女性。
- bmi :身体质量指数(BMI),反映体重相对于身高的情况,计算公式为体重(千克)除以身高(米)的平方,理想范围是 18.5 至 24.9。
- children :保险计划覆盖的子女/受抚养人数量。
-

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值