线性回归入门:从基础到实际应用
1. 线性回归概述
回归分析是一个强大且应用广泛的工具,许多科学研究成果都基于此。研究人员使用回归分析主要有两个目的:
- 估计变量贡献 :用于估计不同可观测输入对可观测输出的贡献程度。例如,估计美国各县的外星访问(可观测输入)对该县ZeroAccess感染率(可观测输出)的贡献。
- 预测输出值 :回归分析的输出是一个公式,给定特定输入,可预测输出值。如根据身高、性别、年龄等变量预测一个人的体重。
2. 示例数据生成与可视化
为了演示上述两个目的,我们创建虚构且简单的数据。
- 生成输入数据 :使用 rnorm() 命令生成200个均值为10,标准差为1的随机数据点。
# for reproducability
set.seed(1)
# generate 200 random numbers around 10
input <- rnorm(200, mean=10)
summary(input)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 7.785 9.386 9.951 10.040 10.610 12.400
- 生成输出数据 :创建输入和输出之间的线性关系,输出数据的均值为输入变量的两倍,并引入随机变化。 </
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



