BIOS14: Multiple Regression（多元回归） using R

最新推荐文章于 2024-02-27 21:51:00 发布

原创

最新推荐文章于 2024-02-27 21:51:00 发布 · 1.6k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#R #生信 #统计

这篇笔记介绍了使用R进行多元回归分析的原理和步骤，包括多元回归模型的建立、拟合优度评估、显著性检验、多重共线性问题及变量选择。此外，还涉及了偏相关分析、模型选择、非线性曲线拟合等内容，适用于统计和生物信息学领域的研究。

NOTES

1 Multiple reegression model

1.1 multiple regression equation

$y=\beta_0+\beta_1x_1+\beta_2x_2+\beta_3x_3+\beta_4x_4+...+\beta_kx_k+\varepsilon$
Assumption:
A1: $E(\varepsilon)=0$
A2: The variance of $\varepsilon$ is constant, $var(\varepsilon)=\sigma^2$
A3: The $\varepsilon$ 's are independent.
A4: The values of xiare not random and are not exact linear functions of the other explanatory variables
A5: The $\varepsilon$ 's are normally distributed

1.2 estimated multiple regression equation

$\hat y=\hat \beta_0+\hat \beta_1x_1+\hat \beta_2x_2+\hat \beta_3x_3+\hat \beta_4x_4+...+\hat \beta_kx_k$

1.3 method of least squares

$Q=\sum(y_i-\hat y_i)^2=\sum(y_i-\hat \beta_0-\hat \beta_1x_1-...-\hat \beta_kx_k)^2$
minimize:
$\begin{cases} \frac{\partial Q}{\partial \beta_0}|_{\beta_0=\hat\beta_0}=0\\ \frac{\partial Q}{\partial \beta_i}|_{\beta_i=\hat\beta_i}=0, i=1,2,...,k \end{cases}$