modelr 项目教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00529/article/details/142545821

modelr 项目教程

modelr Helper functions for modelling 项目地址: https://gitcode.com/gh_mirrors/mo/modelr

1. 项目介绍

modelr 是一个 R 包，旨在帮助用户在数据处理和可视化管道中无缝集成建模功能。它最初设计用于支持《R for Data Science》第一版的教学，主要用于教授建模的基础知识。然而，目前推荐使用 tidymodels 作为更全面的建模框架。

modelr 提供了多种功能，包括数据分割、采样、模型质量评估以及与模型的交互等。这些功能使得用户可以轻松地将建模步骤集成到数据分析的管道中。

2. 项目快速启动

安装

你可以通过以下两种方式安装 modelr：

安装整个 tidyverse 包：
```
install.packages("tidyverse")
```
单独安装 modelr：
```
install.packages("modelr")
```

快速入门

加载 modelr 包并进行简单的数据分割和模型评估：

# 加载 modelr 包
library(modelr)

# 创建一个数据分割
ex <- resample_partition(mtcars, c(test = 0.3, train = 0.7))

# 查看分割后的数据维度
lapply(ex, dim)

# 创建一个线性模型
mod <- lm(mpg ~ wt, data = mtcars)

# 计算模型的 RMSE
rmse(mod, mtcars)

3. 应用案例和最佳实践

数据分割与采样

modelr 提供了多种数据分割和采样方法，例如 bootstrap 和 k-fold 交叉验证：

# 使用 bootstrap 方法进行采样
boot <- bootstrap(mtcars, 100)

# 使用 k-fold 交叉验证
cv1 <- crossv_kfold(mtcars, 5)

模型质量评估

modelr 包含多种常用的模型质量评估指标，如 RMSE、R 平方、MAE 等：

# 计算模型的 RMSE
rmse(mod, mtcars)

# 计算模型的 R 平方
rsquare(mod, mtcars)

# 计算模型的 MAE
mae(mod, mtcars)

与模型的交互

modelr 允许用户将预测值和残差添加到现有数据框中：

# 添加预测值
df <- tibble::tibble(
  x = sort(runif(100)),
  y = 5 * x + 0.5 * x^2 + 3 + rnorm(length(x))
)
mod <- lm(y ~ x, data = df)
df %>% add_predictions(mod)

# 添加残差
df %>% add_residuals(mod)