Tidymodels: tidy machine learning in R
在处理数据时,有简洁的工具包,tidyverse应运而生,极大地简化数据处理流程,让数据处理变得简洁,清晰。
但是在处理完数据后,需要对数据进行建模分析,预测与拟合,这个过程随着模型的不同而变的多元化,尤其是机器学习应用。加速了模型构建的流程化与简洁化。
Caret的出现,让此项工作变得简洁明了。但是还是有些缺点。
image.png
上图基于Wickham和Grolemund撰写的《 R for Data Science》一书。
本文中的版本详细解释了tidymodels每个程序包涵盖的步骤。在模型构建及预测过程中,tidymodels的流畅与简洁,让你体验纵享丝滑般的感受。
在模型构建过程中,需要涉及的数据预处理及模型参数调整,这些步骤都含括在以下程序包中:
- rsample - 数据分离重采样
- recipes - 数据转换处理
- parnip - 模型构建框架
- yardstick - 模型效果评估</