
R语言caret包翻译
文章平均质量分 85
littlely_ll
Strive for the best, and prepare for the worst.
展开
-
2. 可视化(The caret package)
2. 可视化featurPlot是对lattice包作图的一个包装。例如:下列图表展示了用featurePlot函数画出的连续变量结果的图形。 对于分类的数据集可用iris数据来分析。 str(iris)## 'data.frame': 150 obs. of 5 variables:## $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.翻译 2017-02-28 14:58:47 · 3433 阅读 · 0 评论 -
1. 简介(The caret package )
译者话:博主正在学习caret包,觉得这个包对于学机器学习的人来说是必不可少的,它具有统一的模式或流程对模型进行处理、训练。caret包参数众多,而且有的函数还依赖于其他的包,这对于学习有一定的困难,不过有一篇技术文档专门介绍了caret包的使用,包括预处理、可视化、模型训练和调参等,但是直到现在我也没见有中文版介绍caret包的。今日突发感想,想把The caret package的文档翻译出来,翻译 2017-02-28 13:26:16 · 6471 阅读 · 0 评论 -
3. 预处理(The caret package)
3. 预处理创建虚拟变量零方差和近似零方差特征变量识别相关的特征变量线性相关性preProcess函数中心化和标准化插补特征变量变换整合在一起类别距离计算caret包含很多函数来对特征变量进行预处理,它假设所有的数据为数值型数据(例如:因子变量通过model.matrix,dummyVars或其他方法转化为虚拟变量)。3.1 创建虚拟变量‘dummyVars’函数可以由一个或多翻译 2017-03-02 14:39:32 · 4134 阅读 · 0 评论 -
4. 数据分割(The caret package)
4. 数据分割内容: * 基于输出结果的简单分割 * 基于特征变量的分割 * 时间序列的数据分割4.1 基于输出结果的简单分割createDataPartition函数用于创建平衡数据的分割。如果函数中的参数y是一个因子向量,则对每一类随机抽样,并且保持数据整体类别的分类。例如:对iris数据按照80/20%的比例分割:library(caret)set.seed(3456)trai翻译 2017-03-05 14:41:11 · 3387 阅读 · 0 评论 -
7. train的模型标签
7. train的模型标签下面是基本的模型类型或相关特征的列表。整个列表的内容是有争议的。例如,随机森林理论上使用特征选择,支持支持向量机可能不能有效地使用L2正则化等。 内容: Accepts Case Weights Bagging Bayesian Model Binary Predictors Only Boosting Categorical Predictors Only翻译 2017-03-27 17:03:58 · 2208 阅读 · 0 评论 -
5. 模型训练和调参(The caret package)
5. 模型训练和调参内容: Model Training and Parameter Tuning An Example Basic Parameter Tuning Notes on Reproducibility Customizing the Tuning Process Pre-Processing Options Alternate Tuning Grid翻译 2017-03-22 16:56:08 · 18228 阅读 · 1 评论 -
6. 可用模型(The caret package )
6. 可用模型下列模型在trrain函数中可以使用,代码可以使用getModelInfo获得,或去github repository共233个。翻译 2017-03-23 13:39:00 · 2368 阅读 · 1 评论 -
8. 随机超参搜索(The caret package)
1. 简介(The caret package ) 2. 可视化(The caret package) 3. 预处理(The caret package) 4. 数据分割(The caret package) 5. 模型训练和调参(The caret package) 6. 可用模型(The caret package ) 7. train的模型标签8. 随机超参搜索在train中优翻译 2017-04-09 11:10:00 · 4690 阅读 · 0 评论 -
9. 类别不平衡的二次抽样(The caret package)
1. 简介(The caret package ) 2. 可视化(The caret package) 3. 预处理(The caret package) 4. 数据分割(The caret package) 5. 模型训练和调参(The caret package) 6. 可用模型(The caret package ) 7. train的模型标签 8. 随机超参搜索(The原创 2017-04-10 14:56:25 · 3731 阅读 · 0 评论