机器学习与企业数据科学深度剖析
1. R Shiny应用运行与功能
1.1 文件存储要求
在创建R Shiny应用时,CSS、字体和其他相关文件应存储在创建应用目录下名为“www”的文件夹中。
1.2 运行应用
若一切顺利,可通过点击页面顶部的“Run App”选项来运行应用。点击“Run”按钮后,用户会看到一个弹出窗口,需确保浏览器已启用弹出窗口功能。
1.3 应用控件功能
该应用有多个控件,具体如下:
- Search LHS/RHS :可在规则的左侧或右侧输入想要过滤的文本。
- Support :表示规则在数据集中的普遍程度。
- Confidence :指规则中精确匹配的比例。
- Lift :用于定义规则的重要性,数值大于1被认为具有显著性。
此应用可用于其他规则文件,前提是这些文件的处理方式与之前R脚本部分所述相似。
1.4 机器学习要点
机器学习从业者普遍认为,创建模型容易,但创建一个好的模型却颇具难度。更重要的是,知道如何识别一个好的模型,这是区分机器学习项目成功与否的关键。在学习过程中,我们了解了机器学习的一些深层次理论概念,如偏差、方差、正则化等,并通过示例进行了说明。同时,借助R代码,我们还学习了一些常见的机器学习算法,如随机森林、支持向量机等。最后,我们完成了一个关于如何针对CMS OpenPayments数据创建关联规则挖掘的详尽