小庞统计——R语言二分类机器学习预测模型结合SHAP解释3.0网页制作附带教学课程发布!!!(付费获取)本次版本更新附带视频详细讲解,如何使用,从获取数据模型构建包含(自动参数寻优,网格参数寻优,以及偏态数据的手动调参)全程讲解,以及全模型的shap解释(Catboost也可以进行解释);网页制作包含最优模型的网页搭建,制作属于自己模型的网页。全流程视频讲解。
包含2.0版本的基础上继续增加相关内容:
在R语言进行全模型的SHAP解释。在此将多个模型进行的整理,并汇聚成了包含10多种机器学习模型的优化代码,包含Logistic、SVM、GBM、KNN、Adaboost、Xgboost、Neural network(MLP)、RF、LightGBM、Catboost等模型。只用整理好数据,即可实现整篇文章的分析。
根据目前SCI发表的文章,进行了正常流程的代码编写,从开始的数据数据集划分,基础表格,单因素分析,以及单因素、多因素Logistic结果表格制作,均有代码生成。
变量选择包含,Lasso筛选,Brouta筛选,Logistic筛选
数据平衡方法:SMOTE(平衡数据)
参数寻优包括:自动参数寻优,网格参数寻优,以及偏态数据的手动调参,全程讲解;
并且建模后,会给出各个模型的变量重要性排序图。
模型评价包含多模型的ROC曲线、DCA曲线、校准曲线,计算模型的准确度,灵敏性(召回率),特异性,精确度,F1分数计算。绘制各个模型的混淆矩阵。
增加部分同学有外部数据集的适用性,可用外部数据集专用代码版本。
绘图形式增加:
①单条ROC、DCA曲线绘制;
②单一模型训练集和测试集曲线绘制;
③训练集、测试集对比基线表格制作
部分结果展示:
整套视频课程!通过运行代码,即可得到以下结果:
重要部分首发网页搭建
变量筛选(Lasso筛选,Brouta筛选)
SHAP解释(Catboost)
单条ROC曲线绘制
训练集测试集曲线一起绘制
基础性分析表格
各个模型训练集、测试集的ROC曲线、校准曲线、DCA曲线绘制。
变量重要性
混淆矩阵
模型评价参数
整套课程,代码分析包含了SCI的机器学习的正常分析流程,并包含了使用的示例数据,数据准备的指导、相关代码的解释。(全程视频讲解)
整套课程一经售出,全程售后服务,包含代码报错解决,如果需要可以进行简单代码讲解,直到出现结果为止。
整套课程创建以及版权归小庞统计所有!