结合逻辑回归分析与自动化网络风险评估工具的研究
结合逻辑回归分析进行糖尿病预测模型构建
在糖尿病预测模型的研究中,将逻辑回归分析与数据挖掘技术相结合是一种有效的方法。研究人员选取了逻辑回归分析选出的一组变量作为数据挖掘技术建模的输入变量,涉及的技术包括使用 J48 和 LMT 算法的决策树(DT)、朴素贝叶斯(Naïve Bayes)和人工神经网络(ANN)。
具体操作流程如下:
1. 模型构建 :扩展之前部分的 R 代码,采用 5 折交叉验证的方式为每种技术构建模型。每种建模技术(使用一组变量)重复构建五次,并计算每个性能评估值的平均值。
2. 参数设置 :J48、LMT 和朴素贝叶斯的参数设置为默认值。而 ANN 的参数进行了实验以达到最佳性能,节点数量在 6 到 10 个之间变化,动量和学习率分别为 0.1、0.2 和 0.3,迭代次数设置为 100。
模型性能通过三个标准进行评估:准确率(Accuracy)、灵敏度(Sensitivity)和特异度(Specificity),计算公式如下:
- 准确率:$Accuracy = \frac{TP + TN}{TP + FP + FN + TN} \times 100$
- 灵敏度:$Sensitivity = \frac{TP}{TP + FN} \times 100$
- 特异度:$Specificity = \frac{TN}{TN + FP} \times 100$
其中,TP 是正确预测为阳性的数量,TN 是正确预测为阴性的数量,FP 是将阴性预测为阳性的数量,FN 是将阳性预
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



