线性模型、聚类模型的原理与应用
在机器学习领域,线性模型中的逻辑回归以及聚类模型都是非常重要的工具。逻辑回归常用于分类问题,而聚类模型则用于将数据点划分为不同的组。下面将详细介绍逻辑回归中的灵敏度、ROC 曲线等概念,以及聚类模型中的 k-means 算法及其相关优化和评估方法。
1. 逻辑回归中的灵敏度和相关指标
1.1 灵敏度的定义
灵敏度(Sensitivity)是混淆矩阵单元格的一个数学函数,它表示患有某种疾病(如糖尿病)且被正确标记为患病的人数占实际患病人数的比例。从数学角度来看,它是正确标记为患病的患者数量(TP)与实际患病人数(TP + FN)的比值。灵敏度也被称为真阳性率(TPR)。
1.2 可视化视角
可以通过直方图来可视化正类(患有糖尿病)和负类(未患有糖尿病)。每个类大致呈正态分布,使用 SciPy 可以找到最佳拟合的正态分布。在逻辑回归中,默认阈值设置为 0.5,该阈值会导致出现假阴性(FN)和假阳性(FP)的情况。
1.3 计算 TPR
在 scikit-learn 中,可以使用 roc_curve 函数计算灵敏度或 TPR。以下是示例代码:
from sklearn.metrics import roc_curve
fpr, tpr, ths = roc_curve(y_test, y_pred_proba[:,1])
这里, roc_curve 函数返回一个包含三个数组的元组:TPR
超级会员免费看
订阅专栏 解锁全文
1792

被折叠的 条评论
为什么被折叠?



