10、线性模型、聚类模型的原理与应用

线性模型、聚类模型的原理与应用

在机器学习领域,线性模型中的逻辑回归以及聚类模型都是非常重要的工具。逻辑回归常用于分类问题,而聚类模型则用于将数据点划分为不同的组。下面将详细介绍逻辑回归中的灵敏度、ROC 曲线等概念,以及聚类模型中的 k-means 算法及其相关优化和评估方法。

1. 逻辑回归中的灵敏度和相关指标

1.1 灵敏度的定义

灵敏度(Sensitivity)是混淆矩阵单元格的一个数学函数,它表示患有某种疾病(如糖尿病)且被正确标记为患病的人数占实际患病人数的比例。从数学角度来看,它是正确标记为患病的患者数量(TP)与实际患病人数(TP + FN)的比值。灵敏度也被称为真阳性率(TPR)。

1.2 可视化视角

可以通过直方图来可视化正类(患有糖尿病)和负类(未患有糖尿病)。每个类大致呈正态分布,使用 SciPy 可以找到最佳拟合的正态分布。在逻辑回归中,默认阈值设置为 0.5,该阈值会导致出现假阴性(FN)和假阳性(FP)的情况。

1.3 计算 TPR

在 scikit-learn 中,可以使用 roc_curve 函数计算灵敏度或 TPR。以下是示例代码:

from sklearn.metrics import roc_curve
fpr, tpr, ths = roc_curve(y_test, y_pred_proba[:,1])

这里, roc_curve 函数返回一个包含三个数组的元组:TPR

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值