- 博客(4)
- 收藏
- 关注
原创 混淆矩阵和分类常用指标(AUC,AUPR,Accuracy,Precision,Recall和F1-score)的计算及其详解
在计算各个分类指标前,博主准备了两个预训练二分类模型,并在测试集上测试它们,获得对应的预测分数和预测标签,其。)[1] 是一个用于描述分类模型性能的工具。它用于总结分类算法在测试数据集上的表现情况。:正类一般是研究中所关注的一类样本。对指标的计算我们借助机器学习库。
2024-07-16 11:57:51
1013
原创 Python利用Seaborn绘制UMAP散点图
UMAPUniformManifoldAProjection)是一种用于降维的非线性技术,主要用于高维数据的可视化和探索 [1]。它可以将高维数据嵌入到低维空间(通常是二维或三维),以便我们可以更容易地观察数据的结构和模式。UMAP在处理大规模数据时表现良好,特别是在保持局部和全局结构方面有较好的平衡。它广泛应用于各种数据科学和机器学习任务,例如聚类、分类、和降维。可视化高维数据分布时,可借助UMAP先将高维数据投影到二维空间,再利用Seaborn。
2024-06-02 13:22:25
1115
原创 Python利用Seaborn绘制ROC和PR曲线以及AUC与AUPR的计算
ROC曲线 [1], [2](ReceiverOperatingCharacteristic Curve,接收者操作特征曲线)是一种用于评估二分类模型性能的重要工具。ROC曲线通过不同阈值下的真阳性率(True Positive Rate, TPR)和假阳性率(False Positive Rate, FPR)的变化情况,直观地展示模型的分类能力。具体而言,ROC曲线的横轴表示假阳性率,纵轴表示真阳性率。假阳性率是指将负样本错误地分类为正样本的比例,而真阳性率是指将正样本正确地分类为正样本的比例。
2024-06-01 17:23:25
2496
原创 Python使用Matplotlib和Seaborn绘制箱线图
箱线图是一种用作显示一组数据分布情况的统计图。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数,甚至还可以显示出数据的均值。本文用Python的绘图工具包Matplotlib和Seaborn绘制箱线图。
2024-05-30 20:56:15
2545
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人