数据算法基础
1.准确率与置信区间
当评估一个算法的性能时,通常首先考虑准确率(Accuracy),这是一个衡量模型整体预测准确性的指标。
(1)准确率(Accuracy)
表示正确预测的比例,公式:准确率=预测正确的样本数量/预测总的样本数量
准确率并不能总能有效地反映模型的性能,尤其在类别不平衡的数据集中
为更准确评估模型在特定类别上的表现,使用精确率(Precision)和召回率(Recall)
- 混淆矩阵——是一个特定于二分类问题的表格,用于可视化模型性能
预测是类别A | 预测是类别B | |
实际是类别A |
TP-True Positive | FN-False Negative |
实际是类别B |