- 博客(3)
- 收藏
- 关注
原创 聚类算法(K-means)
概论 from sklearn.cluster import Kmeans 实现原理 1.随机选取K个样本作为初始质心。 2.循环,将每个样本分配到离他们最近的质心,形成K个簇 3.对于每个簇,计算被分到该簇的所有样本点的平均值作为新的质心 4.当质心不再发生变化,迭代停止,聚类完成。 计算公式 对于一个簇来讲,所有样本点到质心的距离之和越小,该簇的样本就越相似,簇类差异越小。而距离衡量的方法有三种:欧几里得距离、曼哈顿距离、余弦距离。 ...
2022-03-29 14:21:59
537
原创 混淆矩阵(Confusion Matrix)
混淆矩阵 混淆矩阵(Confision Matrix)是一种N*N表格,用于总结分类模型的预测效果。N表示类别个数,横轴表示实际的标签,纵轴表示模型预测的标签。 Precise(精确率)=TP/(TP+FP) 精确率:指模型正确预测正类的频率。 Recall(召回率)=TP/(TP+FN) 召回率:指模型正确识别实际的正类标签。 F1(调和均值)=2TP/2TP+FP+FN F1:反映算法性能 准确率 错误率 参考 示例代码 from sklearn.metrics import confusio
2022-03-16 11:04:01
3447
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人