- 博客(3)
- 收藏
- 关注
原创 分类模型评估(kNN为例)
混淆矩阵是一个表格,用于展示模型预测结果与实际标签之间的分布情况。对于二分类问题,矩阵包含四个基本项:真正例 (True Positives, TP):模型正确预测为正类的样本数。假正例 (False Positives, FP):模型错误预测为正类的样本数。真反例 (True Negatives, TN):模型正确预测为负类的样本数。假反例 (False Negatives, FN):模型错误预测为负类的样本数。对于多分类问题,混淆矩阵扩展为每个类别的两两对比。
2025-04-07 23:00:00
1432
原创 基于K-近邻算法的分类器的实现
我们很容易发现,当计算样本之间的距离时数字差值最大的属性对计算结果的影响最大,也就是说,每年获取的飞行常客里程数对于计算结果的影响将远远大于上表中其他两个特征-玩视频游戏所耗时间占比和每周消费冰淇淋公斤数的影响。在处理这种不同取值范围的特征值时,我们通常采用的方法是将数值归一化,如将取值范围处理为0到1或者-1到1之间。该网站现在需要尽可能向海伦推荐她喜欢的人,需要我们设计一个分类器,根据用户的以上三种特征,识别出是否该向海伦推荐。其中输入数据应包含三个值,输出应为喜欢,一般,不喜欢,三个中的一个。
2025-03-24 23:31:53
928
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人