- 博客(9)
- 收藏
- 关注
原创 机器学习——创建决策树
决策树(decision tree)是一种基本的分类与回归方法。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点有两种类型:内部结点和叶结点。内部结点表示一个特征或属性,叶结点表示一个类。
2022-11-14 16:55:13
2650
2
原创 机器学习——K-近邻算法
工作机制:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个“邻居”的信息来进行预测。通常,在分类任务中可使用“投票法”,即选择这k个样本中出现最多的类别标记作为预测结果;在回归任务中可使用“平均法”,即将这k个样本的实值输出标记的平均值作为预测结果;还可基于距离远近进行加权平均或加权投票,距离越近的样本权重越大。
2022-10-26 23:00:00
1304
1
原创 PR曲线以及ROC曲线的简单理解
首先,了解一下混淆矩阵,如下表:其中TP+FP+TN+FN = 样例总数查准率P:P=TP/(TP+FP)查全率R:R=TP/(TP+FN)TP:把正例正确的分类为正例FN:把正例错误的分类为反例TN:把反例错误的分类为正例FP:把反例正确的分类为反例真正率TPR:预测为正例且实际为正例的样本占所有正例样本(真实结果为正例样本)的比例假正率FPR:预测为正例但实际为负例的样本占所有负例样本(真是结果为负例样本)的比例举个例子此时的混淆矩阵为此时查准率P和查全率R为。
2022-10-20 00:26:07
2216
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人