- 博客(7)
- 收藏
- 关注
原创 支持向量机
数据集:(X1,Y1)(X2,Y2)...(Xn,Yn)Y为样本的类别:当X为正例时,Y=+1;当X为负例时,Y=-1决策方程:(其中是对数据做了变换)
2024-06-11 15:21:43
1646
1
原创 机器学习|逻辑回归
逻辑回归是一个分类的算法,它基于多元线性回归,正因如此,逻辑回归这个分类算法是线性的分类器。逻辑回归中对应一条非常重要的曲线S型曲线,其对应的函数是Sigmoid函数图1 sigmoid曲线逻辑回归就是在多元线性回归基础上把结果缩放到0~1之间。越接近1越是正例越接近0越是负例,根据中间 0.5将数据分为二类。其中就是概率函数:我们知道分类器的本质就是要找到分界,所以当我们把0.5作为分类边界时,我们要找的就是,即时,的解。
2024-05-28 12:48:57
1894
原创 机器学习|贝叶斯算法
正向概率:假设袋子里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大?逆向概率:如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例做出什么样的推测?
2024-05-14 12:47:15
917
1
原创 决策树的构造
递归结束的条件是:程序遍历完所有划分数据集的属性,或者每个分支下的所有实例都具有相同的分类。的所有分支上,如果某个分支下的数据属于同一类型,则当前无序阅读的垃圾邮件已经正确的划分数据分类,无需进一步对数据集进行分割,如果不属于同一类,则要重复划分数据子集,直到所有相同类型的数据均在一个数据子集内。划分数据集,由于特征值可能多于两个,因此可能存在大于两个分支的数据集划分。第一次划分之后,数据将被向下传递到树分支的下一个节点,在这个节点上,我们可以再次划分数据。如果待分类的事务可能划分在多个分类之中,则符合。
2024-04-28 16:33:53
1098
原创 机器学习之分类模型评估指标
在该矩阵中,矩阵中的行代表样例的真实类别,矩阵中的列代表预测器预测的类别(行和列所代表的可以互相交换)。由图1可见,当召回率接近于0时,模型A的精确率为0.9,模型B的精确率是1, 这说明模型B得分前几位的样本全部是真正的正样本,而模型A即使得分最高的几个样本也存在预测错误的情况。这充分说明,只用某个点对应的精确率和召回率是不能全面地衡量模型的性能,只有通过P-R曲线的。图1是P-R曲线样例图,其中实线代表模型A的P-R曲线,虚线代表模型B的P-R曲线。P-R曲线的横轴是召回率,纵轴是精确率。
2024-04-15 21:01:38
1777
1
原创 安装VScode和Anaconda
Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror。2、下载后,打开文件,一直点下一个,最后安装成功。2、找到2023年的一个版本,点击下载。一、安装anaconda。5、手动添加环境变量。二、安装vscode。
2024-03-19 18:26:37
447
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人