- 博客(3)
- 问答 (1)
- 收藏
- 关注
原创 样本数据不均衡
样本(类别)样本不平衡(class-imbalance)指的是分类任务中不同类别的训练样例数目差别很大的情况,一般地,样本类别比例(Imbalance Ratio)(多数类vs少数类)明显大于1:1(如4:1)就可以归为样本不均衡的问题。
2024-09-02 10:42:36
796
原创 机器学习概述
Tom Mitchell对机器学习的定义为:计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高。通俗的讲机器学习就是计算机通过算法对数据集进行学习,从而进行预测或决策。
2024-09-02 09:34:36
307
原创 机器学习分类算法
就是找到给定点的梯度 ,然后朝着梯度相反的方向,就能让函数值下降的最快,所以,我们重复利用这个方法,反复求取梯度,最后就能到达局部的最小值。预测点的真实值与预测值相减,再平方(这里为了消除负值),最后进行求和,就得到了整个数据的残差。Sigmoid 函数,也称为 Logistic 函数,是一个常用的激活函数,用于将输入映射到一个取值范围在0和1之间的输出。损失函数能够量化目标的实际值与预测值之间的差距,通常选择非负数作为损失,且数值越小表示损失越小。残差是真实值与预测值的差值,残差越小,拟合效果越好。
2024-09-02 09:32:44
619
空空如也
为什么声明的变量错误
2021-09-25
TA创建的收藏夹 TA关注的收藏夹
TA关注的人