- 博客(10)
- 收藏
- 关注
原创 重生之我在图书馆学习JAVA——Day2(自用)
但是你强行将范围大的数据,赋值给范围小的变量也是可以的,这里就需要用到强制类型转换。下面是强制类型转换的格式目标数据类型 变量名 = (目标数据类型)被转换的数据;下面是强制类型转换的代码演示。
2024-09-22 21:17:45
1014
原创 深度了解PCA
我们可以认为,一个特征下的样本方差大,说明这个特征对样本的区分度大,因为样本之间的差异会更大一些;相反,如果一个特征的方差小,在这个特征下的样本趋于一个点,说明这个特征的区分度不大。PCA 的数学推导可以从最大可分型和最近重构性两方面进行,前者的优化条件为划分后方差最大,后者的优化条件为点到划分平面距离最小,这里我将从最大可分性的角度进行证明。比如一个人的身高体重,一个身高高的人,体重往往也会更大。另外,特征和特征之间也会有或多或少的联系,这体现在一个特征的数值的变化对另一个特征数值的变化的趋势上。
2024-01-01 20:23:50
962
原创 支持向量机(SVM)
支持向量机作为一种强大的分类算法,具有广泛的应用领域和优势。通过最大化支持向量到超平面的距离,SVM能够提高分类的准确性和鲁棒性。在图像分类、文本分类和生物信息学等领域,SVM都显示出了卓越的性能。随着机器学习技术的不断发展,我们可以期待SVM在更多实际问题中的应用。
2023-12-18 23:05:46
1082
1
原创 机器学习——朴素贝叶斯算法
朴素贝叶斯(Naive Bayes)是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法。由于朴素贝叶斯计算联合概率,所以朴素贝叶斯模型属于生成式模型。经典应用案例包括:文本分类、垃圾邮件过滤等。
2023-11-20 15:10:07
173
1
原创 机器学习:决策树
2.离散属性a有V个可能的取值{a1, a2, ..., aV},用a来进行划分,则会产生V个分支结点,其中第v个分支结点包含了D中所有在属性a上取值为av的样本,记为Dv。则可计算出用属性a对样本集D进行划分所获得的“
2023-11-06 20:42:33
225
原创 机器学习:性能度量
衡量模型泛化能力的评价标准(反映了任务需求,在对比不同模型的能力时,使用不同的性能度量往往会导致不同的评判结果。模型的好坏,不仅取决于算法和数据,还决定于任务需求。性能度量主要分为分类任务中的和回归任务中的。ROC全称Receiver Operating Characteristic,即受试者工作特征,坐标图式的分析工具。ROC 曲线的纵轴是"真正例率" (True Positive Rate,简称 TPR),横轴是"假正例率" (False PositiveRate, FPR)。
2023-10-23 20:33:13
234
1
原创 KNN算法(k近邻算法)原理及总结
KNN 算法,或者称 k最邻近算法,是有监督学习中的分类算法。它可以用于分类或回归问题,但它通常用作分类算法。
2023-10-09 21:09:59
110767
8
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人