- 博客(7)
- 收藏
- 关注
原创 机器学习——PCA
PCA(Principal Component Analysis,主成分分析)是一种常用的数据降维技术,它可以将高维数据转换为低维数据,同时保留数据的关键特征。在机器学习和数据分析中,PCA 可以帮助减少特征的数量,降低计算成本,去除噪声并防止过拟合。
2024-06-18 14:28:36
5287
原创 机器学习——支持向量机
支持向量机(Support Vector Machines, SVM)是一种监督学习模型,用于解决二分类问题,在机器学习领域有着广泛的应用。SVM通过在样本空间中寻找一个划分超平面,将不同类别的样本分开,同时使得两个点集到此平面的距离(即间隔)最大,因此又被称为最大间隔超平面。有效处理高维数据:SVM在高维空间中表现优异,能够处理特征维数大于样本数的情况。它的性能不会因为特征数量多而显著下降。支持非线性分类:通过核函数,SVM可以将原始数据映射到高维空间,从而能够有效地处理非线性分类问题。
2024-06-11 16:13:44
4825
1
原创 机器学习——逻辑回归
sigmoid函数的取值范围为[0,1],通过Sigmoid函数,逻辑回归能够将任意实数值的线性组合输出映射到(0,1)区间内,这个区间正好对应于概率值的范围。这种映射使得模型的输出可以被解释为属于某一类的概率,即输出值越接近1,表示样本属于正类的可能性越高;输出值越接近0,表示样本属于负类的可能性越高。我们可以以0.5为分界在以下为负类,以上为正类易于理解和实现逻辑回归模型基于线性回归,并通过引入Sigmoid函数将线性回归的输出映射到0和1之间,使得结果可以被解释为概率。
2024-05-29 14:08:36
1497
原创 机器学习——朴素贝叶斯
朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理的简单而强大的机器学习分类算法。它是基于概率和统计的方法,通常用于处理分类问题,特别是在文本分类和垃圾邮件过滤等领域表现良好。
2024-05-14 18:31:28
1572
2
原创 knn算法分类电影类别
简单易理解,易于实现。适用于多种类型的数据,包括离散型和连续型数据。对异常值不敏感,不受数据分布的影响。计算复杂度高,对于大规模数据集计算开销大。需要大量的存储空间来保存训练数据。对K值的选择敏感,选择不当可能导致模型性能下降。数据集较小,或者对计算效率要求不高的情况。数据集没有明显的类别边界或决策边界不规则的情况。数据集的属性不是很多,且属性之间的关联性较弱的情况。
2024-04-02 12:29:50
983
2
原创 anaconda安装
1.1、anaconda的安装包打开,然后点击next1.2、然后再次点击I agree1.3、然后再点击next,1.4、然后直接点击install1.5、然后选择你需要要安装的盘,建议不要装在c盘,并且提前新创一个anaconda的文件夹1.6、然后等待他完成后点击next1.7、在继续点击next1.8、最后点击finish,他会弹出网页不用管他直关闭就行了。
2024-03-10 13:17:27
427
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人