- 博客(7)
- 收藏
- 关注
原创 机器学习算法-决策树
决策树有很多算法,它们的区别是所选择的划分标准不一样,ID3选择的是信息增益,C4.5选择的是信息增益比,当CART是分类树时,采用GINI值作为节点分裂的依据;具体来说,该算法首先计算每个特征的信息熵,然后计算每个特征对应的信息增益,最后选取信息增益最大的特征作为分裂点。在C4.5算法中,我们首先需要计算每个特征的信息增益比,然后选取信息增益比最大的特征作为分裂点。决策树的缺点:决策树容易过拟合,对于不平衡数据集容易出现错误,处理连续值类型的特征时需要离散化,当分类过多时,决策树容易失效。
2023-10-08 12:05:19
95
1
原创 机器学习无监督算法
1)根据用户指定的簇数量K,选择随机的K个样本作为初始聚类中心。2)通过计算每个样本与聚类中心的距离,将样本分配给最近的簇。3)根据簇内样本的均值更新聚类中心,重复以上步骤直到聚类中心不再变化或达到最大迭代次数。
2023-09-13 17:48:11
191
1
原创 机器学习有监督算法
监督学习主要包括和两种类型。分类是一种监督学习的任务,它的目标是将输入数据分到不同的类别中。常见的分类算法包括决策树、朴素贝叶斯、支持向量机、逻辑回归等。回归是一种监督学习的任务,它的目标是预测一个连续的数值输出。常见的回归算法包括线性回归、多项式回归、岭回归、Lasso回归等。
2023-09-13 16:10:11
1034
1
原创 K最邻近算法(KNN)
Knn全称是K-Nearest Neighbor,从名称中可以看出这个算法与最邻近有关,既能用于回归问题,也能用于分类问题。KNN根据数据点之间的距离来做分类(回归)。
2023-09-03 14:57:22
163
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人