- 博客(6)
- 收藏
- 关注
原创 深入浅出SVM:从理论本质到实战落地
SVM是一种有监督学习模型,主要用于分类任务,也可用于回归。其核心目标是在特征空间中寻找最优超平面(由w和b决定),通过最大化间隔提高泛化能力。SVM通过软间隔处理噪声数据,利用核技巧(如高斯核)解决非线性问题。实验验证了参数C(控制惩罚力度)和gamma(控制核函数影响范围)对模型性能的影响。SVM优点包括高维数据处理能力强、泛化性好,但对大规模数据效率较低且参数敏感。实际应用中需进行数据标准化和参数调优,适用于中小规模、高维特征的分类任务。
2025-12-12 15:26:04
654
原创 朴素贝叶斯算法详解:从理论到西瓜分类实战
朴素贝叶斯是一种基于贝叶斯定理的分类算法,利用先验知识和观测数据来预测样本类别,这里的朴素是指特征条件独立性假设,即假设所有特征之间相互独立 朴素贝叶斯主要应用于垃圾邮件识别 情感分析 商品推荐 质量检测 我们今天的实战就是其中的质量检测———通过西瓜的各种特征来判断其品质#设置空字典存储数据self.prior_prob = {} #先验概率 P(好瓜) P(坏瓜)self.discrete_prob = {} #条件概率。
2025-11-28 18:32:46
863
原创 决策树剪枝实战:从过拟合到泛化提升
剪枝是一种简化决策树结构的技术,通过移除对模型预测贡献不大的分支,来降低模型的复杂度,提升其泛化能力。剪枝的作用一句话概括就是防止过拟合可以把它想象成修剪一棵树:去掉多余的枝叶,让主干更清晰,树木更健康。剪枝是决策树模型中非常重要的优化手段。通过合理剪枝,我们可以:降低模型复杂度提升泛化能力减少过拟合风险增强模型可解释性在实际应用中,后剪枝通常比预剪枝更可靠,因为它是在完整树的基础上进行优化,不容易错过重要分支。如果你也想动手试试,可以在GitHub上找到完整代码和数据集。
2025-11-14 15:24:47
890
原创 决策树概述
决策树(decision tree)是一种树形结构的监督学习算法,主要应用于回归和分类任务。它通过递归地将数据集分割成更小的子集,最终形成一个树形模型,用于预测新数据的输出。这里要知道的是纯度,一般是分类任务中常遇到是衡量一个节点内数据类别一致性的指标。纯度越高,说明节点中样本的类别越单一,分类结果就越确定。决策树分裂时,会寻找那个能让数据子集变得更“纯”的特征。
2025-11-11 20:52:16
1011
原创 KNN算法:理论到实战
K最近邻(K-Nearest Neighbors,简称KNN),一种基于实例的监督学习算法,采用"近朱者赤,近墨者黑"的思路 通过寻找特征空间中距离最近的K个"邻居",根据这些邻居的多数类别来预测新样本的类别,就像我们通过观察一个人的朋友圈来了解这个人一样KNN适合处理数据分布复杂、决策边界不规则的场景,在小到中型数据集上表现优异,且预测结果具有良好的可解释性。无论是判断用户偏好、进行产品推荐,还是医疗诊断,KNN都能通过简单的"邻居投票"机制提供直观而有效的解决方案。
2025-10-23 20:19:22
803
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅