- 博客(5)
- 收藏
- 关注
原创 SVM分类实战:从线性可分到非线性问题的完整解决方案
支持向量机(Support Vector Machine,SVM)是机器学习中一种强大的分类算法,以其在处理小样本、非线性和高维模式识别问题中的优异表现而闻名。本文将通过两个实际数据集,全面展示SVM在线性可分和非线性可分问题上的应用,并深入探讨参数调优对模型性能的影响。线性SVM通过寻找一个最优超平面来分隔不同类别的数据,这个超平面不仅要正确分类数据,还要使两个类别之间的间隔(margin)最大化。数学公式:线性核:特征数量多,样本数量少,或数据近似线性可分高斯核(RBF)
2025-12-11 20:33:06
748
原创 朴素贝叶斯分类:基于西瓜数据集的品质预测
本实验使用朴素贝叶斯算法对西瓜品质进行分类预测。通过构建完整的朴素贝叶斯分类器,结合拉普拉斯修正处理离散特征,使用高斯分布处理连续特征,实现了对西瓜是否为"好瓜"的准确分类。离散特征:色泽、根蒂、敲声、纹理、脐部、触感连续特征:密度、含糖率标签:好瓜(是/否)完整的朴素贝叶斯分类器,支持离散和连续特征拉普拉斯修正处理稀疏数据高斯分布建模连续特征详细的概率计算过程,便于理解和调试测试样本以99.75%的概率被分类为"好瓜",与理论预期一致,验证了算法的正确性。
2025-11-28 19:20:07
344
原创 ID3 与 C4.5 的预剪枝、后剪枝实现与精度对比
本文从原理到实战,完整演示了决策树预剪枝和后剪枝的实现逻辑,并通过 ID3 和 C4.5 算法的对比,验证了剪枝对模型泛化能力的优化效果。预剪枝:实现简单、计算高效,适合对性能要求高的场景。后剪枝:剪枝更精细,泛化能力更强,但计算成本较高。
2025-11-26 23:37:38
323
原创 ID3 与 C4.5 决策树:从原理到可视化与精度评估
训练C4.5决策树# 可视化C4.5决策树plot_tree(c45_tree,plt.title("C4.5决策树", fontsize=15, pad=20)plt.show()# 测试集预测与精度评估print("C4.5决策树精度:{:.2%}".format(c45_accuracy))本文完整演示了在 Jupyter 中实现 ID3 和 C4.5 决策树的全流程,从原理到代码、从可视化到精度评估。决策树作为可解释性极强的算法,在信贷风控、用户分群等场景中仍有广泛应用。
2025-11-03 14:34:38
704
原创 海伦约会数据分析与多分类评估(KNN)
海伦约会数据集是一个经典的多分类数据集,用于预测某人是否愿意与另一个人约会。不喜欢(不感兴趣)一般(中性态度)喜欢(感兴趣)每年飞行里程数玩视频游戏所耗时间百分比每周消费冰淇淋公升数通过本次实验,我们完整实现了基于 KNN 的海伦约会数据分析流程数据加载与预处理(归一化)数据可视化分析KNN 模型手动实现多分类性能评估。
2025-10-29 19:53:18
749
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅