
大数据与统计机器学习
文章平均质量分 66
大数据与统计机器学习
kaka_R-Py
你们的小小关注是我创作的动力。--“烦躁的时候千万不要说话,也不要做任何决定,安静的待会,你已经长大了,一些难过的情绪要学会自己消化”。
展开
-
python读取文件xlrd or openpyxl
【代码】python读取文件xlrd or openpyxl。原创 2025-03-31 16:08:56 · 5 阅读 · 0 评论 -
SVM支持向量机分类——基于Python实现
【代码】SVM支持向量机分类——基于Python实现。原创 2024-11-27 23:10:36 · 801 阅读 · 0 评论 -
决策树——基于乳腺癌数据集与cpu数据集实现
最终的预测结果通过对所有基模型的预测结果进行平均(回归问题)或投票(分类问题)来确定。AdaBoost(Adaptive Boosting)算法是一种集成学习方法,通过结合多个弱分类器(如决策树)的预测结果来提高整体模型的性能和准确性。其基本思想是通过迭代地训练弱分类器,并根据每次迭代的错误率调整样本的权重,使得后续的分类器更加关注被前一轮分类器错误分类的样本。其基本思想是通过构建多个决策树,并将每棵树的预测结果进行平均(回归问题)或投票(分类问题),从而得到最终的预测结果。原创 2024-11-24 23:44:43 · 1001 阅读 · 0 评论 -
模型的评估与选择——交叉验证(基于Python实现)
交叉验证是一种用于估计机器学习模型性能的统计方法。它涉及将数据划分为子集,在一些子集上训练模型,并在剩余的子集上验证模型。这个过程会重复多次,以确保模型的性能是一致的,并且不依赖于特定的数据子集。:类似于k折交叉验证,但折叠的创建方式使得每个折叠中的类别比例与原始数据集中的比例相同。:用于时间序列数据,其中数据点的顺序很重要。数据被分成训练和验证集,方式是尊重时间顺序。每个数据点恰好用一次作为验证集,模型在剩余的数据上训练。个折叠上训练,并在剩余的一个折叠上验证。:k折交叉验证的一种特殊情况,其中。原创 2024-11-22 22:58:24 · 773 阅读 · 0 评论 -
统计机器学习——线性回归与分类
统计机器学习——线性回归与分类原创 2024-11-17 23:43:44 · 1089 阅读 · 0 评论