- 博客(4)
- 收藏
- 关注
原创 datawhale春训营——发电功率预测(AI+新能源)
由于LightGBM基于梯度提升,极端数值可能导致学习不稳定,从而影响模型的泛化能力,并且在数据量不同之间的转化中容易bug。该模型每一步都在之前的基础上进行训练,从而不断优化模型的预测结果,通过减少了样本数据量和特征个数,从而加快了模型的训练速度。lightgbm模型,一种基于梯度提升框架的机器学习算法。每次随机的选择K-1份作为训练集,剩下的1份做验证集;当这一轮完成后,重新随机选择K-1份来训练数据;K折交叉验证会把样本数据随机的分成K份;最后将K折预测结果取平均作为最终提交结果。
2025-04-20 22:23:08
281
原创 §8 时间序列与投资模型
本期学习活动我们一起来看一下导论的时间序列,顾名思义也就是按照时间排下来的序列,例如股票等。如果是短期的序列比方说只有十几条的,那么我们按照之前讲的回归那一套来做也未尝不可;但另外,时间序列分析能够相对精准预测股市,但怎么买取决于一个优化策略。
2025-02-19 22:10:12
1764
原创 §7 权重生成与评价模型
本文介绍了数学建模中的评价类模型,包括层次分析法、熵权分析法、TOPSIS分析法、CRITIC方法、主成分分析法和因子分析法。这些方法通过不同的原理和步骤,如一致性检验、信息熵计算、距离测量、波动性分析、降维处理和因子提取,实现对多指标数据的综合评价。文中结合案例展示了各方法的应用流程,并强调了数据正向化、归一化和相关性分析等关键步骤的重要性。
2025-02-15 21:58:16
1728
原创 §6 数据处理与拟合模型
值得注意的是,这里的独立指的是抽样意义上的独立,而不是统计意义的独立,什么意思呢?但是如果出现异常值,比如非常大的数值,那么这个数据的分布是有偏的。很明显,这就是一个典型的单组样本均值假定的检验,比较的是这个样本(10个同学的英语成绩)所代表的总体均值(班级英语成绩均值)是否与参考值137相等。age 列的平均值是 3.4375,计算方法是将所有非空的 age 值相加,然后除以非空值的数量(8 个),visits 列的平均值是 1.9,计算方法是将所有 visits 值相加,然后除以总行数(10 行)。
2025-02-13 00:26:52
1875
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅