自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 DBSCAN:一个强大的聚类算法(附数据源码)

本文详细介绍了DBSCAN聚类算法及其在鸢尾花数据集上的应用。DBSCAN基于密度聚类,能自动发现任意形状的簇并识别噪声点,无需预设簇数。文章通过对比实验展示了DBSCAN相对于K-means等算法的优势,包括处理噪声能力、形状适应性和参数稳定性。提供了完整的Python实现代码,包含数据预处理、参数调优、聚类评估和可视化分析。实验结果表明,DBSCAN能有效识别鸢尾花的自然分组,同时检测异常值。文章还总结了DBSCAN的适用场景和局限性,为实际应用提供了指导。

2026-01-01 00:24:33 472

原创 最强聚类算法:GMM(附数据源码)

本文详细介绍了高斯混合模型(GMM)聚类算法的原理、实现及应用。GMM基于概率模型假设数据由多个高斯分布混合生成,通过EM算法迭代优化参数,实现软分配聚类。相比K-means等硬聚类方法,GMM能更好地处理边界模糊的数据分布,并提供聚类不确定性量化。文章以鸢尾花数据集为例,展示了GMM的完整实现流程,包括数据标准化、模型训练、评估指标计算和可视化分析。实验结果表明GMM能有效识别数据中的自然分组,调整兰德指数达0.62,平均纯度0.96。通过比较不同协方差类型和聚类数,验证了GMM的灵活性。GMM特别适用于

2026-01-01 00:23:28 603

原创 最强时间序列预测算法:LSTM(附数据源码)

本文介绍了LSTM(长短期记忆网络)在时间序列预测中的应用。LSTM是一种特殊的RNN,能有效解决传统RNN在处理长序列时的梯度消失/爆炸问题。文章详细阐述了LSTM的适用场景(如气象、股价等长期依赖数据),并提供了完整的实现代码框架,包括数据预处理、模型构建、训练评估等模块。代码示例展示了如何使用Python和Keras构建LSTM模型,包含数据归一化、模型训练、预测评估及可视化等功能。文章最后指出LSTM的核心价值在于解决长期依赖问题、捕捉复杂模式,并提供了获取完整数据和源码的方式。

2025-12-31 08:40:05 124

原创 ELM:一个强大的时间序列算法(附数据源码)

优势维度具体表现计算效率训练速度比传统神经网络快10-1000倍实现简单无需复杂调参,主要调整隐藏节点数全局最优解析解确保找到全局最优输出权重泛化性能理论证明具有良好的泛化能力数值稳定避免梯度消失/爆炸问题极限学习机作为一种高效、简单、性能良好速度优势:训练速度远超传统迭代算法实现简便:无需复杂调参,易于部署理论保证:具有数学上的最优性保证适用广泛:适用于多种时间序列类型然而,ELM并非万能解决方案,其随机初始化的特点可能导致结果不稳定,且对长期依赖关系的建模能力有限。在实际应用中,建议:对。

2025-12-30 10:51:16 543

原创 最强时间序列预测工具:xgboost(附数据源码)

XGBoost是一种强大且灵活的机器学习算法,在时间序列预测中,通过适当的特征工程(如滞后特征、时间特征)可以取得很好的效果。然而,对于具有复杂长期依赖的时间序列,可能需要更专门的序列模型(如LSTM)来获得更好的性能。XGBoost不仅使用一阶梯度信息(类似于损失函数的斜率,告诉我们预测偏差的方向和大小),还创新性地使用了二阶梯度信息(类似于损失函数的曲率,告诉我们误差变化的速率)。这相当于给模型戴上了"紧箍咒",既允许它学习数据中的真实模式,又防止它过分关注数据中的随机波动。6.保存训练好的模型。

2025-12-30 10:34:43 742

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除