机器学习
文章平均质量分 76
妙龄少女郭德纲
个人公众号 是十三不是四十三 ,分享一些算法和大数据相关的知识~
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习中分类问题的各类评估指标总结
召回率计算方式、适用场景、局限性。原创 2024-09-23 10:37:41 · 913 阅读 · 0 评论 -
基于Spark框架实现LightGBM模型
原生的Spark MLlib并不支持LightGBM算法的实现,但SynapseML提供了一种解决方案,使得我们可以在Spark中调用LightGBM。LightGBM是一种基于梯度提升决策树的高效机器学习框架,它专门用于创建高质量的决策树算法,适用于分类、回归和排名等多种机器学习任务。通过SynapseML,LightGBM可以与Spark MLlib无缝集成,利用Spark的分布式计算能力,实现对大规模数据集的高效处理。高性能:LightGBM以其快速的训练速度和低内存消耗而闻名,这使得它在处理大规模数原创 2024-09-23 10:23:48 · 1086 阅读 · 0 评论 -
基于Spark框架实现XGBoost模型
原生的Spark MLlib并不支持XGBoost算法,但XGBoost4J-Spark提供了一种解决方案,使得我们可以在Spark环境中调用XGBoost。XGBoost4J-Spark是一个项目,旨在无缝集成XGBoost和Apache Spark,通过适配XGBoost到Spark的MLlib框架。这样,用户不仅可以使用XGBoost的高性能算法实现,还可以利用Spark强大的数据处理引擎来进行特征工程、构建和评估机器学习管道、持久化机器学习模型等。分布式计算:XGBoost4J-Spark充分利用S原创 2024-09-14 10:36:49 · 1186 阅读 · 0 评论 -
时序数据的去时序化
在数据分析的众多挑战中,时序数据的处理尤为棘手。时序数据的去时序化,即将数据从其固有的时间序列结构中解放出来,转化为可以被传统机器学习算法处理的形式,是数据预处理的关键步骤。这一过程对于提高模型的泛化能力和预测精度至关重要。本文将深入探讨去时序化的概念、方法及其在实际应用中的重要性,为你揭示如何从时间的束缚中释放数据的真正潜力。对时序数据进行去时序化处理,然后再使用一些传统的机器学习or深度学习模型进行建模,是在实际工作当中,非常常用的一种处理手段,比纯应用针对时序数据的模型进行建模更加常用,毕竟时序模型可原创 2024-09-11 10:13:50 · 624 阅读 · 0 评论 -
深入时序分析:分类、模型与算法全景解析
在数据科学的广阔领域中,时序数据以其独特的时间属性和动态变化特性,成为了分析和预测的重要对象。无论是金融市场的股价波动、电商平台的销售趋势,还是医疗健康领域的生理信号监测,时序数据都扮演着关键角色。为了更好地理解和利用这些数据,我们需要掌握时序数据的分类方法、构建有效的时序模型,以及运用恰当的算法进行深入分析。本文将带你走进时序数据的世界,从数据分类到模型构建,再到算法应用,为你提供一幅全面的时序分析全景图。原创 2024-09-10 10:15:55 · 1621 阅读 · 0 评论 -
万字总结CatBoost原理、核心参数以及调优思路(下篇)
处理类别特征: CatBoost可以自动处理类别数据,无需进行繁琐的预处理,如独热编码。它使用了一种特殊的算法来处理这些特征,从而提高模型的效率和准确性,简化了数据处理流程。避免过拟合: 通过实现了有序的提升和自动调节的深度,CatBoost能有效控制过拟合,尤其是在数据量不大的情况下。速度和可扩展性: CatBoost提供了高效的实现,能够快速训练大规模数据集,并且可以使用GPU加速计算。多平台和多语言支持: CatBoost支持Python、R、Java等多种编程语言,并且可以在Linux、Window原创 2024-08-06 10:11:38 · 1284 阅读 · 0 评论 -
万字总结CatBoost原理、核心参数以及调优思路(上篇)
CatBoost,全称Categorical Boosting,是由俄罗斯搜索引擎公司Yandex开发的一种高效的梯度提升决策树(Gradient Boosting Decision Trees, GBDT)算法(与XGBoost一样,也是拟合二阶泰勒展开)。原创 2024-07-29 17:41:27 · 2913 阅读 · 0 评论 -
万字总结LightGBM原理、核心参数以及调优思路(下篇)
这里仅介绍lightgbm.cv区别于lightgbm.train的参数,lightgbm.train相关参数在万字总结LightGBM原理、核心参数以及调优思路(中篇)LightGBM.cv核心参数使用LightGBM建模一般先使用lightgbm.cv搜索结合提前停止搜索出最优参数,然后使用lightgbm.train进行模型重建,最后使用重建后的模型完成后续的模型预测,下面是一个具体的例子:LightGBM模型通用建模流程调参步骤原创 2024-07-25 09:51:53 · 1014 阅读 · 0 评论 -
万字总结LightGBM原理、核心参数以及调优思路(中篇)
万字总结LightGBM原理、核心参数以及调优思路(上篇)LightGBM sklearn API应用代码LightGBM sklearn API超参数解释与使用方法LGBM的原生API调用和XGB的原生API调用过程非常类似,一个最简单的流程如下:LightGBM 涉及的DataSet APILightGBM 涉及的Training API以及各类参数详解原创 2024-07-23 09:59:42 · 726 阅读 · 0 评论
分享