- 博客(6)
- 收藏
- 关注
原创 R语言基于mlr3进行机器学习
内容包含:数据清洗、特征工程、集成学习、超参数调参、特征选择等数据分析处理操作。各种常用机器学习算法:正则化回归、Logistic回归、KNN、朴素贝叶斯、神经网络、支持向量机、决策树、随机森林、AdaBoost、XGBoost、LightGBM、聚类分析、关联分析、文本挖掘、生存分析的基本原理及R代码实现。另外,增加少量的torch包深度学习。R机器学习(基于mlr3verse,tidyverse)赠完整课件、操作指南。内容包含:高清视频+课件PPT+代码等全套学习资料。
2025-01-19 12:18:55
113
原创 异常值识别方法-以R语言为例
实际获取得到的原始数据,往往可能存在缺失值、异常值、重复值等问题数据,为了保证数据的质量需要进行数据清洗操作对问题数据进行识别,具体如何操作我们以r语言为例进行探讨。采用单变量识别的方法识别异常值,目前处理异常值的单变量相关指南往往推荐鲁棒方法,可采用robust z score (基于中位数绝对偏差)、iqr(箱线图)以及置信区间相关方法。同样有些模型本身就可以用来进行异常值识别如孤立森林,knn等。对识别得到的缺失值进行处理,这里直接进行删除。首先针对已有数据进行缺失值的识别,绘图如下。
2024-05-02 08:48:01
180
1
原创 R语言ARIMA模型构建
为了更好的把握未来,人们需要根据历史已有数据完成对未来的预测,时间序列模型由此而生。由于最近任务的需要-R语言构建ARIMA模型,浏览网上发现虽然有相关代码,但是出图结果基本上都基于基本的plot绘图函数,不尽人意。然后根据arima模型假设,需要对原始数据进行平稳性检验(不平稳需要差分看差分后是否平稳),得到的平稳序列是否白噪声(白噪声无研究意义)的操作。这里上述过程直接省略,这里直接利用自动定阶函数定阶p、d、q,模型拟合残差情况如下。模型残差应为白噪声,无自相关才能认为模型构建成功。
2024-04-11 09:49:41
569
2
原创 python进行传统时序预测
对arima模型,可通过自动寻参确定p,d,q的值,并进行建立。观察建立模型的模型诊断图模型诊断图包括拟合残差的折线图,密度分布图,qq图,与自相关。时间序列数据无处不在,伴随着时间的延续,人们希望通过对过去时间段数据的统计去预测未来时间段相应指标的变化情况,由此时间序列预测模型应运而生。我们可以用树模型将两种模型进行结合,采用回归预测的方式得到更优异的结果,如下图所示。这里提供3中传统时间序列预测方法,分别为arima,prophet以及结合前两个模型输出作为输入的树模型。
2024-03-20 22:28:05
557
2
原创 Python和R语言学习电子书
R语言作为统计学科不可或缺的神兵利器,以其简单优美的语法、结果备受关注。这里收集了一下关于R语言学习的相关中文电子书资料,供有需要者参考。
2024-03-13 20:44:52
577
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人