- 博客(5)
- 收藏
- 关注
原创 SARIMA时间序列预测
每个变量的P值均小于0.01,所以在0.01的显著性水平下,拒绝加假设,模型中每个变量的系数通过显著性检验,可以认为拟合的模型中包含这些变量是合理的。结合以上两种方法:A R ( p ) + M A ( q ) = A R M A ( p , q ) AR§+MA(q)=ARMA(p,q)AR§+MA(q)=ARMA(p,q),就是自回归移动平均模型。MA(q) 移动平均模型,是对时间序列的误差进行建模,并假设当前误差取决于带有滞后的误差。和小 p 不同的是,需要看的是季节长度的倍数上的时滞。
2024-03-21 18:27:08
774
1
原创 ARIMA 时间序列模型在实际场景中的试验
确定性因素分解的方法把所有序列的变化都归结为 4 个因素(长期趋势、季节变动、循环变动和随机波动)的综合影响,其中长期趋势和季节变动的规律性信息通常比较容易提取,而由随机因素导致的波动则非常难以确定和分析,对随机信息浪费严重会导致模型拟合精度不够理想。当数据之间的相似性越明显,对于模型训练的效果是更佳,如果不介意,也可以先把商品分好类,按类目一个个预测,最后汇总也能得到大盘的达成率。在这里数据是显示平稳的,但是后面训练模型的时候,平稳性变差,所以还是可以做差分,得到一个更加平均的序列。
2024-03-17 00:14:10
2114
1
原创 hive sql案例练习一
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录hive sql案例练习一一、各年评分最高的电影类型(年份,类型,影评分)1、思路2、代码二、该影评库中各种类型电影中评价最高的 5 部电影(类型,电影名,平均影评分)1.思路2.代码总结hive sql案例练习一数据源数据解释t_movie电影ID::电影名(年份)::标签1|标签2…movieid moviename movietypet_rating用户ID::电影ID::评分::评分的时.
2022-05-07 12:37:34
1979
原创 淘宝用户行为数据分析
系列文章目录第二章 淘宝用户生命周期分析文章目录系列文章目录一、项目背景二、项目目的三、理解数据二、分析思路三、用户生命周期分析1、 用户活跃规律(1)不同日期的网页浏览量和访问量情况(2)分析(3)不同日期的网页浏览量和访问量情况(4)分析2、用户留存规律(1)跳失率(2)分析(3)留存率(4)分析3、用户购买情况(1)复购率(3)分析(4)购买频次分析(5)分析(6)复购特征分析(7)分析总结一、项目背景随着互联网行业快速发展,其中电商已成为消费的主要趋势,并且电商板块收入已经成为企业新的主
2022-04-24 23:35:24
596
原创 随机森林文本分类
随机森林原理及代码实现 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录随机森林原理及代码实现前言一、集成算法是什么?二、随机森林是什么三、 数据预处理3.1 先来看一下我们的文本数据3.2 预处理3.3 统计评论情感值积极与消极的占比二、使用步骤参数介绍(4个)属性1.引入库2.参数调参方法总结前言提示:这里可以添加本文要记录的大概内容:例如
2022-04-10 10:46:21
5699
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅