目录
时间序列预测
按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。
x1,x2,x3,x4,...,xt
对时间序列进行观察、研究,找寻他变化发展的规律,预测它未来的走势就是时间序列预测
序列:
按时间顺序排列的一组随机变量
Xt1,Xt2,...,Xtn或者x1,x2,x3,...,xt
随机变量组的统计特征完全由他们的联合分布函数或者联合密度函数决定。
时间序列概率分布组的定义
因为时间有不可重复性,所以转为研究数据特征
借数据
就是把x1 x2 x3、、、xt所有的值取过来,都当做x1的值。
为什么可以这样做呢?
因为x1~xt所取得值是比较平稳的,借过来之后数据变多了。计算x2的期望,也是借数据,X1,X3 ~ Xt。
所以他们的期望都是一样的,这也是平稳性一个重要的性质,期望和方差,所有变量都一样。
第一个变量和第二个变量的协方差,计算时候,两个变量都进行借数据,形成同维度的向量,就可以做自协方差,自相关系数。
借数据的时候,可以区分步长,不一定为1。
当两个变量借数据步长不一样,数据就不一样,两个变量的协方差等,就需要借数据。
借数据条件
每一个变量一样,跨越步长一样,期望均值都一样。
时间序列的平稳
严平稳
严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生改变,该序列才可以成为平稳
宽平稳
宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。
满足如下条件的序列为宽平稳序列
1)方差存在
2)跨越步长一样,自协方差也一样,期望也是一样的
平稳时间序列的统计性质
k为跨越的步长
1)常数均值
2)自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关
3)延迟k自协方差函数
与起点无关
4)延迟k自相关系数
γ(0)就是没跨越,就是自己对自己的方差,就是γ(0)
时间序列数据结构的特殊性
- 可列出多个随机变量,而每一个变量只有一个样本观察值
平稳性的重大意义
- 极大的减少了随机变量的个数,而增加了待估变量的样本容量
- 极大的简化了时序分析的难度,同时也提高了对特征统计量的估计精度
(弥补了时间变化取值不可以重复取值的问题)
时间序列数据平稳性检验
时序图检验
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而波动的范围是有界、无明显趋势及周期特征。
自相关图检验
平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向0.
相关系数值跟步长有关系。
因为没有短期相关,所以判断为不平稳。
有周期和发展趋势的都不能叫平稳的。
判断一个序列是否平稳,更多的是靠经验。
ADF检验(单位根检验的一种)
主要用的是回归的方法和 t 检验。
例:
t是一个列向量。
y1是一百行一列的随机数
因为是随机均匀取点,所以y1是平稳的
y2不是平稳的
adftest研究ADF检验的
adf统计值
p1概率
ljz临界值
注意:
不同方法得到不同的结论,则该数据介于平稳和不平稳之间的。可以根据需要选择合适的方法。
二阶矩是什么呢?
二阶(非中心)矩就是对变量的平方求期望,二阶中心矩就是对随机变量与均值(期望)的差的平方求期望。为什么要用平方,因为如果序列中有负数就会产生较大波动,而平方运算就好像对序列添加了绝对值,这样更能体现偏离均值的范围。(答案来自百度)