【2024_CUMCM】时间序列1

目录

概念

时间序列数据

时期和时点时间序列

数值变换规律

长期趋势T

季节趋势S

循环变动C

不规则变动I

叠加和乘积模型

叠加模型 相互独立

乘积模型 相互影响

注 

spss缺失值填补

简单填补

五种填补方法 

填补原则

1.随机缺失

2.完全随机缺失

3.非随机缺失

定义时间变量

时序图 

季节性分解

加法

乘法

时间序列步骤


引言:时间序列也称动态序列,是指将某种现象的指标数值按照时间顺序排列而成的数值序列。时间序列分析大致可分成三大部分,分别是描述过去、分析规律和预测未来。

概念

时间序列数据

对同一对象在不同时间连续观察所得到的数据

时间序列由两个要素组成,包括时间要素(年月日时分秒)和数值要素。

时期和时点时间序列

时间序列根据上面两个要素的不同,分为时期时间序列和时点时间序列。

时期时间序列中,数值要素反映现象在一段时间内的发展结果

时期时间序列中,数值要素反映现象在一个时间点的瞬间水平

时期序列可加,时点序列不可加。
时期序列中的观测值反映现象在一段时期内发展过程的总量,不同时期的观测值可以相加,相加结果表明现象在更长一段时间内的活动总量; 而时点序列中的观测值反映现象在某一瞬间上所达到的水平,不同时期的观测值不能相加,相加结果没有实际意义。

数值变换规律

长期趋势T

长期趋势( Secular trend,T )指的是统计指标在相当长的一段时间内, 到长期趋势影响因素的影响,表现出持续上升或持续下降的趋势 (随着时间的变换,数据呈现一个大的变换趋势) ,通常用 字母T表示。例如,随着国家经济的发展,人均收入将逐渐提升;随着医学 水平的提高,新生儿死亡率在不断下降。

季节趋势S

季节趋势( Seasonal Variation,S )是指由于“季节”的转变使得指标数值发生周期性变动。这里的季节是广义的,一般以月、季、周为时间单位,不能以年 作单位。例如雪糕和棉衣的销量都会随着季节气温的变化而周期变化;每年的长假(五一、十一、春节)都会引起出行人数的大量增加

以下举一个简单的例子帮助理解,例如借助百度指数 (baidu.com) 

查看数学建模字样的搜索量序列图,我们发现每隔一年会有一个尖峰,有趣的是这个尖峰刚好是九月份

循环变动C

循环变动( Cyclical Variation,C )与季节变动的周期不同,循环变动通常以若干年为周期,在曲线图上表现为波浪式的周期变动。这种周期变动的特征表现为增加和减少交替出现,但是并不具严格规则的周期性连续变动最典型的周期案例就是市场经济的商业周期和的整个国家的经济周期

不规则变动I


叠加和乘积模型

叠加模型 相互独立

Y = T + S + C + I

乘积模型 相互影响

Y = T * S * C * I 

注 

(1)数据具有 年内的周期性时才能使用时间序列分解 ,例如数据是月份数据(周期为12)、季度数据(周期为4) ,如果是年份数据则不行。
(2)在具体的时间序列图上,如果随着时间的推移,序列的季节波动变得越来越大,则反映各种变动之间的关系发生变化,建议使用乘积模型;反之,如果时间序列图的波动保持恒定,则可以直接使用叠加模型;当然,如果不存在季节波动,则两种分解均可以


spss缺失值填补

简单填补

五种填补方法 

填补原则

参考:SPSS缺失值填补原理 SPSS缺失值填补的原则-IBM SPSS Statistics 中文网站 (mairuan.com)

  SPSS缺失值数据可以分为三类,随机缺失、完全随机缺失以及非随机缺失。随机缺失和完全随机缺失的缺失值基本没有什么规律,但非随机缺失的缺失值很有可能有规律,下面就和大家讲解一下这三种缺失值的填补原则。

1.随机缺失

随机缺失的缺失值可以使用填补或者插补的方法,明白这一原则可以使用的缺失自填补或者插补方法就很多了,比如均值填补方法、同类均值填补方法以及多重填补方法等。

2.完全随机缺失

完全随机缺失的缺失值与可观察和非可观察数据没有任何逻辑上的联系,也就说数据只是单纯的丢失了,可以通过观察整体数据的观测值对缺失值进行分析。

3.非随机缺失

非随机缺失的缺失值是不可以通过缺失值填补方法进行处理的,因为很可能会导致整体数据统计分析结果出现错误,比如在问卷调查中,调查工资收入,收入低的人可能就会拒绝回答,这时候如果用均值填补或者其他填补方法,都会导致最终的调查结果不准确。


定义时间变量


时序图 

时序图同样使用spss生成 

由图可以看出,数据总体呈现上升的趋势 ,在一年中第二季度都明显高于全年,第四季度明显低于全年,具有很强的季节性,季节波动变化不大,使用叠加模型。


季节性分解

加法

注意: 加法季节因子的和为0  

正表示高于全年平均水平,负就反之,表明第二季度销量高于平均销量20.930件,其他季度同理

可以看出季节性分解将各个因素分开成较为简单的函数,可以单独进行拟合

乘法

乘法的也来试试

 


时间序列步骤

作时间序列图;
判断时间序列包含的变动成分;
时间序列分解(有周期性且包含长期趋势、季节变动或循环变动);
建立时间序列分析模型;
预测未来的指标数值。
上一篇:数据类型与结构设计:Rust 语言的深度探索


下一篇:Git进阶(十四):Windows下 git 提示 Repository not found