用数据预测未来：时间序列分析

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

用数据预测未来：时间序列分析

跪着提需求

2017-07-17

4 评论 124164 浏览 89 收藏

17 分钟

对于本文内容，小编只知道作者介绍了一种用数据预测未来的方法——时间序列分析。……嗯，内容灰常灰常灰常烧脑，各位看官enjoy~

应用背景：

通过分析序列进行合理预测，做到提前掌握未来的发展趋势，为业务决策提供依据，这也是决策科学化的前提。

时间序列分析：

时间序列就是按时间顺序排列的一组数据序列。

时间序列分析就是发现这组数据的变动规律并用于预测的统计技术。

分析工具：

SPSS（数据分析的重量级应用，与SAS二选一）

实践案例：通过历史数据预测未来数据，所涉及的都是最简单的实践，抛砖引玉，重在方法，不论多复杂的数据，方法是一样的。

如已知前几年每月的销售量，预测未来的销售量。

一、时间序列分析简介

时间序列分析有三个基本特点：

假设事物发展趋势会延伸到未来
预测所依据的数据具有不规则性
不考虑事物发展之间的因果关系

并不是所有的时间序列都一定包含四种因素，如以年为单位的诗句就可能不包含季节变动因素。

四种因素通常有两种组合方式：

四种因素相互独立，即时间序列是四种因素直接叠加而成的，可用加法模型表示： Y=T+S+C+I
四种因素相互影响。即时间序列是四种因素相互综合的结果，可用乘法模型表示：Y=T*S*C*I

其中，原始时间序列值和长期趋势可用绝对数表示；季节变动、循环变动、不规则变动可用相对数（变动百分比）表示。

二、季节分解法

当我们对一个时间序列进行预测时，应该考虑将上述四种因素从时间序列中分解出来。

为什么要分解这四种因素？

分解之后，能够克服其他因素的影响，仅仅考量一种因素对时间序列的影响。
分解之后，也可以分析他们之间的相互作用，以及他们对时间序列的综合影响。
当去掉这些因素后，就可以更好的进行时间序列之间的比较，从而更加客观的反映事物变化发展规律。
分解之后，序列可以用来建立回归模型，从而提高预测精度。

所有的时间序列都要分解这四种因素吗？

通常情况下，我们考虑进行季节因素的分解，也就是将季节变动因素从原时间序列中去除，并生成由剩余三种因素构成的序列来满足后续分析需求。

为什么只进行季节因素的分解？

时间序列中的长期趋势反映了事物发展规律，是重点研究的对象；
循环变动由于周期长，可以看做是长期趋势的反映；
不规则变动由于不容易测量，通常也不单独分析。
季节变动有时会让预测模型误判其为不规则变动，从而降低模型的预测精度

综上所述：当一个时间序列具有季节变动特征时，在预测值钱会先将季节因素进行分解。

步骤：

定义日期标示变量：即先将序列的时间定义好，才能分析其时间特征。
了解序列发展趋势：即序列图，确定乘性还是加性
进行季节因素分解
建模
分析结果解读
预测

1、定义日期标示变量

时间序列的特点就是数据根据时间点的顺序进行排列，因此分析之前，SPSS需要知道序列的时间定义，然后才能进行分析时间特征。

根据源数据的格式进行选择，并输入第一个个案的具体数值。

此时会在源文件中生成三个新的变量。

2、了解序列发展趋势

完成日期标示变量的定义之后，需要先对时间序列的变化趋势有所了解，便于选择合适的模型。即通过序列图，确定模型是乘性还是加性。

变量为”销售数据“，时间轴标签为”DATE–“，也就是我们自定义的时间。

数据销量序列图

如何根据序列图来判断模型的乘性或加性？

如果随着时间的推移，序列的季节波动变得越来越大，则建议使用乘法模型。
如果序列的季节波动能够基本维持恒定，则建议使用加法模型。

本例很明显：随着时间变化，销售数据的季节波动越来越大，那么使用乘法模型会更精确。

3、进行季节因素分解

变量为”销售数据“，且根据序列图我们知道时间序列模型为乘性。

提示您会新生成四个变量

ERR（误差序列）：从时间序列中移除季节因素、长期趋势、和循环变动之后留下的序列，也就是原始序列中的不规则变动构成的序列。
SAS（季节因素校正后序列）：是移除原始序列中的季节因素后的校正序列。
SAF（季节因子）：是从序列中分解出的季节因素。其中的变量值根据季节周期的变动进行重复，如本例中季节周期为12个月，所以这些季节因子没12个月重复一次。
STC（长期趋势和循环变动趋势）：这是原始序列中长期趋势和循环变动构成的序列。