文章目录
前言
预测中使用的模型取决于可用的资源和数据,竞争模型的准确性,以及预测模型的使用方式。
解释模型很有用,因为它包含了其他变量的信息,而不仅仅是要预测的变量的历史值。然而,预测者可能会选择一个时间序列模型,而不是解释性或混合性模型,原因有以下几点。
首先,系统可能不被理解,即使被理解,也可能极难测量假定支配其行为的关系。第二,为了能够预测感兴趣的变量,有必要知道或预测各种预测因子的未来值,而这可能太难了。第三,主要关注点可能只是预测会发生什么,而不是知道为什么会发生。最后,时间序列模型可能比解释模型或混合模型给出更准确的预测。
时间序列预测的基本步骤大致分为五步
一、问题定义
这往往是预测中最困难的部分。仔细定义问题需要了解预测的使用方式,谁需要预测,以及预测功能如何在需要预测的组织中发挥作用。预测员需要花时间与每一个参与收集数据、维护数据库和使用预测的人进行交谈,以进行未来规划。
二、收集信息
总是需要至少两种信息。
(a) 统计数据,和(b) 收集数据和使用预测的人积累的专业知识。
通常情况下,很难获得足够的历史数据来适应一个好的统计模型。在这种情况下,可以使用判断性预测方法。偶尔,由于被预测系统的结构变化,旧的数据将不太有用;那么我们可以选择只使用最新的数据。然而,请记住,好的统计模型会处理系统中的进化变化;不要不必要地丢弃好的数据。
三、初步(探索性)分析
总是从绘制数据图表开始。是否有一致的模式?有显著的趋势吗?季节性是否重要?是否有证据表明存在商业周期?数据中是否有需要由具有专家知识的人解释的异常值?可供分析的变量之间的关系有多强?
已经开发了各种工具来帮助进行这种分析。
四、选择和拟合模型
使用的最佳模型取决于历史数据的可用性、预测变量和任何解释变量之间关系的强度以及预测的使用方式。比较两个或三个潜在模型是很常见的。
每个模型本身就是一个人为的构造,它基于一组假设(明确的和隐含的),通常涉及一个或多个参数,必须使用已知的历史数据进行估计。例如有回归模型、指数平滑法、Box-Jenkins ARIMA模型、动态回归模型、层次预测法,以及包括神经网络和向量自回归的几种高级方法。
五、使用和评估一个预测模型
一旦选择了一个模型并估计了其参数,该模型就被用来进行预测。该模型的性能只有在预测期的数据可用后才能被正确评估。
已经开发了一些方法来帮助评估预测的准确性。在使用预测和采取行动方面也有一些组织性问题。
当在实践中使用预测模型时,会出现许多实际问题,如如何处理缺失值和离群值,或如何处理短的时间序列。这些都需要后续讨论。