指数平滑法对于预测来说是非常有帮助的,而且它对时间序列上面连续的值之间相关性没有要求。
但是,如果你想使用指数平滑法计算出预测区间,那么预测误差必须是不相关的, 而且必须是服从零均值、 方差不变的正态分布。即使指数平滑法对时间序列连续数值之间相关性没有要求,在某种情况下,我们可以通过考虑数据之间的相关性来创建更好的预测模型。
自回归移动平均模型( ARIMA) 包含一个确定(explicit)的统计模型用于处理时间序列的不规则部分,它也允许不规则部分可以自相关。
我们以上海空气质量指数AQI做成的时间序列数据为例。随着时间增加, 数值变化很大。
下面是excel数据:
data=read.xlsx("上海空气质量指数 (1).xlsx")
head(data)
## 城市 日期 AQI指数
## 1 上海市 41640 193
## 2 上海市 41641 140
## 3 上海市 41642 195
## 4 上海市 41643 137
## 5 上海市 41644 83
## 6 上海市 41645 59
把数据转换成时间序列格式。
data=ts(data[,3],start = c(2014,1,1) ,frequency = 365)
summary(data)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 28.0 59.0 77.0 86.5 103.0 266.0