时间序列预测模型ARIMA应用全流程（下）

模型定阶：计算自相关函数ACF 和偏自相关函数PACF

若你检验方法选择方法二，则你已经得到了ACF和PACF，但检验方法最好还是选择单位根检验

流程：

1.根据ACF图和PACF图判断，序列平稳化后，使用AR、MA、ARMA中哪种模型

2.判断p，q阶数是多少

（前两步都是看ACF和PACF图来判断）

3.可能ARMA有多个p，q决定的模型（因为可能ACF和PACF图可以看出多个p和q），这时要通过信息标准AIC和BIC来协助选择模型

选择AIC、BIC值最小的，因为AIC、BIC越小，模型越好

但要注意的是，这些准则不能说明某一个模型的精确度，也即是说，对于三个模型Ａ，Ｂ，Ｃ，我们能够判断出Ｃ模型是最好的，但不能保证Ｃ模型能够很好地刻画数据，因为有可能三个模型都是糟糕的。

赤池信息准则 (akaike information criterion) :AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合(Overfitting)的情况。所以优先考虑的模型应是AIC值最小的那一个

贝叶斯信息准则 (bayesian information criterion) :

其中 L 是该模型下的最大似然, n 是数据数量， k 是模型的变量个数。

模型	ACF	PACF
AR	拖尾	截尾
MA	截尾	拖尾
ARMA	拖尾	拖尾

检查平稳时间序列的自相关图和偏自相关图。

通过sm.graphics.tsa.plot_acf和sm.graphics.tsa.plot_pacf得到图形其中 lags 表示滞后的阶数，以上分别得到 ACF 图和 PACF 图

例子1

1) 观察ACF和PACF图，判断是哪种模型

dta= dta.diff(1)#我们已经知道要使用一阶差分的时间序列，之前判断差分的程序可以注释掉
fig = plt.figure(figsize=(12,8))
ax1=fig.add_subplot(211)
fig = sm.graphics.tsa.plot_acf(dta,lags=40,ax=ax1)
ax2 = fig.add_subplot(212)
fig = sm.graphics.tsa.plot_pacf(dta,lags=40,ax=ax2)

通过两图观察得到：

自相关图显示滞后有三个阶超出了置信边界；

偏相关图显示在滞后1至7阶（lags 1,2,…，7）时的偏自相关系数超出了置信边界，从lag 7之后偏自相关系数值缩小至0 则有以下模型可以供选择：

ARMA(0,1)模型：即自相关图在滞后1阶之后缩小为0，且偏自相关缩小至0，则是一个阶数q=1的移动平均模型；

ARMA(7,0)模型：即偏自相关图在滞后7阶之后缩小为0，且自相关缩小至0，则是一个阶层p=3的自回归模型；

ARMA(7,1)模型：即使得自相关和偏自相关都缩小至零。则是一个混合模型。

2) AIC BIC选择其中最佳模型

dta是差分后的序列因为使用的是ARMA模型

arma_mod20 = sm.tsa.ARMA(dta,(7,0)).fit() # dta是差分后的序列
print(arma_mod20.aic,arma_mod20.bic,arma_mod20.hqic)
arma_mod30 = sm.tsa.ARMA(dta,(0,1)).fit()
print(arma_mod30.aic,arma_mod30.bic,arma_mod30.hqic)
arma_mod40 = sm.tsa.ARMA(dta,(7,1)).fit()
print(arma_mod40.aic,arma_mod40.bic,arma_mod40.hqic)
arma_mod50 = sm.tsa.ARMA(dta,(8,0)).fit()
print(arma_mod50.aic,arma_mod50.bic,arma_mod50.hqic)

可以看到ARMA(7,0)的AIC，BIC，HQIC均最小，因此是最佳模型。

例子2:

1) 观察ACF和PACF图，判断是哪种模型

从一阶差分序列的自相关图和偏自相关图可以发现:

自相关图拖尾或一阶截尾

偏自相关图一阶截尾,

所以我们可以建立ARIMA(1,1,0)、ARIMA(1,1,1)、ARIMA(0,1,1)模型。

2) AIC BIC选择其中最佳模型

data[“xt”]是没有差分的序列因为使用的是ARIMA模型

arma_mod20 = sm.tsa.ARIMA(data["xt"],(1,1,0)).fit() # data["xt"]是没有差分的数据
arma_mod30 = sm.tsa.ARIMA(data["xt"],(0,1,1)).fit()
arma_mod40 = sm.tsa.ARIMA(data["xt"],(1,1,1)).fit()
values = [[arma_mod20.aic,arma_mod20.bic,arma_mod20.hqic],[arma_mod30.aic,arma_mod30.bic,arma_mod30.hqic],[arma_mod40.aic,arma_mod40.bic,arma_mod40.hqic]]
df = pd.DataFrame(values,index=["AR(1,1,0)","MA(0,1,1)","ARMA(1,1,1)"],columns=["AIC","BIC","hqic"

选择模型MA(0, 1, 1),即ARIMA(0, 1, 1)

参数估计

from statsmodels.tsa.arima_model import ARIMA
model = ARIMA(data["xt"], order=(0,1,1))
result = model.fit()
print(result.summary())

                             ARIMA Model Results                              
==============================================================================
Dep. Variable:                   D.xt   No. Observations:                   36
Model:                 ARIMA(0, 1, 1)   Log Likelihood                -122.987
Method:                       css-mle   S.D. of innovations              7.309
Date:                Tue, 22 Dec 2020   AIC                            251.973
Time:                        09:11:55   BIC                            256.724
Sample:                    01-01-1953   HQIC                           253.631
                         - 01-01-1988                                         
==============================================================================
                 coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------
const          4.9956      2.014      2.481      0.013       1.048       8.943
ma.L1.D.xt     0.6710      0.165      4.071      0.000       0.348       0.994
                                    Roots                                    
=============================================================================
                  Real          Imaginary           Modulus         Frequency
-----------------------------------------------------------------------------
MA.1           -1.4902           +0.0000j            1.4902            0.5000
-----------------------------------------------------------------------------

模型检验

1) 参数的显著性检验

P<α（α通常为0.05），拒绝原假设，，认为该参数显著非零MA(2)模型拟合该序列，残差序列已实现白噪声

2）模型的显著性检验

resid = result.resid#残差
fig = plt.figure(figsize=(12,8))
ax = fig.add_subplot(111)
fig = qqplot(resid, line='q', ax=ax, fit=True)

qq图显示，我们看到红色的KDE线与N(0,1)平行，这是残留物正太分布的良好指标，说明残差序列是白噪声序列，模型的信息的提取充分，当让大家也可以使用前面介绍的检验白噪声的方法LB统计量来检验

ARIMA(0,1,1)模型拟合该序列，残差序列已实现白噪声，且参数均显著非零。说明ARIMA(0,1,1)模型是该序列的有效拟合模型

模型预测

pred = result.predict('1988', '1990',dynamic=True, typ='levels')
print (pred)

1988-01-01   278.35527
1989-01-01   283.35088
1990-01-01   288.34649
Freq: AS-JAN, dtype: float64

plt.figure(figsize=(12, 8))
plt.xticks(rotation=45)
plt.plot(pred)
plt.plot(data.xt)
plt.show()

预测结果分析

展开阅读全文

页面更新：2024-06-06

标签：序列模型噪声边界平稳最小准则流程参数时间数据信息

1 2 3 4 5

福建省在全国率先实现海岸沿线30公里5G连续覆盖

来源：台海网据福建日报8月12日报道10日，第六届“绽放杯”5G应用征集大赛5G+水利海洋专题赛启动会在泉州举办。记者从启动会上获悉，截至今年6月，全省累计建成5G基站9.4万个，实现所有乡镇和85%以上建制村5G覆盖，推动重点港口

东航优化调整暑期运力配置，不断提升旅客乘机舒适度

近日，由上海飞往成都的MU5409航班在做起飞前的最后准备。围绕这架A350客机，机长季红华依次对飞机外部结构、机翼、机身、发动机、起落架等各个部位进行绕机检查。在等待飞机完成油料加注之后，季红华返回驾驶舱，与机务人员

开始了！福建最高摩天轮！转一圈30分钟！

位于福州市晋安区岳峰镇的建设中的全省最高摩天轮——福州爱摩轮开始进入轿厢安装阶段这标志着它向正式迎客又迈进了一步建成后共有48个轿厢今日下午记者在晋安湖北侧工地上看到一个个椭圆造型的轿厢犹如一个个太

28岁程序员，约女友来酒店，"激战"一夜后变脸：把房费摊了！

为了您更好的阅读互动体验，为了您及时看到更多内容，点个“关注”，我们每天为您更新精彩故事、分享不一样的故事瞬间！五月份，广州市白云区的一个早晨，互联网公司的办公室灯光昏暗，各个工位上的电脑屏幕都在闪烁着一行又一行的

“三阳”抬头，下一波感染高峰或将出现在11月？专家称系误解

近期，由于暑假人员流动性密集，新冠感染又出现了一波小高峰，一些人甚至称自己已经“三阳”。根据8月3日中国疾控中心发布的7月全国新型冠状病毒感染疫情情况，7月24日至30日，新冠病毒阳性率13.4%。有人按照3-6个月感染一次新

长江岸边守安澜！探访百年水文站南京潮位站

湛蓝的天空飘着大朵白云，水鸟从江面飞过，矗立在南京鼓楼江边不远处的显示屏上，实时显示着当前水情信息，这就是南京潮位站。百年来，它经历了一次次潮起潮落，一丝不苟地记录着水情信息。近日，水利部按照《百年水文站认定办法（试

世界上的严重错误工程：耗费巨额资金，建成一笔烂账？中国占两个

#头条创作挑战赛#原创不易，感谢有你！欢迎关注！在世界的舞台上，建设工程既是一项伟大的壮举，也是一个国家实力和创造力的象征。对于建筑计划，尤其是庞大的建筑计划的决定往往是极其慎重的。然而有时的决策也可能陷入严重的错

南京长江大桥安装桥墩防撞设施

视频加载中...近日，南京长江大桥3号、4号、5号桥墩顺利安装防撞设施并投入使用。据了解，依据长江水域特点和航运条件，本次安装的桥墩防撞设施采用浮动式钢覆复合材料，可以根据水位上下浮动。该防撞设施可有效吸收、分散或

重庆市航空应急救援总队进入24小时备勤状态

8月11日，重庆市航空应急救援总队消息，连日高温，森林火险逐级升高，该总队已进入24小时备勤状态，全员取消休假待命，没有飞行任务时执行日常训练，随时准备起飞。按照市应急管理局部署，市航空应急救援总队龙兴、万州、黔江三个航

中国科学家：我们不会害怕，更不会崩溃！

香港《南华早报》网站8月11日报道称，面对美国对华高科技投资限制令，中国科学家表示，“我们不会感到害怕”。报道称，中国科学家认为，美国对中国部分所谓敏感技术的投资限制令的影响将是有限的，因为近年来这些领域已经不像以

武大禁止校外人士扫共享电车代扫黄牛报价：一小时20元

“武大的黄牛太可怕了！代扫共享单车20元一小时！”近日，有网友在社交平台发文感叹，武汉大学禁止校外人士扫共享电车，结果反而催生了大批代扫黄牛，原本几元钱一小时的共享电车，黄牛能收到二三十元一小时。长江云新闻记者在小红

听说，好多警察都这样？

作为警察的你，是不是也有这些小习惯呢？素材、内容来源于@小欣漫画以及网友热评，欢迎在评论区留言指正，或者说说你的一下小习惯~

武汉教授设计极简锁获2023国际红点奖

极目新闻记者张渊通讯员陈思近日，德国红点奖（Red Dot Award）2023年度获奖名单正式揭晓，湖北第二师范学院艺术学院视觉传达设计系程蓉洁副教授与企业合作设计选送的作品《MSI极简锁》，获2023年国际顶级设计大奖德国红点设

20枚东风导弹试射，西方全体失声陷入沉默，看今后还有谁敢惹中国

开始阅读之前，动动您发财的小手点点“关注”，可以收到更多精彩推送~感谢您的关注和点赞！台湾是中国的一部分，任何国家不可干涉中国内政事务消息一：20枚东风导弹试射，西方全体失声陷入沉默，看今后还有谁敢惹中国近期中国进行

从“江浙沪独生女”的故事中看到社会的不公和急需改变！

「江浙沪独生女」群体曝光：晒包晒车已不稀奇，这里的千金们在晒命…社交媒体，一个充满了奢华晒货的璀璨舞台，但最近那些所谓的“江浙沪独生女”却在其中上演着一场不同寻常的秀。不再是奢侈品的炫耀，她们将自己的“命”挂在

上滑加载更多 ↓

时间序列预测模型ARIMA应用全流程（下）

模型定阶：计算自相关函数ACF 和偏自相关函数PACF

参数估计

模型检验

模型预测

预测结果分析

福建省在全国率先实现海岸沿线30公里5G连续覆盖

东航优化调整暑期运力配置，不断提升旅客乘机舒适度

开始了！福建最高摩天轮！转一圈30分钟！

28岁程序员，约女友来酒店，"激战"一夜后变脸：把房费摊了！

“三阳”抬头，下一波感染高峰或将出现在11月？专家称系误解

长江岸边守安澜！探访百年水文站南京潮位站

世界上的严重错误工程：耗费巨额资金，建成一笔烂账？中国占两个

南京长江大桥安装桥墩防撞设施

重庆市航空应急救援总队进入24小时备勤状态

中国科学家：我们不会害怕，更不会崩溃！

武大禁止校外人士扫共享电车代扫黄牛报价：一小时20元

听说，好多警察都这样？

武汉教授设计极简锁获2023国际红点奖

20枚东风导弹试射，西方全体失声陷入沉默，看今后还有谁敢惹中国

从“江浙沪独生女”的故事中看到社会的不公和急需改变！

假面骑士利伽德官方设定公开数据全面超越MK9 能毁灭

上海多地发现“巨型老鼠”，最小一只10斤，不仅打不得还吃

拉瑞安分享《博德之门3》玩家数据：368人3天通关

湖北成立算力与大数据产业联盟力争到2025年产业规模

中文AI“读心术”来了！研究人员拟基于中文构建大规模脑

最新民调公布！侯友宜数据遥遥领先，张友骅：国民党陷入整合

严重可致休克！孩子再渴，这3个时间段也不要大量喝水

西部数据Xbox SSD扩展卡C50降价：1TB由1599元降至999元

深圳推进数实融合创新-激活数据要素价值潜能

汉朝GPT大模型在厦门首次亮相

时间序列预测模型ARIMA应用全流程（下）

模型定阶：计算自相关函数ACF 和 偏自相关函数PACF

参数估计

模型检验

模型预测

预测结果分析

模型定阶：计算自相关函数ACF 和偏自相关函数PACF