当前位置：首页 > news >正文

基于自回归整合滑动平均模型(ARIMA)的时间序列预测

news 2026/3/27 0:14:07

最近在折腾时间序列预测的项目，发现ARIMA这玩意儿虽然老派但确实能打。今天咱们就抛开教科书上的复杂公式，用实际代码和通俗解释聊聊怎么用它做预测。先扔个结论：ARIMA的核心就是三句话——看历史数据、算差异、纠误差。

先搞个模拟数据试试水。假设我们有个每周销售额的波动数据：

import numpy as np import pandas as pd np.random.seed(42) base = np.linspace(0, 20, 100) trend = 0.5 * np.arange(100) seasonality = 5 * np.sin(2 * np.pi * np.arange(100)/7) noise = np.random.normal(0, 1, 100) ts_data = pd.Series(base + trend + seasonality + noise, index=pd.date_range('2020-01-01', periods=100, freq='D'))

这时候直接上ARIMA肯定翻车，得先看数据是否平稳。划重点：ADF检验才是亲爹：

from statsmodels.tsa.stattools import adfuller result = adfuller(ts_data) print(f'ADF统计量: {result[0]:.3f}') print(f'p值: {result[1]:.3f}') # 输出大概率大于0.05，说明不平稳

如果p值大于0.05，直接进入差分环节。这里有个骚操作——动态差分直到平稳：

diff_count = 0 current_data = ts_data.copy() while True: result = adfuller(current_data.dropna()) if result[1] < 0.05: break current_data = current_data.diff().dropna() diff_count += 1 print(f'需要差分次数: {diff_count}') # 通常1-2次就能搞定

接下来要确定AR和MA的阶数。别被ACF/PACF图搞懵，实战中直接让auto_arima干活更省事：

from pmdarima import auto_arima model = auto_arima(ts_data, seasonal=False, trace=True) # 输出里找AIC最小的组合，比如(2,1,1)

拿到最佳参数后正式建模：

from statsmodels.tsa.arima.model import ARIMA model = ARIMA(ts_data, order=(2,1,1)) results = model.fit() # 重点看系数P值是否小于0.05，否则考虑删减参数 print(results.summary())

预测阶段注意要包含历史数据的类型：

forecast = results.get_forecast(steps=7) # 别直接用predict，要带置信区间 print(forecast.predicted_mean)

踩过几个坑特别提醒：

遇到周期性数据记得用SARIMA（比如销售数据周循环）
预测结果出现直线下滑？检查是否差分过度
样本量小于50条的建议换模型

最后来个可视化收尾：

import matplotlib.pyplot as plt ts_data.plot(label='历史数据') forecast.predicted_mean.plot(label='预测', color='red') plt.fill_between(forecast.conf_int().index, forecast.conf_int()['lower close'], forecast.conf_int()['upper close'], color='pink', alpha=0.3) plt.legend()

ARIMA就像老中医把脉，数据平稳了、参数调准了，预测效果自然就上来了。下次遇到股票价格、服务器负载这些时间序列，不妨先拿它试试手。

查看全文

http://www.jsqmd.com/news/225942/