ARIMA e SARIMA

Financial Analytics: PADS Insper 2026.2

Programa Avançado de Data Science e Decisão

Relembrando: AR e MA

\[y_t = c + \phi_1 y_{t-1} + \cdots + \phi_p y_{t-p} + \varepsilon_t\]

“O presente depende do passado da série”

\[y_t = c + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \cdots + \theta_q \varepsilon_{t-q}\]

“O presente depende dos choques passados”

Combina AR, diferenciação e MA:

\[\underbrace{\phi(B)}_{\text{AR}} \underbrace{(1-B)^d}_{\text{I}} y_t = c + \underbrace{\theta(B)}_{\text{MA}} \varepsilon_t\]

Parâmetro	Controla
\(p\)	Ordem autoregressiva (quantos lags de \(y\))
\(d\)	Diferenciações (0, 1 ou 2)
\(q\)	Ordem de média móvel (quantos lags de \(\varepsilon\))

Operador de defasagem: \(L Y_t = Y_{t-1}\).

\[\Phi(L) = 1 - \phi_1 L - \cdots - \phi_p L^p\]

Estacionariedade do AR(\(p\)): todas as raízes de \(\Phi(z) = 0\) com \(|z| > 1\) (fora do círculo unitário).

AR(1): \(|\phi_1| < 1\)
Raiz em \(z = 1\) \(\Rightarrow\) raiz unitária \(\Rightarrow\) não-estacionário
Teste ADF = teste de hipótese sobre raiz em \(z=1\)

\[\text{SARIMA}(p,d,q)(P,D,Q)_m\]

Exemplo: \(\text{SARIMA}(1,1,1)(0,1,1)_{12}\) para dados mensais

flowchart TD
    A[1. Identificação] --> B[2. Estimação]
    B --> C[3. Diagnóstico]
    C -->|Inadequado| A
    C -->|Adequado| D[4. Previsão]

Para escolher entre modelos candidatos:

\[\text{AIC} = -2\ln(\hat{L}) + 2k\] \[\text{BIC} = -2\ln(\hat{L}) + k\ln(n)\]

Critério	Penalização	Tendência
AIC	Leve	Seleciona modelos maiores
BIC	Forte	Seleciona modelos mais simples
AICc	Corrigido para \(n\) pequeno	Recomendado na prática

Tip

Menor é melhor. Na dúvida, use AICc.

Os resíduos devem ser ruído branco:

\[Q = n(n+2) \sum_{k=1}^{h} \frac{\hat{\rho}_k^2}{n-k}\]

Abordagem	Vantagem	Desvantagem
Manual	Controle total, entendimento profundo	Lento, requer experiência
Auto	Rápido, sistemático	Pode ignorar contexto

Recomendação: use auto como ponto de partida, depois refine manualmente se necessário.