Tópicos Avançados

Financial Analytics: PADS Insper 2026.2

Programa Avançado de Data Science e Decisão

Modelos VAR

Quando múltiplas séries se influenciam mutuamente:

\[\mathbf{y}_t = \mathbf{c} + \boldsymbol{\Phi}_1 \mathbf{y}_{t-1} + \cdots + \boldsymbol{\Phi}_p \mathbf{y}_{t-p} + \boldsymbol{\varepsilon}_t\]

Exemplo: juros ↔︎ câmbio ↔︎ inflação

Cada variável depende do próprio passado + passado das outras.

Forma Reduzida vs. Estrutural

VAR na forma reduzida esconde relações contemporâneas na matriz \(\Sigma = \text{Cov}(\boldsymbol{\varepsilon}_t)\).

Decomposição de Cholesky: \(\Sigma = L G L^\top\) com \(L\) triangular inferior.

Pré-multiplicando por \(L^{-1}\) obtemos a forma estrutural\(y_{2,t}\) passa a depender contemporaneamente de \(y_{1,t}\).

A ordem das variáveis importa: ordene da mais exógena para a mais endógena.

Regressão Espúria

Duas séries I(1) independentes → regressão produz \(R^2\) alto e \(t\)-estatísticas enormes. Tudo falso.

tylervigen.com/spurious-correlations: filmes de Nicolas Cage × afogamentos, queijo × enrosco em lençóis.

Regra: teste ADF antes. Se I(1), use diferenças ou teste cointegração.

Causalidade de Granger

\(X\) Granger-causa \(Y\) se o passado de \(X\) ajuda a prever \(Y\) além do passado de \(Y\) sozinho.

Warning

Granger-causalidade ≠ causalidade real

É precedência temporal, não causa-efeito. Sorvete não causa afogamentos!

Funções de Resposta ao Impulso

“Se a Selic subir 1% inesperadamente, qual o efeito no câmbio nos próximos 12 meses?”

A IRF mostra a dinâmica da propagação de choques entre variáveis.

Correlação vs. Cointegração

Conceito O que mede Propriedade
Correlação Co-movimento curto prazo Pode ser espúria
Cointegração Equilíbrio longo prazo Implica reversão à média

Duas séries I(1) cointegradas: divergem no curto prazo, mas voltam ao equilíbrio.

\[y_t - \beta x_t \sim I(0)\]

Testes de Cointegração

Engle-Granger (2 variáveis)

  1. Regrida \(y_t = \alpha + \beta x_t + e_t\)
  2. Teste se \(\hat{e}_t\) é estacionário (ADF)

Johansen (múltiplas variáveis)

  • Testa o rank de cointegração
  • Quantas relações de equilíbrio existem?

VECM: Modelo de Correção de Erros

Séries cointegradas \(\Rightarrow\) use VECM, não VAR:

\[\Delta \mathbf{P}_t = \boldsymbol\alpha\, \boldsymbol\beta^\top \mathbf{P}_{t-1} + A\, \Delta \mathbf{P}_{t-1} + \boldsymbol{\varepsilon}_t\]

  • \(\boldsymbol\beta = (1, -\beta)^\top\): vetor de cointegração (equilíbrio de longo prazo)
  • \(\boldsymbol\alpha\): velocidades de ajustamento (mola que puxa para o equilíbrio)
  • \(A\): dinâmica de curto prazo

Quando o spread sai do equilíbrio, o termo \(\boldsymbol\alpha\, \boldsymbol\beta^\top \mathbf{P}_{t-1}\) força o retorno.

Pair Trading: Engle-Granger em 2 passos

  1. Regredir \(Y_t = \mu + \theta X_t + z_t\) por OLS
  2. ADF em \(\hat z_t\): se estacionário, cointegrados

Vetor de pesos do spread:

\[\mathbf{w} = (1, -\hat\theta)^\top, \qquad s_t = Y_t - \hat\theta X_t\]

Para cada 1 long em \(Y\), \(\hat\theta\) short em \(X\) — esse é o hedge correto.

Pair Trading

flowchart LR
    A["Seleção de Pares"] --> B["Calcular Spread"]
    B --> C["Z-score"]
    C --> D["Sinais"]
    D --> E["Fechar Posição"]

Sinal Z-score Ação
Long spread \(z < -2\) Comprar Y, vender X
Short spread \(z > +2\) Vender Y, comprar X
Saída \(|z| < 0.5\) Fechar posições

Riscos do Pair Trading

  1. Quebra da cointegração (fusão, regulação)
  2. Reversão lenta (custo de carregamento)
  3. Risco de execução (liquidez)
  4. Risco de modelo (in-sample ≠ out-of-sample)

IA em Finanças

Abordagem Uso Cuidados
LLMs Sentimento, notícias Não preveem preços
XGBoost Fatores, features Overfitting
LSTM Séries complexas Caixa-preta
RL Trading auto Instável

Important

GARCH com 3 parâmetros frequentemente supera redes neurais com milhares para previsão de volatilidade.

Encerramento

O que aprendemos neste curso:

  1. Séries temporais: decomposição, ARIMA, previsão
  2. Finanças: GARCH, VaR, CAPM, Markowitz
  3. Pensamento crítico > código
  4. Entender o porquê > previsão com 0.1% a mais

Tip

Os fatos estilizados existem independentemente do modelo. Entender o fenômeno é mais importante que otimizar acurácia.