Aula 5: VaR e Gestão de Risco

Quantificando perdas potenciais

Objetivos de Aprendizagem

  • Definir VaR e Expected Shortfall formalmente
  • Calcular VaR usando três abordagens (paramétrico, histórico, Monte Carlo)
  • Avaliar a qualidade do VaR via backtesting
  • Aplicar esses conceitos a um portfólio real

Value at Risk (VaR)

O que é VaR?

O VaR é provavelmente a medida de risco mais usada na indústria financeira. Ele responde a uma pergunta simples e poderosa:

“Qual é a perda máxima que posso esperar, com um certo nível de confiança, em um determinado horizonte de tempo?”

Exemplo: “Com 95% de confiança, não perderemos mais que R$ 2 milhões nos próximos 10 dias.”

Definição Formal do VaR \[P(L > \text{VaR}_\alpha) = 1 - \alpha\]

onde \(L\) é a perda do portfólio, \(\alpha\) é o nível de confiança (tipicamente 95% ou 99%) e o horizonte temporal deve ser especificado (1 dia, 10 dias, etc.).

Visualizando o VaR

O VaR é simplesmente um quantil da distribuição de perdas:

DicaExperimente!
  • Aumente a confiança para 99%: o VaR se desloca para a esquerda (perda maior), cobrindo cenários mais extremos
  • Aumente a volatilidade: toda a distribuição se alarga, e o VaR cresce proporcionalmente
  • Note que o ES (linha amarela) está sempre à esquerda do VaR — ele captura a perda média nos cenários mais extremos

Três Abordagens para Calcular VaR

1. VaR Paramétrico (Variância-Covariância)

Assume que os retornos seguem uma distribuição conhecida (tipicamente normal ou t de Student):

VaR Paramétrico — caso normal \[\text{VaR}_\alpha = -(\mu + z_\alpha \cdot \sigma) \cdot W\]

onde \(z_\alpha\) é o quantil da distribuição normal (\(z_{0.95} = -1.645\), \(z_{0.99} = -2.326\)) e \(W\) é o valor do portfólio.

NotaPosição comprada vs. posição vendida

A fórmula acima vale para uma posição comprada (long): você perde se o ativo cai, e o VaR usa a cauda esquerda da distribuição de retornos. Numa posição vendida (short), a lógica inverte — você perde se o ativo sobe, e o VaR usa a cauda direita:

\[\text{VaR}_\alpha^{\text{short}} = (\mu + z_{1-\alpha} \cdot \sigma) \cdot W\]

Para uma normal simétrica as magnitudes são iguais; para distribuições assimétricas (skewed-\(t\)), os dois lados precisam ser calculados separadamente.

Conexão com a Aula 4: RiskMetrics como VaR paramétrico

O RiskMetrics™ (visto na Aula 4) é exatamente um VaR paramétrico com \(\mu = 0\), distribuição normal e \(\sigma_t\) estimado por IGARCH/EWMA:

\[\text{VaR}_{\alpha,t}^{\text{RM}} = -z_\alpha \cdot \sqrt{h_t}, \qquad h_t = \lambda h_{t-1} + (1-\lambda) r_{t-1}^2\]

É por isso que o RiskMetrics virou o baseline regulatório: é um VaR paramétrico com uma recursão simples de volatilidade e zero parâmetros a estimar.

Hipóteses: retornos normais (ou t), volatilidade constante (ou estimada por GARCH).

Ponto forte: rápido, analítico, fácil de implementar.

Ponto fraco: se os retornos não forem normais (e geralmente não são!), subestima o risco nas caudas.

2. VaR Histórico

Usa a distribuição empírica dos retornos — não assume nenhuma forma paramétrica:

  1. Colete os \(T\) retornos históricos: \(r_1, r_2, \ldots, r_T\)
  2. Ordene do menor ao maior
  3. O VaR \(\alpha\) é o quantil \((1 - \alpha)\) da distribuição empírica

Exemplo: com 1000 retornos e \(\alpha = 95\%\), o VaR é o 50º menor retorno.

Ponto forte: não assume distribuição — captura caudas pesadas naturalmente.

Ponto fraco: depende da janela histórica escolhida e assume que o futuro será como o passado.

3. VaR Monte Carlo

  1. Estime os parâmetros da distribuição dos retornos (ex: GARCH para volatilidade)
  2. Simule \(N\) cenários futuros (tipicamente \(N = 10{,}000\) ou mais)
  3. Calcule a perda do portfólio em cada cenário
  4. O VaR é o quantil da distribuição simulada

Ponto forte: o mais flexível — permite não-linearidades, opções, portfólios complexos.

Ponto fraco: computacionalmente custoso e depende das hipóteses do modelo usado para simular.

Comparativo

Método Hipóteses Complexidade Flexibilidade Quando usar
Paramétrico Distribuição conhecida Baixa Baixa Portfólios lineares simples
Histórico Nenhuma explícita Baixa Média Primeira estimativa, portfólios simples
Monte Carlo Modelo paramétrico Alta Alta Portfólios com opções, não-linearidades

Normal vs. t de Student: Por que a Distribuição Importa

A escolha da distribuição tem impacto direto no VaR calculado. A distribuição normal subestima a probabilidade de eventos extremos — as “caudas” da distribuição real são mais pesadas.

Por que a normal falha?

Retornos financeiros apresentam excesso de curtose (curtose > 3): eventos extremos ocorrem com frequência muito maior do que a normal prevê. A distribuição t de Student, com seu parâmetro de graus de liberdade \(\nu\), consegue modelar essas caudas pesadas:

  • \(\nu = 4\): caudas muito pesadas (mercados emergentes, criptos)
  • \(\nu = 8\): caudas moderadamente pesadas (ações de mercados desenvolvidos)
  • \(\nu \to \infty\): converge para a normal

Comparação visual: Normal vs. t de Student

DicaExperimente!
  • Com \(\nu = 5\): as caudas da t são muito mais pesadas — o VaR pode ser 30–50% maior que o da normal
  • Com \(\nu = 30\): as distribuições ficam quase idênticas — a t converge para a normal
  • Aumente a confiança para 99%: a diferença entre normal e t se amplifica nas caudas extremas
  • Usar normal quando os dados são t-Student subestima o risco nos cenários mais críticos

Impacto prático no VaR

Distribuição VaR 95% (em σ) VaR 99% (em σ) Quando usar
Normal 1.645 2.326 Baseline, estimativa rápida
t (ν=5) 2.015 3.365 Ações, mercados emergentes
t (ν=4) 2.132 3.747 Criptomoedas, alta volatilidade
t (ν=8) 1.860 2.896 Mercados desenvolvidos, FX
ImportanteRegra prática

Na dúvida, use t de Student. É sempre mais conservador que a normal, e o custo de superestimar o risco (manter um pouco mais de capital) é muito menor que o custo de subestimá-lo (perdas não cobertas). A maioria das mesas de risco usa t com \(\nu\) entre 4 e 8.

Horizonte Temporal: A Regra do \(\sqrt{k}\)

Até aqui calculamos o VaR de 1 dia. Como estimar o VaR para um horizonte de \(k\) dias a partir do VaR diário?

Se os retornos diários forem i.i.d. com variância \(\sigma^2\), a variância do retorno acumulado em \(k\) dias é \(k\sigma^2\) (porque variâncias somam para variáveis independentes). Logo, o desvio padrão escala com \(\sqrt{k}\):

Regra do \(\sqrt{k}\) \[\text{VaR}_\alpha(k\text{ dias}) = \sqrt{k} \cdot \text{VaR}_\alpha(1\text{ dia})\]

Exemplo: se o VaR diário é R$ 100 mil, o VaR 10 dias (horizonte regulatório de Basileia) é \(\sqrt{10} \cdot 100 \approx R\$ 316\) mil — não 10 × 100 = R$ 1 milhão.

CuidadoAtenção às hipóteses

A regra \(\sqrt{k}\) exige retornos i.i.d. e é quase sempre usada como aproximação. Ela quebra quando: - Há autocorrelação nos retornos (raro em ações, comum em títulos) - A volatilidade é heterocedástica (GARCH) e o horizonte é longo o suficiente para a volatilidade reverter à média - Há efeitos de iliquidez que aparecem apenas em horizontes longos

Para GARCH, a fórmula correta usa a previsão multi-passo de \(h_t\); \(\sqrt{k}\) tende a superestimar o VaR quando a volatilidade atual está acima da média de longo prazo, e a subestimar quando está abaixo.

VaR de Portfólio: O Papel da Correlação

Para um portfólio com dois ativos \(A\) e \(B\) com pesos \(w_A, w_B\), a variância é

\[\sigma_P^2 = w_A^2 \sigma_A^2 + w_B^2 \sigma_B^2 + 2 w_A w_B \rho_{AB} \sigma_A \sigma_B,\]

e o VaR paramétrico do portfólio torna-se uma função direta dessa variância. Uma forma prática, quando os VaRs individuais já foram calculados (\(\text{VaR}_i = -z_\alpha \sigma_i W_i\)), é:

VaR de portfólio com dois ativos \[\text{VaR}_P = \sqrt{\text{VaR}_A^2 + \text{VaR}_B^2 + 2 \rho_{AB}\, \text{VaR}_A \text{VaR}_B}\]

Três casos limites:

Correlação VaR do portfólio Interpretação
\(\rho = +1\) \(\text{VaR}_A + \text{VaR}_B\) Nenhuma diversificação: os ativos se movem juntos
\(\rho = 0\) \(\sqrt{\text{VaR}_A^2 + \text{VaR}_B^2}\) Diversificação “clássica”
\(\rho = -1\) \(\lvert \text{VaR}_A - \text{VaR}_B \rvert\) Diversificação máxima: hedge quase perfeito

Benefício de diversificação

\[\text{Benefício} = (\text{VaR}_A + \text{VaR}_B) - \text{VaR}_P\] Para \(\rho < 1\), o benefício é positivo — a soma dos VaRs individuais superestima o risco do portfólio. Em portfólios de \(n\) ativos, a fórmula se generaliza via a matriz de covariância:

\[\text{VaR}_P = z_\alpha \sqrt{\mathbf{w}^\top \Sigma \mathbf{w}} \cdot W\]

Correção para Caudas Pesadas: VaR com \(t\)-Student

Quando se usa a distribuição \(t\)-Student com \(\nu\) graus de liberdade, é importante lembrar que a variância da \(t\) padrão não é 1, mas sim \(\nu/(\nu-2)\). Para manter consistência com \(\sigma\) estimado em unidades “normais”, o VaR paramétrico com \(t\) é

VaR paramétrico com \(t\)-Student (variância reescalada) \[\text{VaR}_\alpha = -\left( \mu + t^*_\nu(1-\alpha) \cdot \sigma \cdot \sqrt{\frac{\nu-2}{\nu}} \right) \cdot W\]

onde \(t^*_\nu(1-\alpha)\) é o quantil da \(t\)-Student padrão. O fator \(\sqrt{(\nu-2)/\nu}\) corrige a escala para que \(\sigma\) continue representando o desvio padrão amostral. Esquecer essa correção é uma fonte comum de erro de implementação — e leva a VaRs sistematicamente superestimados.

Expected Shortfall (CVaR)

Limitação fundamental do VaR

O VaR diz qual é o limiar de perda, mas não diz nada sobre o que acontece além desse limiar. Dois portfólios podem ter o mesmo VaR 95%, mas perdas completamente diferentes nos 5% piores cenários.

Expected Shortfall (ES) \[\text{ES}_\alpha = E[L \mid L > \text{VaR}_\alpha]\]

O ES é a perda média nos cenários em que o VaR é violado. Ele responde: “Quando as coisas dão errado, quão errado elas dão em média?”

ImportantePor que o ES é preferido ao VaR?

O ES é uma medida coerente de risco — satisfaz a propriedade de subaditividade: \(\text{ES}(A + B) \leq \text{ES}(A) + \text{ES}(B)\). Isso garante que diversificação sempre reduz o ES. O VaR não é coerente e pode violar essa propriedade. Por isso, o Basileia III (2013) adotou o ES como medida padrão para capital regulatório.

Backtesting de VaR

Como saber se o VaR está bom?

Compare as violações observadas (dias em que a perda superou o VaR) com as violações esperadas. Para VaR 95% em 250 dias úteis: esperamos \(250 \times 0.05 = 12.5\) violações.

Teste O que avalia Hipótese nula
Kupiec (POF) A frequência de violações é consistente com \(\alpha\)? A taxa de violação é igual a \((1-\alpha)\)
Christoffersen As violações são independentes? As violações não vêm em clusters

O Semáforo de Basileia

O Comitê de Basileia classifica modelos VaR com base no número de violações em 250 dias (VaR 99%):

Zona Violações (VaR 99%, 250 dias) Ação
Verde 0–4 Modelo aceito
Amarela 5–9 Investigação necessária
Vermelha 10+ Modelo rejeitado, penalidade de capital

Caso: Comitê de Risco

Você apresenta o VaR diário do fundo para o comitê de risco. Nos últimos 250 dias:

  • VaR 99%: houve 8 violações (esperado: 2.5)

O comitê pergunta: “O modelo está subestimando o risco?”

Análise com o teste de Kupiec:

  • \(H_0\): taxa de violação = 1% (modelo correto)
  • Taxa observada: \(8/250 = 3.2\%\)
  • Isso está na zona amarela de Basileia — a taxa é mais que o triplo do esperado
  • Probabilidade de observar 8+ violações por acaso (se o modelo estivesse correto) é muito baixa

Recomendação: investigar se (a) a distribuição assumida subestima as caudas (trocar normal por t?), (b) a volatilidade está sendo subestimada (usar GARCH em vez de volatilidade fixa?), (c) há correlações não capturadas entre ativos.

Quizzes: Teste seu Entendimento

“Em condições normais de mercado, esperamos que a perda diária do portfólio não exceda R$ 100 mil em 95% dos dias de negociação.” Equivalentemente: em 1 a cada 20 dias úteis (cerca de uma vez por mês), a perda pode ser maior que R$ 100 mil. O VaR não diz quão grande será a perda nesses dias — para isso, usamos o Expected Shortfall.

VaR Paramétrico com volatilidade condicional. O GARCH fornece uma estimativa de \(\sigma_t\) que muda ao longo do tempo, mas o VaR ainda é calculado como \(\text{VaR} = -(\mu + z_\alpha \cdot \sigma_t) \cdot W\), usando uma distribuição paramétrica (normal ou t). A diferença é que \(\sigma_t\) agora é dinâmica e se adapta a períodos de alta e baixa volatilidade, tornando o VaR mais responsivo a mudanças de regime.

Sempre maior (ou igual, no limite). O ES é a perda média nos cenários em que o VaR é violado. Como o VaR é o limiar desses cenários, a média das perdas nesses cenários é necessariamente \(\geq\) ao próprio limiar. Para a distribuição normal: \(\text{ES}_{95\%} \approx 2.06\sigma\) enquanto \(\text{VaR}_{95\%} \approx 1.65\sigma\). Para distribuições com caudas mais pesadas (t de Student), a diferença entre ES e VaR é ainda maior.

Esperado: \(500 \times 0.01 = 5\) violações. Observado: 15, ou seja, 3x mais que o esperado. Isso é um sinal forte de que o modelo está subestimando o risco. Pelo teste de Kupiec, a probabilidade de observar 15 ou mais violações por acaso (se o modelo estivesse correto) é extremamente baixa (\(p < 0.001\)). Ações: revisar a distribuição (trocar normal por t?), recalibrar a volatilidade (GARCH?), verificar correlações.

Não! Se os ativos não forem perfeitamente correlacionados (\(\rho < 1\)), o VaR do portfólio será menor que a soma dos VaR individuais — este é o efeito da diversificação. Apenas se \(\rho = 1\) (correlação perfeita) o VaR do portfólio será exatamente R$ 100 mil. Na prática, a diversificação reduz o risco. Note, porém, que esta propriedade nem sempre vale para o VaR (ele não é subaditivo) — um caso raro, mas possível, onde VaR(A+B) > VaR(A) + VaR(B). Esse é um dos motivos pelos quais o ES (que é subaditivo) é preferido.

Pela regra do \(\sqrt{k}\) (válida se os retornos forem i.i.d.): \(\text{VaR}(10) = \sqrt{10} \cdot 80{,}000 \approx R\$ 253{,}000\). Não é 10 × 80 mil = R$ 800 mil — esse seria o caso se a variância escalasse linearmente, o que só aconteceria com correlação perfeita entre dias. A intuição: perdas ruins em um dia tendem a ser compensadas por outros dias, de modo que o desvio padrão cresce com \(\sqrt{k}\), não com \(k\). Atenção: a regra falha se há autocorrelação nos retornos, clusters de volatilidade significativos ou horizonte muito longo.

\[\text{VaR}_P = \sqrt{60^2 + 40^2 + 2 \cdot 0{,}3 \cdot 60 \cdot 40} = \sqrt{3600 + 1600 + 1440} = \sqrt{6640} \approx R\$ 81{,}5 \text{ mil}\]

Comparado à soma bruta (R$ 100 mil), há um benefício de diversificação de ~R$ 18,5 mil. Se a correlação fosse 1, o VaR seria exatamente R$ 100 mil; se fosse 0, seria \(\sqrt{60^2 + 40^2} \approx R\$ 72{,}1\) mil; se fosse −1, seria apenas R$ 20 mil. A correlação é o principal driver do benefício de diversificação — e mede o quanto os ativos “se movem juntos” em termos lineares.

Para Saber Mais

  • McNeil, A.J., Frey, R., & Embrechts, P. (2015). Quantitative Risk Management. Cap. 2 e 4.
  • Jorion, P. (2007). Value at Risk. 3rd ed. McGraw-Hill.
  • Dowd, K. (2005). Measuring Market Risk. 2nd ed. Wiley.
De volta ao topo