Aula 5: VaR e Gestão de Risco
Quantificando perdas potenciais
Objetivos de Aprendizagem
- Definir VaR e Expected Shortfall formalmente
- Calcular VaR usando três abordagens (paramétrico, histórico, Monte Carlo)
- Avaliar a qualidade do VaR via backtesting
- Aplicar esses conceitos a um portfólio real
Value at Risk (VaR)
O que é VaR?
O VaR é provavelmente a medida de risco mais usada na indústria financeira. Ele responde a uma pergunta simples e poderosa:
“Qual é a perda máxima que posso esperar, com um certo nível de confiança, em um determinado horizonte de tempo?”
Exemplo: “Com 95% de confiança, não perderemos mais que R$ 2 milhões nos próximos 10 dias.”
Definição Formal do VaR \[P(L > \text{VaR}_\alpha) = 1 - \alpha\]
onde \(L\) é a perda do portfólio, \(\alpha\) é o nível de confiança (tipicamente 95% ou 99%) e o horizonte temporal deve ser especificado (1 dia, 10 dias, etc.).
Visualizando o VaR
O VaR é simplesmente um quantil da distribuição de perdas:
DicaExperimente!
- Aumente a confiança para 99%: o VaR se desloca para a esquerda (perda maior), cobrindo cenários mais extremos
- Aumente a volatilidade: toda a distribuição se alarga, e o VaR cresce proporcionalmente
- Note que o ES (linha amarela) está sempre à esquerda do VaR — ele captura a perda média nos cenários mais extremos
Três Abordagens para Calcular VaR
1. VaR Paramétrico (Variância-Covariância)
Assume que os retornos seguem uma distribuição conhecida (tipicamente normal ou t de Student):
VaR Paramétrico — caso normal \[\text{VaR}_\alpha = -(\mu + z_\alpha \cdot \sigma) \cdot W\]
onde \(z_\alpha\) é o quantil da distribuição normal (\(z_{0.95} = -1.645\), \(z_{0.99} = -2.326\)) e \(W\) é o valor do portfólio.
NotaPosição comprada vs. posição vendida
A fórmula acima vale para uma posição comprada (long): você perde se o ativo cai, e o VaR usa a cauda esquerda da distribuição de retornos. Numa posição vendida (short), a lógica inverte — você perde se o ativo sobe, e o VaR usa a cauda direita:
\[\text{VaR}_\alpha^{\text{short}} = (\mu + z_{1-\alpha} \cdot \sigma) \cdot W\]
Para uma normal simétrica as magnitudes são iguais; para distribuições assimétricas (skewed-\(t\)), os dois lados precisam ser calculados separadamente.
Conexão com a Aula 4: RiskMetrics como VaR paramétrico
O RiskMetrics™ (visto na Aula 4) é exatamente um VaR paramétrico com \(\mu = 0\), distribuição normal e \(\sigma_t\) estimado por IGARCH/EWMA:
\[\text{VaR}_{\alpha,t}^{\text{RM}} = -z_\alpha \cdot \sqrt{h_t}, \qquad h_t = \lambda h_{t-1} + (1-\lambda) r_{t-1}^2\]
É por isso que o RiskMetrics virou o baseline regulatório: é um VaR paramétrico com uma recursão simples de volatilidade e zero parâmetros a estimar.
Hipóteses: retornos normais (ou t), volatilidade constante (ou estimada por GARCH).
Ponto forte: rápido, analítico, fácil de implementar.
Ponto fraco: se os retornos não forem normais (e geralmente não são!), subestima o risco nas caudas.
2. VaR Histórico
Usa a distribuição empírica dos retornos — não assume nenhuma forma paramétrica:
- Colete os \(T\) retornos históricos: \(r_1, r_2, \ldots, r_T\)
- Ordene do menor ao maior
- O VaR \(\alpha\) é o quantil \((1 - \alpha)\) da distribuição empírica
Exemplo: com 1000 retornos e \(\alpha = 95\%\), o VaR é o 50º menor retorno.
Ponto forte: não assume distribuição — captura caudas pesadas naturalmente.
Ponto fraco: depende da janela histórica escolhida e assume que o futuro será como o passado.
3. VaR Monte Carlo
- Estime os parâmetros da distribuição dos retornos (ex: GARCH para volatilidade)
- Simule \(N\) cenários futuros (tipicamente \(N = 10{,}000\) ou mais)
- Calcule a perda do portfólio em cada cenário
- O VaR é o quantil da distribuição simulada
Ponto forte: o mais flexível — permite não-linearidades, opções, portfólios complexos.
Ponto fraco: computacionalmente custoso e depende das hipóteses do modelo usado para simular.
Comparativo
| Método | Hipóteses | Complexidade | Flexibilidade | Quando usar |
|---|---|---|---|---|
| Paramétrico | Distribuição conhecida | Baixa | Baixa | Portfólios lineares simples |
| Histórico | Nenhuma explícita | Baixa | Média | Primeira estimativa, portfólios simples |
| Monte Carlo | Modelo paramétrico | Alta | Alta | Portfólios com opções, não-linearidades |
Normal vs. t de Student: Por que a Distribuição Importa
A escolha da distribuição tem impacto direto no VaR calculado. A distribuição normal subestima a probabilidade de eventos extremos — as “caudas” da distribuição real são mais pesadas.
Por que a normal falha?
Retornos financeiros apresentam excesso de curtose (curtose > 3): eventos extremos ocorrem com frequência muito maior do que a normal prevê. A distribuição t de Student, com seu parâmetro de graus de liberdade \(\nu\), consegue modelar essas caudas pesadas:
- \(\nu = 4\): caudas muito pesadas (mercados emergentes, criptos)
- \(\nu = 8\): caudas moderadamente pesadas (ações de mercados desenvolvidos)
- \(\nu \to \infty\): converge para a normal
Comparação visual: Normal vs. t de Student
DicaExperimente!
- Com \(\nu = 5\): as caudas da t são muito mais pesadas — o VaR pode ser 30–50% maior que o da normal
- Com \(\nu = 30\): as distribuições ficam quase idênticas — a t converge para a normal
- Aumente a confiança para 99%: a diferença entre normal e t se amplifica nas caudas extremas
- Usar normal quando os dados são t-Student subestima o risco nos cenários mais críticos
Impacto prático no VaR
| Distribuição | VaR 95% (em σ) | VaR 99% (em σ) | Quando usar |
|---|---|---|---|
| Normal | 1.645 | 2.326 | Baseline, estimativa rápida |
| t (ν=5) | 2.015 | 3.365 | Ações, mercados emergentes |
| t (ν=4) | 2.132 | 3.747 | Criptomoedas, alta volatilidade |
| t (ν=8) | 1.860 | 2.896 | Mercados desenvolvidos, FX |
ImportanteRegra prática
Na dúvida, use t de Student. É sempre mais conservador que a normal, e o custo de superestimar o risco (manter um pouco mais de capital) é muito menor que o custo de subestimá-lo (perdas não cobertas). A maioria das mesas de risco usa t com \(\nu\) entre 4 e 8.
Horizonte Temporal: A Regra do \(\sqrt{k}\)
Até aqui calculamos o VaR de 1 dia. Como estimar o VaR para um horizonte de \(k\) dias a partir do VaR diário?
Se os retornos diários forem i.i.d. com variância \(\sigma^2\), a variância do retorno acumulado em \(k\) dias é \(k\sigma^2\) (porque variâncias somam para variáveis independentes). Logo, o desvio padrão escala com \(\sqrt{k}\):
Regra do \(\sqrt{k}\) \[\text{VaR}_\alpha(k\text{ dias}) = \sqrt{k} \cdot \text{VaR}_\alpha(1\text{ dia})\]
Exemplo: se o VaR diário é R$ 100 mil, o VaR 10 dias (horizonte regulatório de Basileia) é \(\sqrt{10} \cdot 100 \approx R\$ 316\) mil — não 10 × 100 = R$ 1 milhão.
CuidadoAtenção às hipóteses
A regra \(\sqrt{k}\) exige retornos i.i.d. e é quase sempre usada como aproximação. Ela quebra quando: - Há autocorrelação nos retornos (raro em ações, comum em títulos) - A volatilidade é heterocedástica (GARCH) e o horizonte é longo o suficiente para a volatilidade reverter à média - Há efeitos de iliquidez que aparecem apenas em horizontes longos
Para GARCH, a fórmula correta usa a previsão multi-passo de \(h_t\); \(\sqrt{k}\) tende a superestimar o VaR quando a volatilidade atual está acima da média de longo prazo, e a subestimar quando está abaixo.
VaR de Portfólio: O Papel da Correlação
Para um portfólio com dois ativos \(A\) e \(B\) com pesos \(w_A, w_B\), a variância é
\[\sigma_P^2 = w_A^2 \sigma_A^2 + w_B^2 \sigma_B^2 + 2 w_A w_B \rho_{AB} \sigma_A \sigma_B,\]
e o VaR paramétrico do portfólio torna-se uma função direta dessa variância. Uma forma prática, quando os VaRs individuais já foram calculados (\(\text{VaR}_i = -z_\alpha \sigma_i W_i\)), é:
VaR de portfólio com dois ativos \[\text{VaR}_P = \sqrt{\text{VaR}_A^2 + \text{VaR}_B^2 + 2 \rho_{AB}\, \text{VaR}_A \text{VaR}_B}\]
Três casos limites:
| Correlação | VaR do portfólio | Interpretação |
|---|---|---|
| \(\rho = +1\) | \(\text{VaR}_A + \text{VaR}_B\) | Nenhuma diversificação: os ativos se movem juntos |
| \(\rho = 0\) | \(\sqrt{\text{VaR}_A^2 + \text{VaR}_B^2}\) | Diversificação “clássica” |
| \(\rho = -1\) | \(\lvert \text{VaR}_A - \text{VaR}_B \rvert\) | Diversificação máxima: hedge quase perfeito |
Benefício de diversificação
\[\text{Benefício} = (\text{VaR}_A + \text{VaR}_B) - \text{VaR}_P\] Para \(\rho < 1\), o benefício é positivo — a soma dos VaRs individuais superestima o risco do portfólio. Em portfólios de \(n\) ativos, a fórmula se generaliza via a matriz de covariância:
\[\text{VaR}_P = z_\alpha \sqrt{\mathbf{w}^\top \Sigma \mathbf{w}} \cdot W\]
Correção para Caudas Pesadas: VaR com \(t\)-Student
Quando se usa a distribuição \(t\)-Student com \(\nu\) graus de liberdade, é importante lembrar que a variância da \(t\) padrão não é 1, mas sim \(\nu/(\nu-2)\). Para manter consistência com \(\sigma\) estimado em unidades “normais”, o VaR paramétrico com \(t\) é
VaR paramétrico com \(t\)-Student (variância reescalada) \[\text{VaR}_\alpha = -\left( \mu + t^*_\nu(1-\alpha) \cdot \sigma \cdot \sqrt{\frac{\nu-2}{\nu}} \right) \cdot W\]
onde \(t^*_\nu(1-\alpha)\) é o quantil da \(t\)-Student padrão. O fator \(\sqrt{(\nu-2)/\nu}\) corrige a escala para que \(\sigma\) continue representando o desvio padrão amostral. Esquecer essa correção é uma fonte comum de erro de implementação — e leva a VaRs sistematicamente superestimados.
Expected Shortfall (CVaR)
Limitação fundamental do VaR
O VaR diz qual é o limiar de perda, mas não diz nada sobre o que acontece além desse limiar. Dois portfólios podem ter o mesmo VaR 95%, mas perdas completamente diferentes nos 5% piores cenários.
Expected Shortfall (ES) \[\text{ES}_\alpha = E[L \mid L > \text{VaR}_\alpha]\]
O ES é a perda média nos cenários em que o VaR é violado. Ele responde: “Quando as coisas dão errado, quão errado elas dão em média?”
ImportantePor que o ES é preferido ao VaR?
O ES é uma medida coerente de risco — satisfaz a propriedade de subaditividade: \(\text{ES}(A + B) \leq \text{ES}(A) + \text{ES}(B)\). Isso garante que diversificação sempre reduz o ES. O VaR não é coerente e pode violar essa propriedade. Por isso, o Basileia III (2013) adotou o ES como medida padrão para capital regulatório.
Backtesting de VaR
Como saber se o VaR está bom?
Compare as violações observadas (dias em que a perda superou o VaR) com as violações esperadas. Para VaR 95% em 250 dias úteis: esperamos \(250 \times 0.05 = 12.5\) violações.
| Teste | O que avalia | Hipótese nula |
|---|---|---|
| Kupiec (POF) | A frequência de violações é consistente com \(\alpha\)? | A taxa de violação é igual a \((1-\alpha)\) |
| Christoffersen | As violações são independentes? | As violações não vêm em clusters |
O Semáforo de Basileia
O Comitê de Basileia classifica modelos VaR com base no número de violações em 250 dias (VaR 99%):
| Zona | Violações (VaR 99%, 250 dias) | Ação |
|---|---|---|
| Verde | 0–4 | Modelo aceito |
| Amarela | 5–9 | Investigação necessária |
| Vermelha | 10+ | Modelo rejeitado, penalidade de capital |
Caso: Comitê de Risco
Você apresenta o VaR diário do fundo para o comitê de risco. Nos últimos 250 dias:
- VaR 99%: houve 8 violações (esperado: 2.5)
O comitê pergunta: “O modelo está subestimando o risco?”
Análise com o teste de Kupiec:
- \(H_0\): taxa de violação = 1% (modelo correto)
- Taxa observada: \(8/250 = 3.2\%\)
- Isso está na zona amarela de Basileia — a taxa é mais que o triplo do esperado
- Probabilidade de observar 8+ violações por acaso (se o modelo estivesse correto) é muito baixa
Recomendação: investigar se (a) a distribuição assumida subestima as caudas (trocar normal por t?), (b) a volatilidade está sendo subestimada (usar GARCH em vez de volatilidade fixa?), (c) há correlações não capturadas entre ativos.
Quizzes: Teste seu Entendimento
CuidadoQuestão 1: O VaR 95% diário de um portfólio é R$ 100 mil. Qual a interpretação exata?
“Em condições normais de mercado, esperamos que a perda diária do portfólio não exceda R$ 100 mil em 95% dos dias de negociação.” Equivalentemente: em 1 a cada 20 dias úteis (cerca de uma vez por mês), a perda pode ser maior que R$ 100 mil. O VaR não diz quão grande será a perda nesses dias — para isso, usamos o Expected Shortfall.
CuidadoQuestão 2: Se você estima VaR usando GARCH em vez de volatilidade histórica, qual abordagem você está usando?
VaR Paramétrico com volatilidade condicional. O GARCH fornece uma estimativa de \(\sigma_t\) que muda ao longo do tempo, mas o VaR ainda é calculado como \(\text{VaR} = -(\mu + z_\alpha \cdot \sigma_t) \cdot W\), usando uma distribuição paramétrica (normal ou t). A diferença é que \(\sigma_t\) agora é dinâmica e se adapta a períodos de alta e baixa volatilidade, tornando o VaR mais responsivo a mudanças de regime.
CuidadoQuestão 3: O Expected Shortfall 95% é sempre maior, menor ou igual ao VaR 95%?
Sempre maior (ou igual, no limite). O ES é a perda média nos cenários em que o VaR é violado. Como o VaR é o limiar desses cenários, a média das perdas nesses cenários é necessariamente \(\geq\) ao próprio limiar. Para a distribuição normal: \(\text{ES}_{95\%} \approx 2.06\sigma\) enquanto \(\text{VaR}_{95\%} \approx 1.65\sigma\). Para distribuições com caudas mais pesadas (t de Student), a diferença entre ES e VaR é ainda maior.
CuidadoQuestão 4: Em 500 dias, o VaR 99% teve 15 violações. Isso parece adequado?
Esperado: \(500 \times 0.01 = 5\) violações. Observado: 15, ou seja, 3x mais que o esperado. Isso é um sinal forte de que o modelo está subestimando o risco. Pelo teste de Kupiec, a probabilidade de observar 15 ou mais violações por acaso (se o modelo estivesse correto) é extremamente baixa (\(p < 0.001\)). Ações: revisar a distribuição (trocar normal por t?), recalibrar a volatilidade (GARCH?), verificar correlações.
CuidadoQuestão 5: Um portfólio com 2 ativos tem VaR individual de R$ 50 mil cada. O VaR do portfólio é necessariamente R$ 100 mil?
Não! Se os ativos não forem perfeitamente correlacionados (\(\rho < 1\)), o VaR do portfólio será menor que a soma dos VaR individuais — este é o efeito da diversificação. Apenas se \(\rho = 1\) (correlação perfeita) o VaR do portfólio será exatamente R$ 100 mil. Na prática, a diversificação reduz o risco. Note, porém, que esta propriedade nem sempre vale para o VaR (ele não é subaditivo) — um caso raro, mas possível, onde VaR(A+B) > VaR(A) + VaR(B). Esse é um dos motivos pelos quais o ES (que é subaditivo) é preferido.
CuidadoQuestão 6: O VaR 1 dia de um portfólio é R$ 80 mil. Qual o VaR 10 dias aproximado?
Pela regra do \(\sqrt{k}\) (válida se os retornos forem i.i.d.): \(\text{VaR}(10) = \sqrt{10} \cdot 80{,}000 \approx R\$ 253{,}000\). Não é 10 × 80 mil = R$ 800 mil — esse seria o caso se a variância escalasse linearmente, o que só aconteceria com correlação perfeita entre dias. A intuição: perdas ruins em um dia tendem a ser compensadas por outros dias, de modo que o desvio padrão cresce com \(\sqrt{k}\), não com \(k\). Atenção: a regra falha se há autocorrelação nos retornos, clusters de volatilidade significativos ou horizonte muito longo.
CuidadoQuestão 7: Dois ativos têm VaR 95% individual de R$ 60 mil e R$ 40 mil, com correlação \(\rho = 0{,}3\). Qual o VaR do portfólio?
\[\text{VaR}_P = \sqrt{60^2 + 40^2 + 2 \cdot 0{,}3 \cdot 60 \cdot 40} = \sqrt{3600 + 1600 + 1440} = \sqrt{6640} \approx R\$ 81{,}5 \text{ mil}\]
Comparado à soma bruta (R$ 100 mil), há um benefício de diversificação de ~R$ 18,5 mil. Se a correlação fosse 1, o VaR seria exatamente R$ 100 mil; se fosse 0, seria \(\sqrt{60^2 + 40^2} \approx R\$ 72{,}1\) mil; se fosse −1, seria apenas R$ 20 mil. A correlação é o principal driver do benefício de diversificação — e mede o quanto os ativos “se movem juntos” em termos lineares.
Para Saber Mais
- McNeil, A.J., Frey, R., & Embrechts, P. (2015). Quantitative Risk Management. Cap. 2 e 4.
- Jorion, P. (2007). Value at Risk. 3rd ed. McGraw-Hill.
- Dowd, K. (2005). Measuring Market Risk. 2nd ed. Wiley.