A heterocedasticidade é um conceito fundamental na análise de dados estatísticos e econômicos, especialmente em modelos de regressão. Esse termo refere-se à situação em que a variância dos erros de um modelo estatístico não é constante em relação às variáveis explicativas. Em outras palavras, a dispersão dos erros não é uniforme em toda a extensão das variáveis independentes. Isso pode levar a problemas na estimação dos parâmetros do modelo e na interpretação dos resultados.
Para compreender melhor a heterocedasticidade, é útil considerar um exemplo. Suponha que estejamos interessados em examinar a relação entre o salário dos funcionários de uma empresa e seu nível de educação, idade e experiência profissional. Utilizamos um modelo de regressão para estimar essa relação, mas ao analisar os resíduos do modelo, percebemos que a variância dos erros aumenta à medida que o salário médio dos funcionários aumenta. Isso indica a presença de heterocedasticidade nos dados.
Existem várias causas potenciais para a heterocedasticidade. Uma delas é a presença de outliers nos dados, ou seja, observações que se desviam significativamente da tendência geral dos dados. Outra causa pode ser a especificação incorreta do modelo, onde a relação funcional entre as variáveis não é adequadamente capturada.
Os efeitos da heterocedasticidade podem ser problemáticos. Por exemplo, os estimadores de mínimos quadrados ordinários (MQO), comumente usados em modelos de regressão, podem produzir estimativas imprecisas e ineficientes quando os erros são heterocedásticos. Isso pode levar a erros padrão incorretos, o que por sua vez afeta a inferência estatística sobre os parâmetros do modelo.
Felizmente, existem várias técnicas para lidar com a heterocedasticidade. Uma abordagem comum é a utilização de estimadores robustos, como os estimadores de mínimos quadrados generalizados (MQG), que são menos sensíveis à presença de heterocedasticidade. Além disso, é possível transformar as variáveis envolvidas no modelo para estabilizar a variância dos erros.
É importante identificar e corrigir a heterocedasticidade, pois ela pode distorcer as conclusões e interpretações tiradas a partir do modelo estatístico. Portanto, os analistas de dados devem estar atentos à possibilidade desse fenômeno e utilizar as técnicas apropriadas para mitigar seus efeitos, garantindo assim a robustez e confiabilidade das análises estatísticas realizadas.
1. Heterocedasticidade
Econometria
Alexandre Gori Maia
Bibliografia Básica:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 12.
Ementa:
• Definição;
• Identificação: Análise Gráfica, Goldfeld-Quandt, Breusch-Pagan, White;
• Correção: MQP e MQGF;
• Estimadores Robustos para a Variância;
2. Teorema de Gauss-Markov
1) Relação linear entre os regressores x e Y:
O modelo só é válido para relações lineares.
2) Os valores de x são fixos em repetidas amostras, não aleatórios:
Quem varia é o regressando, o regressor é fixo, qualquer que seja a amostra. Em
outras palavras, dados os valores controlados de x, Y variará aleatoriamente
segundo uma distribuição de probabilidade, com valor esperado dado por E(Y|x).
3) Esperança condicional dos erros igual a zero, ou seja, E(e|x)=0:
É a mesma coisa afirmar que E(Y|x)=xi´b.
4) A variabilidade dos erros é constante, ou seja, E(ei
2)=s2
Os erros são homocedásticos, ou seja, sua variância é uma constante.
5) Os erros são não autocorrelacionados, ou seja, E(eiej)=0:
Não há relação entre valores dos erros.
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
3. Heterocedasticidade - Definição
Homocedasticidade
Homocedasticidade:
A variância dos erros e, condicionada aos valores das variáveis explanatórias, será
constante.
Heterocedasticidade:
A variância dos erros será diferente para cada valor condicional de Xji.
2
2
1 )
,...,
,
/
( s
=
i
i
i k
i X
X
X
e
Var
Heterocedasticidade
2
2
1 )
,...,
,
/
( i
k
i i
i
i
X
X
X
e
Var s
=
Y
Xj
X1
E(Y1)
X2
E(Y2)
Var(e2)=s2
Var(e1)=s2
Y
Xj
X1 X2
Var(e2)=s2
2
E(Y1)
Var(e1)=s2
1
E(Y2)
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
4. Heterocedasticidade - Causas
Principais causas da heterocedasticidade:
- Natureza das variáveis: alguns relacionamentos apresentam tipicamente
tendência à heterocedasticia. Por exemplo, renda e poupança.
- Valores extremos: a ocorrência de um valor extremo na amostra pode inflacionar
a variabilidade em um determinado ponto do ajuste.
- Falhas na especificação do modelo: a heterocedasticidade pode também ser
devida à omissão de importantes variáveis no modelo.
- Transformação dos dados: a transformação das variáveis (por exemplo,
proporção ao invés de valores absolutos) ou da forma funcional (modelo log-duplo
ao invés de linear) pode eliminar a heterocedasticidade.
2
)
( i
i
e
Var s
=
i
i
i e
X
Y +
+
= b
a
i
i
i e
X
Y +
+
= b
a i
i
i
i e
X
X
Y +
+
+
= 2
2
1 b
b
a
i
i
i e
X
Y +
+
= b
a i
i
i e
X
Y +
+
= )
ln(
)
ln( b
a
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
5. Consequências - Ineficiência
Ineficiência dos Estimadores de MQO
Na presenção de heterocedasticidade nos erros, os estimadores de MQO continuam
sendo não viesados e consistentes, mas deixam de ser eficientes (ou seja, não
possuem mais variância mínima). Em outras palavras, seja b o estimador de
MQO, então existe outro estimador b* tal que:
Homocedasticia
Y
X
Intervalo de
Variação das
estimativas de
MQO
Intervalo de
Variação das
estimativas de
outro método
Heterocedasticia
Y
X
Intervalo de
Variação das
estimativas de
MQO
Intervalo de
Variação das
estimativas de
um método
mais eficiente
)
ˆ
(
*)
ˆ
( b
b Var
Var <
^
^
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
6. Consequências – Tendenciosidade
Tendenciosidade da Variância dos Estimadores:
Outra importante consequência da heterocedasticidade é o viés do estimador da
variância de !
", mesmo para amostras grandes (inconsistência). Como resultado, as
estatísticas de teste t e F deixam de ser válidas, pois dependem da variância do
estimador. Em outras palavras, na presença de heterocedasticidade teremos:
Seja o modelo: i
i
i e
X
Y +
+
= b
a
Pelo MQO:
å
å
=
=
= n
i
2
i
n
i i
i
x
y
x
1
1
b̂ e
å=
= n
i
2
i
x
S
1
2
2
ˆ
ŝ
b
No caso de
heterocedasticia:
No caso de
homocedasticia:
não viesado na ausência de
heterocedasticidade e
viesado na sua presença
)
ˆ
(
)
( 2
ˆ b
b
Var
S
E ¹
2
)
( s
=
i
e
Var
å =
= n
i i
x
Var
1
2
2
)
ˆ
(
s
b
2
)
( i
i
e
Var s
=
2
1
2
1
2
2
)
(
)
ˆ
(
å
å
=
=
= n
i i
n
i i
i
x
x
Var
s
b
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
7. Identificação
Principais testes para se detectar a heterocedasticidade:
Análise gráfica: ê2 ´ Xj
Teste Goldfeld-Quandt
Identificação
Testes
Estatísticos
Teste de Breusch-Pagan
Teste de White
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
8. Análise Gráfica
ê2
Homocedasticidade
A dispersão
dos resíduos é
a mesma ao
longo de X
X
ê2
Heterocedasticidade
A dispersão
dos resíduos é
uma função
linear de X
X
ê2
Heterocedasticidade
A dispersão
dos resíduos
é uma função
quadrática de
X
X
ê2
Heterocedasticidade
A dispersão dos
resíduos cresce
de maneira
quadrática com
os valores de X
constante
σ2
=
i
2
2
i X
σ
σ =
2
i
2
i
1
2
i X
α
X
α
σ +
=
2
i
2
2
i X
σ
σ =
X
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
9. Análise Gráfica
Sejam os dados de 40 famílias para gastos com alimentação (Y) e renda (X):
A dispersão dos resíduos em função da variável X (renda) sugere que, à medida que a
renda cresce, a dispersão dos resíduos também aumenta, indicando a presença de
heterocedasticidade, em uma relação aparentemente linear.
i
i
i e
Renda
Aliment
Gasto ˆ
13
,
0
8
,
40 +
+
=
i
2
2
i X
σ
σ =
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
10. Teste de Goldfeld-Quandt
Y
X
Sejam os valores da amostra:
ï
î
ï
í
ì
<
=
2
2
2
1
1
2
2
2
1
0
σ
: σ
H
σ
: σ
H
Passos para efetuar o teste de Goldfeld-Quandt
1- Ordenar as observações da amostra de acordo com os valores de X;
2- Omitir c observações centrais para dar mais poder ao teste (c costuma ser igual a 4 para n=30 e
c=10 para n=60) e separar observações em duas subamostras de (n-c)/2 observações;
3- Ajustar uma regressão para cada subamostra (cada regressão terá k variáveis independentes);
4- Testar hipótese da igualdade dos erros quadráticos médios a partir da estatística F.
Regressão 1
Regressão 2
A omissão de c observações centrais objetiva acentuar a diferença
entre o grupo com variância pequena (SQReg1) e com variância
grande (SQReg2).
gl
SQRes
gl
SQRes
F
/
/
1
2
= )
1
(
2
+
-
-
= k
c
n
gl
onde
gl
gl
F ,
F
p
Y1 Y2 ... Yn
X1 X2 ... Xn Onde: X1<X2<...<Xn
Para testar a hipótese nula da homocedasticia:
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
11. Teste de Goldfeld-Quandt
99
,
4
7
,
526
9
,
2629
ˆ
ˆ
2
1
2
2
=
=
=
s
s
F
Regressão 1
Regressão 2
ï
î
ï
í
ì
<
=
2
2
2
1
1
2
2
2
1
0
σ
: σ
H
σ
: σ
H
Amostra 1
i
i
i e
Renda
Aliment
Gasto ˆ
18
,
0
6
,
12 +
+
=
Das 40 observações originais, foram eliminadas 6
observações centrais para dar mais poder ao teste.
Restaram dois subconjuntos com 17 observações cada.
Amostra 2
i
i
i e
Renda
Aliment
Gasto ˆ
09
,
0
1
,
75 +
+
=
Fonte gl SQ QM F p
Regressão 1 5967,2 5967,2 11,33 0,0042
Resíduos 15 7900,0 526,7
Total 16 13867,2
Fonte gl SQ QM F p
Regressão 1 2308,6 2308,6 0,88 0,3636
Resíduos 15 39449,1 2629,9
Total 16 41757,7
estatística
de teste:
15
,
15
F
99
,
4
0017
,
0
Rejeita-se H0, ou seja, pode-se afirmar
que há diferença entre as variâncias
(heterocedasticidade) com uma
probabilidade de erro de apenas 0,17%
E para calcular a probabilidade de erro do tipo I:
Sejam os gastos de 40 famílias com alimentação em função da renda:
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
12. Teste de Breusch-Pagan
Passos para efetuar o teste de White
1- Estimar os resíduos do ajuste de MQO para o modelo original de RLM;
2- Ajustar um modelo auxiliar relacionando o quadrado dos resíduos às variáveis independentes
do modelo original;
3- Calcular a estatística LM pelo produto do número de observações e o R2 do ajuste auxiliar;
4- Calcular o valor p associado à estatística em uma distribuição c2 com gl dado pelo número de
variáveis explanatórias;
2
aux
R
n
LM ´
=
2
k
c
2
aux
R
n´
p
ê2
Xj
i
i
i
i e
X
X
Y +
+
+
= 2
2
1
1 b
b
a
i
i
i
i u
X
X
e +
+
+
= 2
2
1
1
0
2
ˆ d
d
d
Onde k é o número de
variáveis explanatórias,
R2
aux o coeficiente de
determinação do ajuste
auxiliar e n o número de
observações
î
í
ì
¹
=
=
0
:
0
:
1
2
1
0
j
H
H
d
d
d
Seja o modelo de RLM com k=2:
Par verificarmos se os resíduos quadráticos têm
relação com os regressores:
Para testar a hipótese nula da homocedasticia:
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
13. Teste de Breusch-Pagan - Exemplo
Do ajuste original por MQO obtivemos:
i
i
i e
Renda
Aliment
Gasto ˆ
13
,
0
8
,
40 +
+
=
A partir dos resíduos de MQO, ajustamos o seguinte modelo auxiliar:
i
i
i u
Renda
e ˆ
21
,
5
5
,
279
,
2
ˆ2
+
+
-
=
O teste de hipóteses será dado por:
î
í
ì
¹
=
0
:
0
:
1
1
1
0
d
d
H
H
0
,
12
301
,
0
40
2
=
´
=
´ aux
R
n
2
1
c
0
,
12
0005
,
0
A probabilidade de erro ao rejeitar H0 é de apenas 0,05%. Em
outras palavras, há fortíssimas evidências para afirmarmos que os
erros são heterocedásticos pois ao fazermos tal afirmação
estaríamos sujeitos a uma chance de erro de apenas 0,05%.
Sejam os gastos de 40 famílias com alimentação em função da renda:
301
,
0
2
=
aux
R
i
i
i u
Renda
e +
+
= 1
0
2
ˆ d
d
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
14. Teste de White
Passos para efetuar o teste de White
1- Estimar os resíduos do ajuste de MQO para o modelo original de RLM;
2- Ajustar um modelo auxiliar relacionando o quadrado dos resíduos às variáveis independentes
do modelo original, seus quadrados e produtos cruzados;
3- Calcular a estatística LM pelo produto do número de observações e o R2 do ajuste auxiliar;
4- Calcular o valor p associado à estatística em uma distribuição c2 com gl dado pelo número de
variáveis explanatórias do ajuste auxiliar;
2
aux
R
n
LM ´
=
2
h
c
2
aux
R
n´
p
ê2
Xj
i
i
i
i e
X
X
Y +
+
+
= 2
2
1
1 b
b
a
i
i
i
i
i
i
i
i u
X
X
X
X
X
X
e +
+
+
+
+
+
= 2
2
5
2
1
4
2
1
3
2
2
1
1
0
2
ˆ d
d
d
d
d
d
Onde h é o número de
variáveis explanatórias,
R2
aux o coeficiente de
determinação e n o número
de observações, todos
referentes ao ajuste
auxiliar
î
í
ì
¹
=
=
=
0
:
0
...
:
1
5
1
0
j
H
H
d
d
d
Seja o modelo de RLM com k=2:
Para verificar se os resíduos quadráticos têm relação com os
regressores, seus quadrados e seus produtos cruzados:
Para testar a hipótese nula da homocedasticia:
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan White MQP MQGF
Estimador
Robusto
15. Teste de White - Exemplo
Do ajuste original por MQO obtivemos:
i
i
i e
Renda
Aliment
Gasto ˆ
13
,
0
8
,
40 +
+
=
A partir dos resíduos de MQO, ajustamos o seguinte modelo auxiliar:
O teste de hipóteses será dado por:
2
2
c
58
,
14
A probabilidade de erro ao rejeitar H0 é de apenas 0,07%. Em
outras palavras, há fortíssimas evidências para afirmar que os erros
são heterocedásticos pois, ao fazermos tal afirmação, estaríamos
sujeitos a uma chance de erro de apenas 0,07%.
Sejam os gastos de 40 famílias com alimentação em função da renda:
î
í
ì
¹
=
=
0
:
0
:
1
2
1
0
j
H
H
d
d
d
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan White MQP MQGF
Estimador
Robusto
̂
"#
$
= 1921 − 7,413."/01# + 0,009."/01#
$
+ 4
5#
̂
"#
$
= 67 +68 ."/01# +6$ ."/01#
$
+ 5#
.9:;
$ = 0,365
/×.9:;
$
= 40×0,365 = 14,6 0,0007
16. Correção Heterocedasticidade
Dada a equação de RLM:
2
2
2
1
2
2
2
2
1
0
0
0
0
...
0
0
0
0
0
0
0
0
0
0
0
0
...
0
0
0
0
0
0
0
0
)
(
)
( s
s
s
s
s
V
ee
e =
ú
ú
ú
ú
û
ù
ê
ê
ê
ê
ë
é
=
ú
ú
ú
ú
ú
û
ù
ê
ê
ê
ê
ê
ë
é
=
=
n
n
T
v
v
v
E
Var
e
Xβ
y +
=
A equivalente matricial:
Haverá heterocedasticidade quando:
A equação de RLM equivale à
transformação:
A equação matricial equivale à trasnformação :
2
2
)
(
)
( i
i
i e
E
e
Var s
=
=
Que pode ainda ser representado por:
i
i v
e
E 2
2
)
( s
=
onde o fator vi indica
como varia a variância
de e para cada
observação i
A nova equação será homocedástica,
pois:
Haverá heterocedasticidade quando:
Λe
ΛXβ
Λy +
= onde
ú
ú
ú
ú
ú
û
ù
ê
ê
ê
ê
ê
ë
é
=
2
2
1
1
0
0
0
0
...
0
0
0
0
1
0
0
0
0
1
v
v
v
Λ
A nova equação será homocedástica pois:
2
2
)
( s
s I
ΛVΛ
Λ
Λee =
=
T
E
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
!" = $ + &'(')
+ ⋯ + &+(+)
+ ,"
!"
∗
= $ + &'(')
∗
+ ⋯ + &+(+)
∗
+ ,"
∗
!"
#"
= %
1
#"
+ ()
*)+
#"
+ ⋯+ (-
*-+
#"
+
."
#"
.
,"
/"
0
= .
,"
0
/"
=
1
/"
. ,"
0
= 20
17. Mínimos Quadrados Ponderados
Ponderação da variáveis:
Uma vez conhecida a matriz V de variâncias e covariâncias do erros de um modelo
de RLM, podemos obter os MELNV transformando as variáveis originais. Em
outras palavras, seja o modelo:
e
Xβ
y +
= em que
Então: Λe
ΛXβ
Λy +
= em que
Apresentará erros homocedásticos, pois:
1
-
= V
Λ
ΛT
2
2
)
( s
s I
ΛVΛ
Λ
Λee =
=
T
E
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
2
2
2
1
0
0
0
0
...
0
0
0
0
0
0
0
0
)
( s
s V
e =
ú
ú
ú
ú
û
ù
ê
ê
ê
ê
ë
é
=
n
v
v
v
Var
ú
ú
ú
ú
ú
û
ù
ê
ê
ê
ê
ê
ë
é
=
2
2
1
1
0
0
0
0
...
0
0
0
0
1
0
0
0
0
1
v
v
v
Λ e
18. Mínimos Quadrados Ponderados
Estimadores de MQP:
Seja o modelo de RLM:
e
Xβ
y +
= com heterocedasticidade dada por
Alternativamente, eu posso obter os estimadores de MQP diretamente por:
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
Caso a matriz ! seja conhecida, eu posso aplicar MQO às variáveis transformadas
!" e !# para estimar os coeficientes $.
%&'()) = ,-.
Então Λe
ΛXβ
Λy +
= será homocedástico, pois %&'(!)) = /-.
y
V
X
X
V
X
Λy
Λ
X
ΛX
Λ
X
β 1
1
1
1
)
(
)
(
ˆ -
-
-
-
=
= T
T
T
T
T
T
Esse método é denominado de Mínimos Quadrados Ponderados (MQP), um
caso específico do método de Mínimos Quadrados Generalizados (MQG).
Os estimadores de MQP são não tendenciosos e os mais eficientes (MELNV) na
presença de heterocedasticidade.
Raciocínio análogo é válido para obter os estimadores da variância:
y
V
X
β
y
V
y 1
1 ˆ
SQRes -
-
-
= T
T
T
e
2
1
1
2
ˆ ˆ
)
(
S s
b
-
-
= X
V
XT
19. MQP com V conhecida - Exemplo
2
)
( s
i
i X
e
Var =
As estimativas de MQO são:
Supondo que:
Para obter as estimativas de MQP, aplicamos MQO ao modelo transformado:
Sejam os gastos de 40 famílias com alimentação em função da renda:
2
2
40
1
...
0
...
...
...
0
...
)
( s
s V
=
ú
ú
ú
û
ù
ê
ê
ê
ë
é
=
X
X
e
Var
i
i
i e
Renda
Aliment
Gasto ˆ
13
,
0
8
,
40 +
+
=
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
!"#$%&'(
)%&*+(
= -
1
)%&*+(
+ 0
)%&*+(
)%&*+(
+
%(
)%&*+(
Λe
ΛXβ
Λy +
=
1
-
= V
Λ
ΛT
em que
As estimativas de MQP seriam:
!"#$%&'( = 32.0 + 0.14)%&*+( + ̂
%(
∗
As estimativas de MQP são não tendenciosas e as mais eficientes. O estimador da variância
também é não tendencioso. Mas a validade dessas estimativas depende de um pressuposto
forte, que a variância dos erros seja de fato uma função linear da renda.
20. MQGF - V Desconhecida
Mínimos Quadrados Generalizados Factíveis (MQGF):
Seja o modelo de RLM:
e
Xβ
y +
= com heterocedasticidade dada por: 2
)
( s
i
i v
e
Var =
As estimativas de vi podem ser substituídas na matriz de ponderações V, agora
denominada V, para obtermos os estimadores consistentes (embora possam ser
viesados) de Mínimos Quadrados Generalizados Factíveis:
y
V
X
X
V
X
β 1
1
1 ˆ
)
ˆ
(
ˆ -
-
-
= T
T
Caso o fator vi seja desconhecido, podemos estimá-lo a partir da relação da
dispersão dos resíduos de MQO com as variáveis X do modelo. Há várias
especificações que podem ser assumidas. Uma estratégia simples é assumir que a
dispersão seja uma função logarítmica de X:
*
1
1
*
0
2
...
)
ˆ
ln( i
k
k
i u
X
X
e i
i
+
+
+
+
= d
d
d
A transformação exponencial garante que todas as estimativas de !
" sejam positivas
(variância não assume valores negativos!).
i
k
k
i
X
X
i e
v
d
d
d ˆ
...
ˆ
ˆ
1
1
*
0
ˆ
+
+
+
=
^
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
21. MQGF com V Desconhecida - Exemplo
As estimativas de MQO foram:
Supondo agora que:
O fator de correção vi pode então ser estimado por:
Sejam os gastos de 40 famílias com alimentação em função da renda:
i
nda
Re
i u
e
e i
1
0
2 d
d +
=
i
i
i e
Renda
Aliment
Gasto ˆ
13
,
0
8
,
40 +
+
=
*
1
*
0
2
)
ln( i
i
i u
nda
Re
e +
+
= d
d
i
i
i u
nda
Re
e ˆ
004
,
0
363
,
3
)
ˆ
ln( 2
+
+
= i
nda
Re
i e
v 004
,
0
363
,
3
ˆ +
=
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
!" =
As variáveis transformadas seriam:
$%&'()*"
+
!"
= ,
1
+
!"
+ /
0()12"
+
!"
+
("
+
!"
em que
3
45 = 3
456 + 3
47 3
48 3
4 = 3
9:;
E as estimativas de MQGF seriam:
$%&'()*" = 22,6 + 0.160()12" + ̂
("
∗
As estimativas de MQGF são válidas apenas para amostras grandes (consistentes). Nesse caso, as
estimativas de MQGF seriam (assintoticamente) também mais eficientes que as de MQO. Mas, para
amostras pequenas, podem ser tendenciosas.
22. Estimadores Robustos
Estimadores da Variância Robustos à Heterocedasticidade - White:
Seja o modelo de RLS:
i
i
i e
X
Y +
+
= b
a
Embora os estimadores de MQO para b continuem não viesados, os estimadores
de suas variâncias seriam viesados.
Um estimador robusto da variância do estimador !
", ou seja, igualmente válido na
presença ou não de heterocedasticidade, pode ser dado por:
No caso de uma RLM teríamos:
Esse estimador robusto à heterocedasticidade, atribuído a White, é válido(não
tendencioso) assintoticamente. Para amostras pequenas, as estatísticas t e F
baseadas no estimador robusto não serão necessariamente válidas.
com heterocedasticidade dada por: 2
)
( s
i
i v
e
Var =
2
1
2
1
2
2
)
(
)
ˆ
(
å
å
=
=
= n
i i
n
i i
i
x
x
Var
s
b
2
1
2
1
2
2
2
ˆ
)
(
ˆ
å
å
=
=
=
* n
i i
n
i i
i
x
e
x
Sb
i
k
j j
j
i e
X
Y i
+
+
= å =1
b
a 2
1
2
1
2
2
2
ˆ
)
ˆ
(
ˆ
ˆ
å
å
=
=
=
* n
i j
n
i i
j
i
i
j
u
e
u
Sb
Onde ûj é o resíduo do ajuste de
Xj em função das demais
variáveis independentes
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto
23. Estimador Robusto - Exemplo
As estimativas de MQO foram:
Caso os erros sejam homocedásticos, a estimativa de MQO para Var(b ) seria:
Finalmente, a estatística t para testar a significância de b seria:
Sejam os gastos de 40 famílias com alimentação em função da renda:
i
i
i e
Renda
Aliment
Gasto +
+
= b
a
^
i
i
i e
Renda
Aliment
Gasto ˆ
13
,
0
8
,
40 +
+
=
2
1
2
2
2
ˆ 031
,
0
00093
,
0
463
.
532
.
1
429
.
1
ˆ
=
=
=
=
å=
n
i i
x
S
s
b
Por sua vez, uma estimativa robusta à heterocedasticidade para Var(b) seria:
^
2
2
2
1
2
1
2
2
2
ˆ 038
,
0
0015
,
0
)
463
.
532
.
1
(
919
.
453
.
421
.
3
)
(
ˆ
=
=
=
=
å
å
=
=
* n
i i
n
i i
i
x
e
x
Sb
36
,
3
038
,
0
13
,
0
=
=
t
Embora haja evidências de heterocedasticidade no modelo, devemos
ter cautela na interpretação desse teste t, já que o estimador robusto
pode não ser válido para amostras pequenas (n=40).
Definição
Análise
Gráfica
Goldfeld-
Quandt
Breusch-
Pagan
White MQP MQGF
Estimador
Robusto