Errores estándar consistentes con heterocedasticidad - Heteroscedasticity-consistent standard errors

El tema de los errores estándar consistentes con heterocedasticidad ( HC ) surge en estadística y econometría en el contexto de la regresión lineal y el análisis de series de tiempo . Estos también se conocen como errores estándar robustos a la heterocedasticidad (o simplemente errores estándar robustos ), errores estándar de Eicker-Huber-White (también errores estándar de Huber-White o errores estándar de White ), para reconocer las contribuciones de Friedhelm Eicker , Peter J. Huber y Halbert White .

En modelos de regresión y series de tiempo, las formas básicas de modelos hacen uso del supuesto de que los errores o perturbaciones u _i tienen la misma varianza en todos los puntos de observación. Cuando este no es el caso, se dice que los errores son heterocedásticos, o que tienen heterocedasticidad , y este comportamiento se verá reflejado en los residuos estimados a partir de un modelo ajustado. Los errores estándar consistentes con heterocedasticidad se utilizan para permitir el ajuste de un modelo que contiene residuos heterocedásticos. El primer enfoque de este tipo fue propuesto por Huber (1967), y desde entonces se han producido procedimientos mejorados para datos transversales, datos de series de tiempo y estimación GARCH . ${\ Displaystyle {\ widehat {u}} _ {i}}$

Los errores estándar consistentes con heterocedasticidad que difieren de los errores estándar clásicos pueden indicar una especificación incorrecta del modelo. La sustitución de errores estándar consistentes con heterocedasticidad no resuelve esta especificación errónea, que puede conducir a sesgos en los coeficientes. En la mayoría de las situaciones, el problema debe encontrarse y solucionarse. Otros tipos de ajustes de error estándar, como los errores estándar agrupados , pueden considerarse extensiones de los errores estándar de HC.

Historia

Los errores estándar consistentes con heterocedasticidad son introducidos por Friedhelm Eicker y popularizados en econometría por Halbert White .

Problema

Considere el modelo de regresión lineal

{\ Displaystyle Y = X \ beta + U, \,}

donde X es el vector de variables explicativas y β es un vector de k × 1 columna de parámetros a estimar.

El estimador de mínimos cuadrados ordinarios (MCO) es

{\ Displaystyle {\ widehat {\ beta}} _ {\ text {OLS}} = (\ mathbb {X} '\ mathbb {X}) ^ {- 1} \ mathbb {X}' \ mathbb {Y}. \,}

donde denota la matriz de valores apilados observados en los datos. ${\ Displaystyle \ mathbb {X}}$ ${\ Displaystyle X_ {i} '}$

Si los errores muestrales tienen la misma varianza σ ² y no están correlacionados , entonces la estimación de mínimos cuadrados de β es AZUL (el mejor estimador lineal insesgado) y su varianza se estima con

{\ Displaystyle v _ {\ text {OLS}} \ left [{\ widehat {\ beta}} _ {\ text {OLS}} \ right] = s ^ {2} (\ mathbb {X} '\ mathbb {X }) ^ {- 1}, \ quad s ^ {2} = {\ frac {\ sum _ {i} {\ widehat {u}} _ {i} ^ {2}} {nk}}}

donde están los residuos de regresión. ${\ Displaystyle {\ widehat {u}} _ {i} = Y_ {i} -X_ {i} {\ widehat {\ beta}} _ {\ text {OLS}}}$

Cuando los términos de error no tienen varianza constante (es decir, la suposición de es falsa), el estimador MCO pierde sus propiedades deseables. La fórmula para la varianza ahora no se puede simplificar: ${\ Displaystyle \ operatorname {E} [uu '] = \ sigma ^ {2} I_ {n}}$

{\ Displaystyle V \ left [{\ widehat {\ beta}} _ {\ text {OLS}} \ right] = V [(\ mathbb {X} '\ mathbb {X}) ^ {- 1} \ mathbb { X} '\ mathbb {Y}] = (\ mathbb {X}' \ mathbb {X}) ^ {- 1} \ mathbb {X} '\ Sigma \ mathbb {X} (\ mathbb {X}' \ mathbb {X}) ^ {- 1}}

dónde ${\ Displaystyle \ Sigma = V [u].}$

Si bien el estimador de puntos de MCO permanece insesgado, no es "el mejor" en el sentido de tener un error cuadrático medio mínimo, y el estimador de varianza de MCO no proporciona una estimación consistente de la varianza de las estimaciones de MCO. ${\ Displaystyle v _ {\ text {OLS}} \ left [{\ widehat {\ beta}} _ {\ text {OLS}} \ right]}$

Sin embargo, para cualquier modelo no lineal (por ejemplo, modelos logit y probit ), la heterocedasticidad tiene consecuencias más graves: las estimaciones de máxima verosimilitud de los parámetros estarán sesgadas (en una dirección desconocida), así como inconsistentes (a menos que la función de verosimilitud sea modificado para tener en cuenta correctamente la forma precisa de heterocedasticidad). Como señaló Greene , "simplemente calcular una matriz de covarianza robusta para un estimador que de otro modo sería inconsistente no le da redención".

Solución

Si los errores de regresión son independientes, pero tienen distintas varianzas σ _i² , entonces con cuál se puede estimar . Esto proporciona el estimador de White (1980), a menudo denominado HCE (estimador consistente de heterocedasticidad): ${\ Displaystyle u_ {i}}$ ${\ Displaystyle \ Sigma = \ operatorname {diag} (\ sigma _ {1} ^ {2}, \ ldots, \ sigma _ {n} ^ {2})}$ ${\ displaystyle {\ widehat {\ sigma}} _ {i} ^ {2} = {\ widehat {u}} _ {i} ^ {2}}$

{\ Displaystyle {\ begin {alineado} v _ {\ text {HCE}} \ left [{\ widehat {\ beta}} _ {\ text {OLS}} \ right] & = {\ frac {1} {n} } \ left ({\ frac {1} {n}} \ sum _ {i} X_ {i} X_ {i} '\ right) ^ {- 1} \ left ({\ frac {1} {n}} \ sum _ {i} X_ {i} X_ {i} '{\ widehat {u}} _ {i} ^ {2} \ right) \ left ({\ frac {1} {n}} \ sum _ { i} X_ {i} X_ {i} '\ right) ^ {- 1} \\ & = (\ mathbb {X}' \ mathbb {X}) ^ {- 1} (\ mathbb {X} '\ operatorname {diag} ({\ widehat {u}} _ {1} ^ {2}, \ ldots, {\ widehat {u}} _ {n} ^ {2}) \ mathbb {X}) (\ mathbb {X } '\ mathbb {X}) ^ {- 1}, \ end {alineado}}}

donde como arriba denota la matriz de valores apilados de los datos. El estimador se puede derivar en términos del método generalizado de momentos (GMM). ${\ Displaystyle \ mathbb {X}}$ ${\ Displaystyle X_ {i} '}$

También se discute a menudo en la literatura (incluido el artículo de White) la matriz de covarianza de la distribución limitante consistente: ${\ Displaystyle {\ widehat {\ Omega}} _ {n}}$ ${\ Displaystyle {\ sqrt {n}}}$

{\ displaystyle {\ sqrt {n}} ({\ widehat {\ beta}} _ {n} - \ beta) \, {\ xrightarrow {d}} \, N (0, \ Omega),}

dónde

{\ Displaystyle \ Omega = \ operatorname {E} [XX '] ^ {- 1} \ operatorname {Var} [Xu] \ operatorname {E} [XX'] ^ {- 1},}

y

{\ Displaystyle {\ begin {alineado} {\ widehat {\ Omega}} _ {n} & = \ left ({\ frac {1} {n}} \ sum _ {i} X_ {i} X_ {i} '\ right) ^ {- 1} \ left ({\ frac {1} {n}} \ sum _ {i} X_ {i} X_ {i}' {\ widehat {u}} _ {i} ^ { 2} \ right) \ left ({\ frac {1} {n}} \ sum _ {i} X_ {i} X_ {i} '\ right) ^ {- 1} \\ & = n (\ mathbb { X} '\ mathbb {X}) ^ {- 1} (\ mathbb {X}' \ operatorname {diag} ({\ widehat {u}} _ {1} ^ {2}, \ ldots, {\ widehat { u}} _ {n} ^ {2}) \ mathbb {X}) (\ mathbb {X} '\ mathbb {X}) ^ {- 1} \ end {alineado}}}

Por lo tanto,

{\ Displaystyle {\ widehat {\ Omega}} _ {n} = n \ cdot v _ {\ text {HCE}} [{\ widehat {\ beta}} _ {\ text {OLS}}]}

y

{\ displaystyle {\ widehat {\ operatorname {Var}}} [Xu] = {\ frac {1} {n}} \ sum _ {i} X_ {i} X_ {i} '{\ widehat {u}} _ {i} ^ {2} = {\ frac {1} {n}} \ mathbb {X} '\ operatorname {diag} ({\ widehat {u}} _ {1} ^ {2}, \ ldots, {\ widehat {u}} _ {n} ^ {2}) \ mathbb {X}.}

Precisamente qué matriz de covarianza es de interés es una cuestión de contexto.

Se han propuesto estimadores alternativos en MacKinnon y White (1985) que corrigen las varianzas desiguales de los residuos de regresión debido a un apalancamiento diferente . A diferencia del estimador asintótico de White, sus estimadores son insesgados cuando los datos son homocedásticos.

Ver también

Método delta
Mínimos cuadrados generalizados
Ecuaciones de estimación generalizadas
Mínimos cuadrados ponderados , una formulación alternativa
Prueba de White : una prueba para determinar si hay heterocedasticidad.
Estimador de Newey-West
Estimación de verosimilitud cuasimáxima

Software

EViews : EViews versión 8 ofrece tres métodos diferentes para mínimos cuadrados robustos: estimación M (Huber, 1973), estimación S (Rousseeuw y Yohai, 1984) y estimación MM (Yohai 1987).
MATLAB : consulte la hacfunción en la caja de herramientas Econometrics.
Python : el paquete Statsmodel ofrece varias estimaciones robustas de errores estándar; consulte statsmodels.regression.linear_model.RegressionResults para obtener más descripciones
R : el vcovHC()comando del paquete de sándwich .
La opción RATS : robusterrors está disponible en muchos de los comandos de regresión y optimización ( linreg , nlls , etc.).
Stata : robustopción aplicable en muchos procedimientos basados en pseudo-verosimilitud.
Gretl : la opción --robustde varios comandos de estimación (como ols) en el contexto de un conjunto de datos de sección transversal produce errores estándar robustos.

Referencias

Otras lecturas

Freedman, David A. (2006). "En el llamado 'Estimador de sándwich de Huber' y 'Errores estándar robustos ' ". El estadístico estadounidense . 60 (4): 299-302. doi : 10.1198 / 000313006X152207 . S2CID 6222876 .
Hardin, James W. (2003). "La estimación de sándwich de varianza". En Fomby, Thomas B .; Hill, R. Carter (eds.). Estimación de máxima verosimilitud de modelos mal especificados: veinte años después . Amsterdam: Elsevier. págs. 45–74. ISBN 0-7623-1075-8.
Hayes, Andrew F .; Cai, Li (2007). "Uso de estimadores de error estándar coherentes con heterocedasticidad en regresión OLS: una introducción e implementación de software" . Métodos de investigación del comportamiento . 39 (4): 709–722. doi : 10.3758 / BF03192961 . PMID 18183883 .
King, Gary ; Roberts, Margaret E. (2015). "Cómo los errores estándar sólidos exponen problemas metodológicos que no solucionan y qué hacer al respecto" . Análisis político . 23 (2): 159-179. doi : 10.1093 / pan / mpu015 .
Wooldridge, Jeffrey M. (2009). "Inferencia robusta de heterocedasticidad después de la estimación de MCO". Econometría introductoria: un enfoque moderno (cuarta ed.). Mason: Suroeste. págs. 265-271. ISBN 978-0-324-66054-8.
Buja, Andreas y col. "Modelos como aproximaciones: una conspiración de regresores aleatorios y desviaciones del modelo contra la inferencia clásica en la regresión". Ciencia estadística (2015): 1. pdf

Languages

In other projects