Title: Nota sobre los Errores Estndar en DD
1Nota sobre los Errores Estándar en DD
- DD se derivan de OLS en datos de corte
transversal para varios periodos antes y después
del choque o cambio en política - Ejemplo la transferencia a las madres solteras
en el DF a partir de 2001 - Puede ser que contemos con datos sólo para 2
periodos, 2000 (antes) y 2002 (después) - Pero en muchos casos, contamos con datos para
varios periodos antes (años, trimestres o
meses) y varios periodos después
2How much should we trust DD estimates?
Bertrand, Duflo and Mullainathan, 2004
- DD sufre de un problema de correlación serial
- Por el uso de varios periodos antes y después
- Las variables dependientes de interés
generalmente muestran correlación en el tiempo
(empleo, salarios) - La variable de tratamiento cambia muy poco a
través del tiempo (a partir de la fecha del
cambio, es 1 para el grupo afectado) - Esto NO afecta el coeficiente de DD, sino el
cálculo de los errores estándar, que usamos para
ver si el efecto es significativo o no.
3Bertrand, Duflo and Mullainathan, 2004
- Crítica de BDM los errores estándar pueden ser
subestimados si no se toma en cuenta la
correlación serial - El efecto puede aparecer como significativo,
aunque en realidad no lo sea - BDM generan unas leyes ficticias y estiman DD
- Deberían encontrar un efecto significativo sólo
el 5 de las veces con un nivel de confianza del
95 - Encuentran un efecto significativo hasta 45 de
las veces en algunos casos
4Bertrand, Duflo and Mullainathan, 2004
- Posibles Soluciones
- Asumir una estructura o modelo de autocorrelacion
del error, estimar sus parámetros y calcular la
varianza - No es muy recomendable, pues se necesita estar
seguros de que el modelo está bien especificado y
estimar el parámetro de correlación con pocos
periodos no es bueno.
5Bertrand, Duflo and Mullainathan, 2004
- Posibles Soluciones
- Corrección de White
- Se implementa muy fácilmente usando el comando
cluster() en Stata, y usando la unidad de
tratamiento (el nivel al que se dio el cambio
colonias, ciudades, estados, escuelas) - Funciona mejor mientras mayor es el número de
unidades de tratamiento
6Bertrand, Duflo and Mullainathan, 2004
- Posibles Soluciones
- Agregar los datos de varios años en sólo dos
periodos antes y después - No funciona muy bien cuando el número de unidades
tratadas es bajo - Perdemos información si queremos ver si el efecto
cambia a través del tiempo
7Bertrand, Duflo and Mullainathan, 2004
- Posibles Soluciones
- Inferencia Aleatoria (Randomized Inference)
- Estimamos el efecto con nuestros datos usando DD
- Generamos choques ficticios, estimamos el efecto
de estos choques usando DD y repetimos el
procedimiento varias veces para obtener una
distribución para el estimador - Vemos dónde se ubica nuestro estimado DD en la
distribución - Funciona bien para cualquier número de unidades
tratadas - No es tan usado en la práctica
8Comentarios finales
- La crítica de BDM (2004) es importante
- Prácticamente todo aquel que decide usar DD tiene
que hacer algo para corregir sus errores estándar
después de ese artículo. - Los métodos más usados son (2) y (3) porque son
de fácil implementación y funcionan relativamente
bien.