Title: Uso de modelos Mixed Logit en modelaci
1Uso de modelos Mixed Logit en modelación de
elecciones discretas
- Marcela A. Munizaga
- Ricardo Alvarez-Daziano
- Universidad de Chile
- Santiago, 7 June, 2015
2Contenido de la Presentación
- Correlación del término de error
- Análisis de Simulación
- logverosimilitud y parámetros
- iteraciones y tiempo de convergencia
- diferencias en modalidad predictiva
- Análisis con datos reales
- equivalencia entre modelos
- capacidad de recuperar efectos de correlación
3Elección Discreta y Utilidad Aleatoria
- Teoría de la Utilidad Aleatoria
- Individuo maximiza su Utilidad, función de
atributos de la alternativa y características de
los individuos (Domencich y McFadden, 1975) - Modelador no posee información completa del
sistema ?
- Hay componentes y atributos que se desconocen o
no se pueden medir aleatoriedad inherente a la
naturaleza humana
4Elección Discreta (cont.)
- No se puede asegurar con certeza qué alternativa
será escogida ? - Supuestos sobre distribución de e ? Modelo de
elección específico (Ortúzar y Willumsen, 1994)
- Logit Multinomial MNL (McFadden, 1974)
- Supone errores iid Gumbel
- Expresión cerrada de la probabilidad de elección
5Por qué usar algo distinto del MNL?
- Correlación Dependencia
- Heteroscedasticidad Distinta varianza
- Dependencia ? probabilidades y parámetros
inconsistentes, predicciones poco confiables - Propiedad de independencia de alternativas
irrelevantes (patrones de sustitución constantes) - Avances en computación y métodos numéricos
permiten considerar modelos más generales
6Correlación del término de error
- Motivación el estudio de correlación
- Fuentes de correlación alternativas similares,
alternativas con componente común, variaciones en
los gustos, agregación - Modelos adecuados Logit Jerárquico, Probit,
Mixed Logit
7Logit Jerárquico
- Agrupa las alternativas similares en nidos
- UiVieinj alt i ? nido j
- Matriz de covarianza
- correlación, homoscedasticidad
8Probit
- UiViei ei Normal
- Matriz de covarianza general, sujeto a
restricciones de identificabilidad - Permite modelar correlación y heteroscedasticidad
9Modelo Mixed Logit
- e iid Gumbel, h término aleatorio adicional
que distribuye f(h/q) (Ben Akiva y Bolduc,
1996 McFadden y Train, 1997) - Si e es iid Gumbel ? probabilidad condicional en
h
- Por lo tanto, la probabilidad total es
10Modelo Mixed Logit (cont.)
- Caso Particular (Modelo lineal de error
compuesto)
zin atributos relacionados con alternativa i e
individuo n
- Propiedades
- ML aproxima cualquier modelo de utilidad
aleatoria (McFadden y Train, 1997) ML con
parámetros distribuidos normal, aproxima a un
Probit. - Razón de probabilidades depende de todo el
conjunto de alternativas disponibles.
11Modelo Mixed Logit (cont.)
- Estimación
- Condicional en q, se obtiene un valor h ?
Pin(h) tiene forma Logit. Proceso se repite R
veces
- Probabilidad Simulada de escoger la alternativa
- Se maximiza la log verosimilitud simulada
12Modelos de elección (cont.)
- Nested Mixed Logit
- Brownstone and Train (1999).
- UiViei?j ei iid Gumbel ?j Normal
- Matriz de covarianza
- correlación, heteroscedasticidad
13Análisis de Simulación
- Objetivo estudiar los modelos en un caso en que
se cumplen todos los supuestos - Metodología
- atributos según base de datos real
- se asume ciertos parámetros de gusto
- se genera las componentes determinística y
aleatoria de la función de utilidad - se calcula la elección de acuerdo a máx U
- se calibra los modelos con la base generada
- estímulo de políticas
14Análisis de Simulación
- Uso del simulador en modalidad predictiva
- Predicciones con los modelos calibrados
- En qué nos podemos fijar?
- Diferencias entre parámetros conocidos y
calibrados - Diferencias entre predicciones del simulador
(realidad virtual) y predicciones modeladas
15Influencia del Nº Repeticiones
- 4000 Observaciones
- 4 alternativas
- Correlación 0,5 (Nido con dos alternativas)
- Dimensión 3
- Probit (Nº de alternativas - 1)
- ML (Estructura homsc. anidada 1 componente común
2 términos independientes)
16Influencia del Nº Repeticiones
- Parámetro de Correlación Probit
17Influencia del Nº Repeticiones
- Parámetro de Correlación MLR
18Influencia del Nº Repeticiones
- Parámetro de Correlación MLH
19Influencia del Nº Repeticiones
20Influencia del Nº Repeticiones
- Diferencias en modalidad predictiva
21Influencia del Nº Repeticiones
- Iteraciones and tiempo de convergencia
22Caso alternativas correlacionadas
- Síntesis
- 8000 Observaciones / r 0,5 / He Ho
- Mejor verosimilitud para ML
- ML recupera adecuadamente todos los parámetros
- Probit importante subestimación de la
correlación - LJ efectos de escala, al usar datos
heteroscedásticos - NL Probit ML buen nivel de respuesta
- MNL pobre nivel de respuesta en comparación con
ML y LJ
23Datos reales
- Contexto
- Corredor Las Condes - Centro, RP
- 9 alternativas, se incluye combinaciones
- auto chofer, auto acompañante, taxi colectivo,
metro, bus, auto chofer-metro, auto acompañante
-metro, taxi colectivo-metro, bus-metro - 697 observaciones
24Datos reales
25Datos reales Estructura 1
26Datos reales
27Datos reales estructura 2
28Síntesis y Discusión
- ML es un modelo útil, flexible y aplicable
- La estructura de covarianza se deduce de la
especificación y debe ser debidamente justificada
- Nested Mixed Logit no es equivalente al LJ
- Probit aparece como un modelo costoso y muestra
dificultades para recoger correlación