especificación, identificación e interpretación del...
TRANSCRIPT
Especificación, identificación e interpretación del modelo logit mixto
Seminario:
MODELOS DE ELECCIÓN MODALValencia, 10 de noviembre de 2005
Alfonso Orro ArcayGrupo de Ferrocarriles y Transportes
E.T.S. de Ingenieros de Caminos, Canales y Puertos
UNIVERSIDAD DE A CORUÑA
caminos.udc.es/grupos/ferroca/orro/
Especificación, identificación e interpretación del modelo logit mixto 2
Modelos de elección modalValencia, 10 de noviembre de 2005
El modelo logit mixtoSurge como modelo hedónico o logit con coeficientes aleatorios afinales de la década de los 70
Reformulación y fuerte impulso a finales de los 90
Gran auge en la literatura científica en los últimos años
Puede aproximar cualquier modelo de utilidad aleatoria con la precisión deseada (haciendo despreciable el término Gumbel) pero ¿debe sustituirlos siempre?
Complejo de especificar y estimarRequiere simulación para la estimación
Clásica maximizar una función de verosimilitudBayesiana
Parece oportuno reservarlo para aquellos casos en los que son necesarias sus capacidades
Especificación, identificación e interpretación del modelo logit mixto 3
Modelos de elección modalValencia, 10 de noviembre de 2005
Las posibilidades del modelo logit mixtoDos especificaciones alternativas:
Componentes de error énfasis en la estructura del error: correlaciones y heteroscedasticidades patrones de sustitución entre alternativas
Coeficientes aleatorios análogo al logit convencional, pero suponiendo que los coeficientes del modelo son variables aleatorias distribución de los gustos en la población
Utilizar una especificación u otra es principalmente interpretación
Más utilizada la especificación de coeficientes aleatorios
Enfoque de la ponencia:¿Cuándo utilizar el logit mixto?Aspectos a tener en cuenta en la especificación¿Qué resultados se pueden obtener?Líneas de trabajo, ideas pendientes de contraste, hechos demostrados ...
Especificación, identificación e interpretación del modelo logit mixto 4
Modelos de elección modalValencia, 10 de noviembre de 2005
Correlación en el logit mixtoEl logit mixto permite especificar correlación:
explícitamentea través de la especificación de coeficientes aleatorios
Entre alternativas:Nidos separados
Necesario artificio para mantener la misma matriz de covarianza del logit jerárquicoNo parece necesario emplear simulación existiendo una formulación cerrada ampliamente conocida
Nidos cruzadosPuede ser una alternativa interesante si no se dispone de programas para estimar modelos con formulación cerrada (PCL, CNL, GNL...)
Entre observaciones:Varias elecciones del mismo individuo Muy sencillo de especificar con el logit mixto mismo valor del coeficiente individual en todas las eleccionesDependencia de elecciones anteriores también es sencillo de introducir sin cambiar el procedimiento de estimación
Especificación, identificación e interpretación del modelo logit mixto 5
Modelos de elección modalValencia, 10 de noviembre de 2005
Variaciones en los gustosComposición de la función de utilidad indirecta condicional de cada individuo desde el punto de vista del analista:
Sesgo específico del individuo hacia la alternativaUtilidad derivada de las características de nivel deservicio (tiempos de viaje, costes, seguridad...)Término aleatorio de media cero
En la población se pueden considerar que los gustos o preferencias:Son constantes realmente serían valores medios y la variación se absorbe en el término aleatorioPresentan variaciones sistemáticas media para individuos con las mismas características resto de la variación en el término aleatorio
con atributos socioeconómicos del individuocon características del viajecon el valor de la variable de nivel de servicio realmente gustos constantes e influencia no lineal de la variable riesgo
Tienen variación aleatoria con distribución conocida (supuesta) se puede determinar media y varianza o parámetros similares la propia del logit mixto
Gustos delindividuo
Especificación, identificación e interpretación del modelo logit mixto 6
Modelos de elección modalValencia, 10 de noviembre de 2005
Variaciones en los gustosVariaciones sistemáticas con atributos del individuo o del viaje:
Se pueden introducir como interacción entre variablesOfrecen más información que las aleatorias se estima el valor para cada individuo o cada situaciónRequieren más datos para la estimación y la aplicaciónPueden incluirse en los modelos de parámetros fijos y también añadirlas en los de parámetros aleatorios
Variaciones aleatorias:Permiten estudiar la variabilidaden la poblaciónCon varias elecciones por individuose pueden obtener distribucionescondicionales
Especificación, identificación e interpretación del modelo logit mixto 7
Modelos de elección modalValencia, 10 de noviembre de 2005
Especificación de coeficientes aleatoriosCoeficientes a establecer como aleatorios:
Parece menos interesante para los del sesgo específico:En la práctica sólo supone heteroscedasticidadDificultades de identificación al mezclarse dos distribuciones
Interesan los ratios entre coeficientesEn especificaciones lineales son las tasas marginales de sustitución generalmente con respecto al parámetro del coste: valor subjetivo de los atributos o disposición a pagar (p.ej. valor del tiempo)Si ambos coeficientes son aleatorios (p.ej. normales):
La distribución del valor subjetivo es indeterminadaPueden aparecer valores muy elevados o no calculables si la distribución incluye el 0
Varios autores aconsejan mantener fijo el coeficiente del coste
Para seleccionar los coeficientes aleatoriosDudosa estimabilidad con todos los coeficientes aleatoriosTest de multiplicadores de Lagrange el propio Train no lo cita en su libroTest t de los parámetros de desviación y test de razón de verosimilitud
Permiten escoger entre parámetros fijos o aleatorios, al menos en problemas sencillosFallan en el caso de no linealidad
Especificación, identificación e interpretación del modelo logit mixto 8
Modelos de elección modalValencia, 10 de noviembre de 2005
Confusión entre no linealidad y aleatoriedadSi un atributo interviene de forma no lineal con coeficiente constante en la función de utilidad y se especifica lineal con coeficiente aleatorio puede aparecer significativa la desviación
Esto sucederá si el atributo está aleatoriamente distribuido en la muestra
Es una variación sistemática, que depende del valor del atributo
Riesgo ante un cambio en el atributo cambian las valoraciones no válidos para prognosis
Posibles métodos de detecciónEspecificar modelos con estimación de no linealidad no habitualProcedimientos de detección de no linealidades coeficiente por rangosEstudios con múltiples respuestas por individuo la distribución condicional puede ser similar a la poblacional si la variación del atributo es similar
Especificación, identificación e interpretación del modelo logit mixto 9
Modelos de elección modalValencia, 10 de noviembre de 2005
Distribuciones para los coeficientesMás frecuentes: Normal, lognormal, triangular, uniforme
Problemas con las distribuciones:Normal: cambio de signo aparece probabilidad de, p. ej., valores del tiempo negativos
lognormal difícil de estimar con procedimiento clásicodebe recordarse que la media no coicide con la moda
distribuciones censuradas
Colas de las distribuciones probabilidad de valores excesivosdistribuciones triangulares y uniformes
difíciles de estimar por métodos bayesianosdistribuciones truncadas
Líneas de trabajo: distribuciones más flexibles como SB de Johnson ...
Especificación, identificación e interpretación del modelo logit mixto 10
Modelos de elección modalValencia, 10 de noviembre de 2005
Distribuciones para los coeficientesBuen ajuste con distribuciones limitadas
Algunos resultados de parámetros individuales sugieren que los valores negativos previstos con la normal no aparecen en estos parámetros
Hay autores que sostienen que esto indica que la normal no tiene problemasOtra posibilidad es que estos valores apunten a distribuciones truncadasSe ha sugerido que la media de la normal puede desplazarse respecto al valor real para minimizar la probabilidad de valores negativos
Se han desarrollado métodos de ayuda para la selección de distribuciones
0
0.0001
0.0002
0.0003
0.0004
0.0005
0.0006
0.0007
-4000 -2000 0 2000 4000 6000 8000
Valor del tiempo (pts/h)
TN -N
TO - N
TN - TR
TO - TR
Especificación, identificación e interpretación del modelo logit mixto 11
Modelos de elección modalValencia, 10 de noviembre de 2005
IdentificaciónSegún la teoría de la maximización de la utilidad aleatoria la elección sólo está condicionada por las diferencias entre utilidades normalizar escala y nivel
Seleccionar solución única de infinitas soluciones que generan las mismas probabilidades
Algoritmo de maximización (más con simulación) puede dar resultados no identificados signos para detectarlo:
Desviaciones típicas elevadasHessiano singularInestabilidad de las estimaciones
La identificación de la componente sistemática es sencilla, normalizar:Constantes específicasVariables socioeconómicasVariables en categorías
Especificación, identificación e interpretación del modelo logit mixto 12
Modelos de elección modalValencia, 10 de noviembre de 2005
Identificación del logit mixtoLa identificación del logit mixto presenta problemas que no aparecen en otros modelos estudiar con cuidado la matriz de covarianza de las diferencias entre utilidades
Si se especifican coeficientes aleatorios en variables con variación en la muestra no hay problemas de identificación (salvo problemas de multicolinealidad)
La mayoría de los problemas de identificación surgen de la dificultad de separar la distribución Gumbel del término iid. de la distribución especificada para un coeficiente no es una falta de identificación completa
difícil identificar que parte de la variabilidad corresponde a cada distribuciónse normaliza la escala de la Gumbel y una de las restantes varianzas implicadas (ver casos particulares)no son válidas todas las normalizaciones necesario normalizar la varianza mínima para que no sean precisas matrices de covarianza definidas negativasla varianza mínima se obtiene del modelo casi sin identificar
Especificación, identificación e interpretación del modelo logit mixto 13
Modelos de elección modalValencia, 10 de noviembre de 2005
Identificación del logit mixtoConsideraciones generales de identificación de los términos de desviación en el logit mixto:
Sesgos específicos:con dos alternativas ninguna desviación es identificablecon tres o más alternativas estimables todas las desviaciones menos una, debefijarse a cero la varianza menor ↔ fijar que la alternativa de mínima varianza tenga sólo la componente Gumbel y en las restantes la Gumbel más una varianza adicional
Variables de pertenencia a nidos y variables de alternativas en categoríasCon dos nidos o dos categorías (si la variable entre en todas las utilidades) uno de los dos parámetros no está identificado, la normalización es arbitraria
Con tres o más nidos o categorías todos los parámetros de desviación están identificados, también con dos categorías si la variable no entra en todas las utilidades
Especificación, identificación e interpretación del modelo logit mixto 14
Modelos de elección modalValencia, 10 de noviembre de 2005
Identificación del logit mixtoAtributos socioeconómicos del individuo como variables mudas se aplican las reglas de la variable con la que interaccione para no anularse en las diferencias
Atributos del individuo en categorías interactuando con las constantes específicas de las alternativas:
son identificables todas las desviaciones menos unadebe fijarse a cero la mínima varianza de todas las presentes
Consideraciones sobre la estimabilidad de los coeficientes aleatorios que interactúan con variables continuas con variación en la muestra:
Formalmente no hay problemas de identificaciónSi la variabilidad que introducen es menor que la del término Gumbel van a ser muy difíciles de estimar
Especificación, identificación e interpretación del modelo logit mixto 15
Modelos de elección modalValencia, 10 de noviembre de 2005
Resultados del logit mixtoPrognosis elecciones que predice el modelo
Para los modelos con coeficientes aleatoriosDiversos estudios concluyen que no hay grandes diferencias con las prognosis de modelos más sencillosParece que las diferencias son mayores en alternativas con baja probabilidad de elecciónTampoco parece haber grandes diferencias en prognosis entre especificar unas distribuciones u otras
La correlación puede hacer variar notablemente los resultados de las prognosis
Interpretación de resultados:Las valoraciones de los atributos pasan a ser en sí mismas variables aleatorias (sus estimaciones siempre lo son al serlo los estimadores)No sé tiene un único valor del tiempo sino una distribución en la población nuevas posibilidades pero también dificultades para la evaluación social de inversionesInteresante para conocer la valoración de elementos que pueden ser valorados negativa, neutra o positivamente por los usuarios
Especificación, identificación e interpretación del modelo logit mixto
Seminario:
MODELOS DE ELECCIÓN MODALValencia, 10 de noviembre de 2005
Alfonso Orro ArcayGrupo de Ferrocarriles y Transportes
E.T.S. de Ingenieros de Caminos, Canales y Puertos
UNIVERSIDAD DE A CORUÑA
Documentos en pdf con formulaciones, referencias, demostraciones y aplicaciones en:
caminos.udc.es/grupos/ferroca/orro/