la comparación de los tres modelos de gravedad de choque de uso comúnsobre los requisitos de...

29
LA COMPARACIÓN DE LOS TRES MODELOS DE GRAVEDAD DE CHOQUE DE USO COMÚNSOBRE LOS REQUISITOS DE TAMAÑO DE LA MUESTRA: LOGIT MULTINOMIAL, ORDENADOS MODELOS LOGIT MIXTOS Y PROBIT 1. INTRODUCCIÓN Los modelos discretos de respuesta en la seguridad del tráfico (a menudo referenciados como modelos de gravedad del choque), como los modelos logit y probit, son generalmente utilizados para explorar la relación entre la gravedad de los accidentes y sus factores contribuyentes, como las características del conductor, características del vehículo, condiciones de las carreteras, y los factores de carreteras y medio ambiente. Una revisión de estos tipos de modelos que han sido utilizados para el análisis de la gravedad del choque muestra que en general se puede clasificar como nominales u ordinales (ver Savolainen et al. (2011) para una revisión a fondo). Entre los modelos nominales, los tres más comunes son modelos logit multinomiales anidados, modelos logit y modelos logit mixtos. Los modelos ordinales, por otro lado, también se pueden clasificar en tres grupos: modelos logit ordenada, modelos probit ordenado, y a los modelos logit mixtos ordenados. Hay otros tipos de modelos de gravedad del choque, pero no son tan populares o utilizado en la práctica. El curioso lector puede consultar Savolainen et al. (2011) para una extensa lista de modelos disponibles para el análisis de la gravedad del choque. En general, sobre la base de la literatura existente, los modelos logit multinomial y probit ordenado. Se ha encontrado que los modelos son los tipos más importantes de los modelos utilizados para el análisis de la gravedad de accidente de tránsito (véase el cuadro 1 Savolainen et al. (2011)). Mientras tanto, el modelo logit mixto es un modelo prometedor que recientemente ha sido utilizado ampliamente en diferentes áreas. Pocos estudios de investigación se han llevado a cabo, en comparar directamente diferentes modelos de gravedad del

Upload: danielaandrade

Post on 23-Jan-2016

7 views

Category:

Documents


0 download

DESCRIPTION

Los modelos discretos de respuesta en la seguridad del

TRANSCRIPT

Page 1: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

LA COMPARACIÓN DE LOS TRES MODELOS DE GRAVEDAD DE CHOQUE DE USO COMÚNSOBRE LOS REQUISITOS DE TAMAÑO DE LA

MUESTRA: LOGIT MULTINOMIAL, ORDENADOS MODELOS LOGIT MIXTOS Y PROBIT

1. INTRODUCCIÓN

Los modelos discretos de respuesta en la seguridad del tráfico (a menudo referenciados como modelos de gravedad del choque), como los modelos logit y probit, son generalmente utilizados para explorar la relación entre la gravedad de los accidentes y sus factores contribuyentes, como las características del conductor, características del vehículo, condiciones de las carreteras, y los factores de carreteras y medio ambiente. Una revisión de estos tipos de modelos que han sido utilizados para el análisis de la gravedad del choque muestra que en general se puede clasificar como nominales u ordinales (ver Savolainen et al. (2011) para una revisión a fondo). Entre los modelos nominales, los tres más comunes son modelos logit multinomiales anidados, modelos logit y modelos logit mixtos. Los modelos ordinales, por otro lado, también se pueden clasificar en tres grupos: modelos logit ordenada, modelos probit ordenado, y a los modelos logit mixtos ordenados. Hay otros tipos de modelos de gravedad del choque, pero no son tan populares o utilizado en la práctica. El curioso lector puede consultar Savolainen et al. (2011) para una extensa lista de modelos disponibles para el análisis de la gravedad del choque. En general, sobre la base de la literatura existente, los modelos logit multinomial y probit ordenado.Se ha encontrado que los modelos son los tipos más importantes de los modelos utilizados para el análisis de la gravedad de accidente de tránsito (véase el cuadro 1 Savolainen et al. (2011)). Mientras tanto, el modelo logit mixto es un modelo prometedor que recientemente ha sido utilizado ampliamente en diferentes áreas. Pocos estudios de investigación se han llevado a cabo, en comparar directamente diferentes modelos de gravedad del choque, aunque cada tipo de modelo tiene sus propias ventajas y limitaciones únicas. Hasta el momento, no hay consenso sobre qué modelo es el mejor, ya que la selección del modelo es a menudo gobernado por la disponibilidad y características de los datos (Savolainen et al., 2011). Algunos investigadores prefieren elegir modelos nominales sobre los modelos ordinales debido a la restricción impuesta sobre cómo afectan las variables ordenadas las probabilidades de resultados discretos; es decir, utilizando el mismo coeficiente de una variable entre los diferentes niveles de gravedad de choque. Otros aún prefieren modelos ordinales debido a su simplicidad y el rendimiento general cuando se dispone de datos menos detallados (Washington et al, 2011). De los pocos investigadores que compararon directamente los modelos de gravedad del choque, Abdel-Aty (2003) recomendó que el modelo probit ordenado en los modelos logit multinomiales y modelos logit anidados, mientras Haleem y Abdel-Aty (2010) reportaron que el modelo probit binario agregada (un caso especial de un modelo probit ordenado mediante la agregación de los cinco

Page 2: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

niveles de gravedad de choque en dos) ofrecen prestaciones superiores en comparación con el probit ordenado y modelos logit anidados en términos de bondad Offit.Similar a contar los modelos de datos (Lord, 2006), los modelos de gravedad de choque pueden ser fuertemente influenciados por el tamaño de la muestra de que se estima. Como se discutió en la investigación anterior (Señor y Bonneson, 2005; Señor y Mannering, 2010), los datos de accidente a menudo se caracterizan por un pequeño número de observaciones. Este atributo se le atribuye a los altos costos de montaje de choque y otros datos relacionados. Aunque se prevé que el tamaño de la muestra influye en el rendimiento de la gravedad del accidente modelos, nadie hasta el momento ha cuantificado cómo el tamaño de la muestra afecta a los modelos más utilizados gravedad del choque y en consecuencia, proporcionar directrices sobre los requisitos de tamaño de datos. Algunos han propuesto tales directrices, pero sólo para crashfrequency modelos (Lord, 2006; Señor y Miranda-Moreno, 2008; Park et al, 2010). Además, los modelos de gravedad de choque son estimado por lo general usando el estimador de máxima probabilidad (MLE), que es un estimador consistente (asegurándose de que estándar errores de estimaciones de los parámetros se hacen más pequeñas como tamaño de la muestra se hace más grande), pero no necesariamente un estimador eficiente (es decir, para un tamaño de muestra dada la estimación del parámetro no puede tener el error estándar más bajo posible), por lo tanto los resultados de estimación puede ser problemático en muestras pequeñas (Washington et al., 2011). Como se indicó anteriormente, hay una necesidad de examinar como el tamaño de la muestra puede influir en el desarrollo de choque comúnmente utilizado modelos de severidad. Proporcionar esta información podría ayudar a los analistas de seguridad de transporte en su decisión de utilizar un modelo sobre otra, dado el tamaño y las características de los datos. Por tanto, el objetivo de este estudio es examinar los efectos del tamaño de la muestra en los tres modelos de gravedad de choque más utilizados: el logit multinomial, probit ordenado y los modelos de logit mixto. El objetivo se logra usando un análisis de Monte-Carlo basado en simulación y los datos observados. Los tamaños de las muestras analizadas variaron de 100 a 10.000 observaciones.

2. FONDO METODOLÓGICO

Esta sección se describe los tres modelos de gravedad del choque: el logit multinomial, probit ordenado, y los modelos logit mixtos. El modelo logit multinomial se deriva bajo el supuesto de que los factores no observados no están correlacionados en las alternativas o los resultados, también conocida como la independencia de alternativas irrelevantes (IIA) supuesto (Tren, 2003). Este suposición es la limitación más notable del modelo logit multinomial ya que es muy probable que los factores no observados son compartidos por algunos resultados. A pesar de esta limitación, el supuesto de IIA hace que el modelo logit multinomial sea muy cómodo de usar que también explica su popularidad.

Page 3: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

En el caso general de un modelo logit multinomial de los resultados de severidad de lesiones del accidente, las variables i y k son las categoría de gravedad, está representada por la función propensión gravedad, Tki, como se muestra en la ecuación. (1) (Kim et al., 2008).

(1)

Donde, ak es un parámetro constante de la categoría gravedad del choque k; βk es un vector de los parámetros estimables para la gravedad del choque categoría k; k=1, K (K=5 en el papel) que representa a todos los cinco niveles de gravedad: no-lesión (NI), posibles lesiones (PI), no incapacidad lesión (NII), lesiones incapacitantes (II), y fatal (F); X ki representa el vector de variables explicativas que afectan la gravedad del choque para i en categoría de gravedad k (las variables geométricas, las condiciones ambientales, las características del conductor, etc.). εki es un término de error aleatorio tras el Tipo I generaliza el valor extremo (es decir, Gumbel) de distribución; i = 1; ...; n donde n es el número total de eventos de choque incluido en el modelo. La ecuación (2) muestra la forma de calcular la probabilidad para cada categoría de gravedad del choque. Deje Pi(k) sea la probabilidad de accidente i termina en la severidad del choque categoría k, tal que

(2)

El modelo probit ordenado z utiliza una variable latente, como se muestra en la Ec. (3) para determinar los resultados de gravedad del choque.

Z=βx+ ε (3)

donde X es un vector de variables explicativas para el choque individual; β es un vector de los coeficientes de las variables explicativas; y ε es un término de error aleatorio siguiente distribución normal estándar.

Usando la ecuación (3) el valor de la variable dependiente y es determinada por:

(4)

Page 4: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

donde, γ={ γ1,...; γk,...,γK-1} son los valores de umbral para todas las categorías de severidad de choque, lo que corresponde a un entero de pedido; k=1, ..., K (K=5 en el papel), que representa a todos los cinco niveles de gravedad: 1=no la lesión (NI), 2=posible lesiones (PI), 3=no-incapacidad de lesión (NII), lesión 4=lesión incapacitante (II), y 5=fatal (F); K es la categoría más alta gravedad del choque ordenado. Dado el valor de X, la probabilidad de que la gravedad del choque de un accidente individuo pertenece a cada categoría es

(5)

donde, Φ (.) representa la función de probabilidad acumulada de la distribución normal estándar.Según lo declarado por Eluru et al. (2008), el modelo estándar ordenado de respuesta (incluyendo el modelo probit ordenado) tienen una limitación en el que los valores de umbral se fija a través de observaciones, lo que podría conducir al modelo de estimación inconsistente. Por lo tanto, estos autores introdujeron un nuevo tipo de modelo conocido como el modelo logit mixto generalizado de respuesta ordenada para el análisis de datos de accidentes. El modelo logit mixto generalizado de respuesta ordenada puede generalizar la norma, ordenó modelos de respuesta permitiendo la flexibilidad de los efectos de las variables en el valor umbral para cada categoría ordinal. Sin embargo, dada la complejidad del modelo y el hecho de que sólo se ha utilizado una vez, el modelo logit mixto generalizado de respuesta ordenada no se examinó en este estudio. Además, Abdel-Aty et al. (2011) utilizaron un nuevo modelo, el modelo logístico ordenado multinivel, para estudiar los efectos de la niebla / fumar en los accidentes. El modelo logístico multinivel ordenado es una extensión del modelo logit ordenado ordinario, lo que representa para la severidad del choque la heterogeneidades mediante la inclusión de un componente de efecto aleatorio en los umbrales. Utilizando el mismo método, el modelo de probit ordenado podría ampliarse en los probit ordenados multinivel en la investigación futura, que está más allá del alcance de este documento.El modelo logit mixto ha atraído considerable atención por parte de los investigadores de seguridad de tráfico debido a su flexibilidad en el modelo definición y se ha convertido popular debido a la mejora en la potencia de los ordenadores y el desarrollo de la simulación técnicas que son necesarias para las estimaciones del modelo (Milton et al., 2008). Probabilidades logit mixtos son las integrales de probabilidades logit estándar más de una densidad de

Page 5: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

parámetros (es decir, es un promedio ponderado de la fórmula logit evaluada en diferente valor de los parámetros (β), con los pasos dados por la densidad f (β).El modelo logit mixto comparte la misma estructura de la función propensión gravedad, Tki, utilizado para el modelo de logit multinomial como se muestra en la Ec. (1). Por lo tanto, la ecuación. (6) muestra el cálculo de la probabilidad de cada categoría de gravedad del choque para el modelo logit mixto.Deje Pi(k) sea la probabilidad de accidente i termina en la gravedad del choque categoría k, tal que

(6)Donde, f (β/θ) es la función de densidad de β con θ con referencia a un vector de parámetros de la función de densidad (media y varianza).

3. DATOS

Las fuentes primarias de datos utilizados en este estudio incluyeron cuatro años (1998-2001) de los registros de accidentes de tráfico proporcionadas por el Departamento de Seguridad Pública de Texas y el Departamento de Transporte de inventario carretera general de Texas. Esta investigación da la probabilidad de niveles de gravedad de accidentes de tránsito de un solo vehículo que involucran objetos fijos que se produjeron en las zonas rurales o carreteras de dos vías (con exclusión de los que se producen en las intersecciones). Hubo un total de 26.175 registros utilizables en la base de datos que contenía una variedad de información, incluyendo las condiciones de tiempo, camino, conductor y vehículo, así como accidente de severidades reportados en el momento de los accidentes. Para este conjunto de datos, estas categorías tenían 11.844 (45,3%), 5.270 (20,1%), 5807 (22,2%), 2.449 (9,4%), y 805 (3,1%) las observaciones de la gravedad de la lesión; no posibles lesiones, lesiones no incapacitantes, incapacitantes lesiones, y fatal, respectivamente. Había 27 variables independientes utilizadas en el análisis empírico que son resumen en la Tabla 1.

4.LOS RESULTADOS DE LA ESTIMACION DE MODELOS

El uso de los datos anteriores, tres modelos (el logit multinomial, probit ordenado y modelos logit mixtos) se desarrollaron, la estimación de las probabilidades de los cinco niveles de gravedad de choque condicionales en un accidente que se haya producido. Para el modelo estimación, se utilizó LIMDEP 9.0 (Greene, 2007). Los resultados de la estimación para cada modelo se enumeran en la Tabla 2. Además, que se explican brevemente de la siguiente manera y se recomienda acudir al documento original para obtener información adicional de tres modelos de estimación (Ye, 2011).

Page 6: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

Tabla 1 Resumen estadístico de las variables incluidas en los modelos

4.1. Análisis para el modelo de logit multinomial

En el procedimiento de la estimación del modelo logit multinomial, todas las 27 variables explicativas mencionadas en la Tabla 1 se ensayaron para su inclusión, pero sólo 10 variables fueron retenidas, como se muestra en la Tabla 2. Los criterios usados para las variables inclusión fueron la disponibilidad de datos, criterios de ingeniería, y el nivel de significación (0,05 se utiliza en este estudio). Para los cinco niveles de gravedad del choque, se utilizó fatal como el resultado de línea de base. Inicialmente, los coeficientes de una variable en la gravedad de función propensión Tki se especifica a ser diferente en las cuatro categorías de gravedad (a excepción de fatal, como una línea de base resultado). Si no se observó ninguna diferencia significativa a un nivel de

Page 7: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

significancia de 0.05 entre los coeficientes en dos de las funciones de gravedad de propensión, a continuación, se fijan para ser iguales. Se utilizaron pruebas de coeficiente de riesgo para comprobar si los coeficientes de una variable en las cuatro funciones de propensión de gravedad fueron significativamente diferentes entre sí. Además, él Se llevó a cabo en pequeña Hsiao prueba IIA (Washington et al., 2011). Sobre la base de la prueba, la estructura del modelo logit multinomial no puede ser refutada y IIA supuesto uno de los cinco niveles de gravedad de choque no podía ser rechazada en el nivel de 0,10 para la significación el conjunto de datos.

4.2. Análisis para el modelo probit ordenado

Para el modelo de estimación probit ordenado, todos los 27 variables antes mencionadas fueron incluidos inicialmente en el modelo, y la selección hacia atrás se utiliza para el proceso de selección de manera que sólo los significativos al 0,05 del nivel se incluyeron en el modelo. Para el resultado final, las variables más significativas se mantuvieron (18 variables) de los modelos logit y logit multinomial mixto (10 variables). Los signos y valores de los coeficientes estimados de las variables a partir de los tres modelos se consideraron razonable. Los análisis de sensibilidad y las elasticidades directas que apoyan la interpretación de se realizaron estas variables para cada modelo, pero no se presentan aquí por limitaciones de espacio (ver Ye, 2011 para más detalles).

4.3. Análisis para el modelo logit mixto

El modelo logit mixto permite la aleatoriedad de los parámetros de una variable, y por lo tanto en el desarrollo del modelo, primero asumido todos los parámetros incluidos en el modelo que eran al azar. Las distribuciones populares (normal, uniforme y logit normal distribución) se ensayaron para determinar los parámetros aleatorios, por lo que numerosas combinaciones de estas distribuciones fueron evaluados por la modificación de los supuestos de parámetros. A continuación, se utilizó la prueba t para examinar sus desviaciones estándar estimadas para explorar la aleatoriedad de cada parámetro: si su desviación estándar no se encontró estadísticamente diferente de cero al 0,05 significación nivel, que se limita a ser fijo en lugar de al azar. El método de máxima verosimilitud basada en la simulación se utiliza para estimación de parámetros, con 200 Halton dibuja (Milton et al., 2008). El resultado final de la estimación del modelo de logit mixto, como se muestra en Tabla 2, se basó en criterios de ingeniería y medición de bondad de ajuste.

4.4. Los resultados del modelo de comparación

Sobre la base de la salida de los tres modelos, se encontró que el modelo logit mixto es más interpretativo que el modelo de logit multinomial, ya que el primero incluye la aleatoriedad asociado con los parámetros de algunas variables en funciones de propensión, en lugar siendo fijo para cada variable,

Page 8: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

permitiendo tanto una media y desviación estándar. Es decir, dependiendo del parámetro de distribución, los efectos de los parámetros para el modelo logit mixto pueden variar a través de accidente individual, que van de positivo a negativo y para distintas magnitudes (Milton, 2006). Esto da como resultado la predicción de un valor medio y la desviación estándar para la probabilidad de cada nivel de gravedad en lugar de un único punto de probabilidad. Mientras tanto, aunque representa la información ordinal de accidente severidades, el modelo probit ordenado todavía no tiene el mismo buen poder interpretativo como los modelos de logit multinomial y logit mixto. El modelo probit ordenado restringe los efectos de las variables explicativas sobre las probabilidades de resultados discretos ordenados mediante el uso del coeficiente idéntico para una variable explicativa a través de diferentes niveles de gravedad de choque. Esto causa que la variable ya sea para aumentar la probabilidad de mayor gravedad (fatal en el estudio) y disminuir la probabilidad de baja severidad (sin lesión en el estudio), o para disminuir la probabilidad de mayor gravedad y aumentar la probabilidad de gravedad más bajo. Sin embargo, no permite la probabilidades de ambos el aumento o disminución de gravedad más alto y más bajo. Esto puede no ser realista, porque es posible que algunas variables explicativas pueden crear un aumento en la probabilidad de algunas predicciones de resultado, pero para disminuir la probabilidad de otras predicciones de resultados. Por ejemplo, las inclemencias del tiempo podría conducir a un aumento en la probabilidad de que ambas severidades más altas (mortales, lesiones incapacitantes) y la más baja severidad (sin lesión), pero reducir la probabilidad de los otros niveles de gravedad (una posible lesión, no incapacidad de lesión). Además, no está claro qué efectos da una variable de parámetro positiva o negativa tiene sobre las probabilidades de la "Interiores" niveles de gravedad: lesiones incapacitantes, la lesión no incapacitante, y posibles lesiones (Washington et al., 2011). En términos de la bondad del ajuste entre los tres modelos, el modelo probit ordenado incluye las variables más significativas (18 variables) que se traduce en un valor ligeramente superior ajustada rho-cuadrado (ρ2=0.208 ajustado) que los modelos de logit multinomial y logit mixto (ρ2=0.194 ajustado). Desde el modelo logit multinomial es un nuevo del modelo logit mixto, que se puede comparar aún más su bondad de ajuste utilizando una prueba de razón verosimilitud, a pesar de que ambos tienen el mismo rho-cuadrado se ajusta el valor. A partir de los resultados de la estimación del modelo de logit multinomial de la Tabla 2, el logaritmo de la verosimilitud en la convergencia es -33,926.2 con 27 parámetros estimados (grados de libertad, entre ellos cuatro variables constantes estimados) y el logaritmo de la verosimilitud en la convergencia para el modelo logit mixto estimación es -33,917.3 con 30 parámetros estimados (tres más aleatoriedad en las variables que las del modelo logit multinomial). Por lo tanto, el cociente de probabilidad estadística es de 2x (- 33,917.3 - (- 33,926.2)) =8.9 con 3 grados de libertad, que es más grande que el valor x2 de la tabla de 7,81 para el nivel de significancia de 0.05. Esto indica que el modelo logit mixto es estadísticamente mejor que el modelo logit

Page 9: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

multinomial en términos de bondad de ajuste en el nivel de significancia de 0.05.

5. COMPARACIONES DE MODELOS DELTAMAÑO DE LA MUESTRA

Para esta parte del análisis, hemos utilizado los datos simulados, así como los registros de accidentes de cuatro años antes descritos. Recordemos que este conjunto de datos incluye 26.175 accidentes de un solo vehículo que involucran objetos fijos en las zonas rurales de dos vías o carreteras. Intuitivamente, pequeña tamaño de la muestra en los modelos de gravedad del choque puede dar lugar a resultados erráticos, lo que limita su capacidad para estimar los parámetros verdaderos y resultar en una predicción inexacta de las probabilidades para cada resultado severidad. Con el fin de encontrar la diferencia en tamaño de la muestra y requisitos para los tres modelos discutidos anteriormente, se usó una simulación de Monte Carlo para examinar el sesgo potencial asociado con diferentes tamaños de muestra para cada tipo de modelo.

5.1. Análisis basado en datos simulados

Al repetir la toma de muestras para producir estimadores más agrupados en torno a los verdaderos valores (valores diseñados para los datos simulados), la simulación de Monte-Carlo es una forma ideal para verificar los efectos del tamaño de la muestra en tres modelos, ya que creamos datos con el conocimiento de los verdaderos valores de los estimadores y funciones de respuesta verdaderos. Por lo tanto, el sesgo de todos se puede lograr por la comparación de la estimación del modelo con los verdaderos valores de los estimadores para diferentes tamaños de muestra.

5.1.1. Diseño de simulación

Todas las variables incluidas en un modelo de gravedad del choque son más que relacionados con la obtención de resultados de observación, lo que significa que la las variables mantienen los mismos valores no importa la gravedad del accidente objetivo es observado (Khorashadi et al., 2005). En otras palabras, las variables en función de propensión para cada categoría de severidad de un accidente observado son idénticos, aunque su parámetros que describen las características de los efectos de la caída del choque difieren entre cada severidad. Por lo tanto, la variable en la propensión funciones generadas en la simulación deben mantenerse el mismo para todas las gravedades en cada observación.

Page 10: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

Tabla 2

Estimación de resultados de los modelos de logit multinomial, logit mixtos y logit probit ordenado en base a los datos de accidentes observados.

Tabla 3Los verdaderos valores de los parámetros utilizados en la simulación para los tres modelos.

Page 11: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

Dado que los datos de choque tienen cinco categorías de gravedad, el número de parámetros en el estudio es muy grande. Para simplificar, uno de covarianza generada al azar de la distribución normal estándar se introdujo para los tres modelos. Además, los cinco resultados (denotados como los niveles de daño 1 a 5, de no-fatal lesiones) se utilizarán para replicar las cinco categorías de gravedad.Se generaron los tres conjuntos de datos para cada modelo. Para el modelo logit multinomial, las variables de parámetros se mantuvieron la misma con un valor igual a 1 para cada resultado, es decir, βk=1. Parámetros constantes ak eran 1,5, 1, 0,5, 0 de los niveles de daño 2-5 (nivel 1, sin lesiones, fue el resultado de línea de base con α1=β1=0). La variable independiente x para cada nivel se elaboró a partir de una distribución normal con media igual a -2 y una varianza igual a 1. El término de error para cada nivel se elaboró de forma independiente de un tipo, Ia distribución de valores extremos mediante la obtención se basa en la distribución aleatoria uniforme y la aplicación después de la transformación {–ln=ln(u)}, donde u era un número aleatorio extraído de la distribución uniforme entre 0 y 1.De este modo, dieron las siguientes proporciones de 44,1%, 25,4%, 15,4%, 9,4% y 5,7% para los niveles de daño 5-1 correspondientemente que representa las proporciones observadas en los datos (cinco niveles de gravedad de choque de ninguna lesión a mortales).Para el modelo probit ordenado, los parámetro de la variable β era igual a 1 para cada nivel, x se extrae de una distribución normal, con una media igual a 2,2 y una varianza igual a 1, y de umbral variables de γ keran 2,4, 1,5, 0,8, 0 para los niveles 2-5 (para mantener las proporciones de la población de cada nivel tan cerca como aquellos para el modelo logit multinomial). El término de error estándar de una distribución normal para cada resultado. Por lo tanto, dieron las siguientes proporciones 44.3%, 24.6%, 15.0%, 10.1%, y 6,0% para los niveles de lesiones 1-5 (desde no-lesión fatal a), de forma correspondiente.Para el modelo logit mixto, los pasos para generar el conjunto de datos fueron muy similares a los utilizados en la generación del conjunto de dato para el modelo logit multinomial. La única diferencia es que se asumió la variable independiente para tener una componente aleatoria en el parámetro, la variable para el nivel de la lesión 1 (sin lesión), siguió una distribución normal (significa=1, variable=1). Las proporciones de población para cada resultado fueron 39,3%, 23,6%, 14,3%, 8,7% y 14,1% para los niveles de daño 1-5 (no-

Page 12: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

perjuicio a mortales), correspondientemente. Lo que se puede notar es que las proporciones de cada nivel para el modelo logit mixto no son lo más cercanas que las de los modelos de logit multinomial y probit ordenados. Esto se puede atribuir a la existente aleatoriedad asociado con el modelo logit mixto. La aleatoriedad causa más variabilidad de los datos y hace que las proporciones sean más difíciles de ser controladas.La Tabla 3 resume los verdaderos valores asumidos para los tres modelos. Los valores de los parámetros elegidos para los tres modelos se basan en el de asunción de los resultados no se vean afectados tanto por diferentes valores de los parámetros. Los conjuntos de datos de cada modelo se elaboraron varias veces, 100 veces para cada tamaño de la muestra de acuerdo con los valores de los parámetros verdaderos diseñados del modelo. Los tamaños de las muestras fueron diseñados como 100, 250, 500, 1000, 1500, 2000, 5000, y finalmente 10.000.

5.1.2. Resultados de la simulación

Volviendo en primer lugar a los resultados de la simulación para el modelo logit multinomial, con base en los quintales de la toma de muestras empírica distribución de los estimadores de los parámetros, se calcularon los intervalos de confianza del 95% para cada parámetro estimado. Los gráficos en la Fig. 1 muestra la relación entre los intervalos de confianza del 95% para los cuatro parámetros constantes estimados y los parámetros asociados con las variables independientes para los tamaños de las muestras descritas anteriormente. En cada gráfico, el eje Y es el estimación del parámetro, y el eje X es el tamaño de la muestra. Para cada tamaño de la muestra, hay dos estimaciones del parámetro, uno de menor cota y el otro para el límite superior de los intervalos de confianza del 95%. Por lo tanto, el intervalo encierra un 95% de probabilidad del valor real de cada parámetro.De la Fig. 1, se puede observar que, para cada parámetro, el rango para el intervalo de confianza del 95% se hace más estrecho mientras que el tamaño de la muestra se hace más grande, aunque hay una relación proporcional inversa directa se ha encontrado entre el intervalo de confianza del 95% y tamaño de la muestra. Además, como el tamaño de la muestra alcanza 2000, el intervalo de confianza del 95% se hace más pequeño y se mantiene estable alrededor el verdadero valor de cada parámetro. A fin de tener una mirada más cercana a los resultados de la simulación, la relación entre el valor de media de cada parámetro y tamaño de la muestra se extrajo y se ilustra en la Fig. 2. Esta figura muestra que el tamaño de muestra de menos de

Page 13: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

Fig. 1. Los intervalos de confianza de los parámetros de tamaño de la muestra para el modelo logit multinomial.2000 son un tanto errático en las habilidades para encontrar los parámetros verdaderos. Además, el valor medio estimado para todas las variables parece estar sesgados por los cuatro coeficientes. En este punto, los factores que influyen en el sesgo son desconocidos y adicional, se necesita trabajo para determinar las causas de este sesgo. El valor medio se convierte en estable para un tamaño de muestra mayor que 2000, que es aproximadamente el mismo valor cuando el intervalo de confianza del 95% se convierte en mucho más pequeño, como se ve en la Fig. 1.

Page 14: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2
Page 15: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

Fig. 2. Media de los parámetros de tamaño de la muestra para el modelo logit multinomial.Para el modelo probit ordenado, como se muestra en las Figs. 3 y 4, los tamaños de muestra son más grandes y conducen a la gama más estrecha para la confianza del 95%, el intervalo de los parámetros y el valor más cerca de la media. En oposición al modelo logit multinomial, la única diferencia es que para el modelo probit ordenado, el punto estable llega a un tamaño de muestra más pequeño, que es alrededor de la mitad de eso para el logit multinomial modelo (1000). En otras palabras, como el tamaño de la muestra alcanza 1000, el intervalo de confianza del 95% de los parámetros se hace más estrecho y estable alrededor del valor verdadero y el valor medio es de forma constante cerca del valor real para cada parámetro. Al igual que en el logit multinomial modelo, el valor medio estimado para todas las variables parece estar sesgado para un tamaño de muestra por debajo de 1.000 observaciones.

Page 16: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

Fig. 3. Los intervalos de confianza de los parámetros de tamaño de la muestra para el modelo probit ordenado.

Para el modelo logit mixto, figuras. 5 y 6 muestran las relaciones entre ambos intervalos de confianza del 95% para los parámetros y el valor medio para cada parámetro como una función del tamaño de muestra. Patrones muy similares a los observados por encima se puede ver en estas dos figuras. Sin embargo, algunas diferencias se pueden notar por el parámetro variable fatal. Desde el parámetro variable fatal es aleatorio, se encontró ser menos estables tanto para el intervalo de confianza del 95% y el estimado valor medio, especialmente para los tamaños de muestra más pequeños. De hecho, el punto por el parámetro variable fatal estable se encuentra en torno a la marcan 5000 observaciones (lo usamos como punto estable para el modelo logit mixto), que es el más grande entre los tres modelos. Por último, se prevé que puede ser necesario un tamaño de muestra mayor para el modelo logit mixto, si más se introducen en el modelo.Para resumir, aunque los resultados anteriores se basan en datos simulados, todavía hay algunos de los resultados que podrían ser generalizados en

Page 17: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

términos de tamaño de la muestra para los tres modelos. Modelos de gravedad del choque con tamaños de muestra por debajo de 1000 no deben ser estimados. Además, el modelo probit ordenado es el que requiere la menor cantidad de muestras (>1000), el modelo logit mixto es la más exigente de las muestras (>5.000), mientras que los requisitos de modelo logit multinomiales se encuentran entre la probit ordenado y modelos logit mixtos (>2000).

5.2. Análisis basado en datos de accidentes

En el apartado anterior y en areas de la simplicidad, sólo se incluyeron una variable que se supone que es normalmente distribuida. Sin embargo, los datos de gravedad de choque tienen una gran cantidad de variación que podría conducir a diferente tamaño de la muestra, lo cual son requisitos para los tres modelos. Por lo tanto, llevamos a cabo nuevos análisis utilizando datos de un choque que se describen en la Sección 4. Para esta parte,

Fig. 4. Media de los parámetros de tamaño de la muestra para el modelo probit ordenado.establecer los modelos estimados a partir del conjunto de datos completos como las condiciones de línea de base (como se calcula en la sección 4). Entonces, los modelos de logit multinomial, logit mixto y probit ordenados se estimaron utilizando un método de muestreo estratificado para diferentes tamaños de muestreo: 100, 500,2000, 5000, 10000, 20000 y accidentes. El método de muestreo estratificado se utilizó con el fin de mantener las mismas tasas como proporción de los que se utilizan para el conjunto de datos completo: 45,3%, 20,1%, 22,2%, 9,4%, y 3,1% para la gravedad sin lesiones, posibles lesiones, no incapacitante lesiones, lesiones incapacitantes y mortales, respectivamente. En total, se seleccionaron 30 muestras al azar para cada tamaño de la muestra. A continuación, compararon los resultados con los

Page 18: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

calculados a partir de las condiciones de base para obtener el valor de sesgo, absoluta porcentual sesgo (APB) y la raíz cuadrada media de errores (ECM) para cada parámetro. Además, la media de APB, máximo de APB y el total de RMSE eran estimada como una función del tamaño de la muestra para cada modelo.Basándose en los 30 estimadores de modelos, para cada parámetro, el sesgo se calculó como Bias=E (βr )−βbaseline(donde r es el número de repeticiones

(r=30), β representa cada parámetro en el modelo, y E (βr ) se aproxima por

β=(1r )∑1r

¿1 β i. La APB fue calculada dividiendo el valor absoluto de sesgo en

el valor de línea de base. El RMSE se calculó como RMSE=√Bias2+Variable. Por lo tanto, la media de la APB entre todos los parámetros en un modelo que puede ser calculado tomando el promedio de los valores de todos los parámetros de APB. Además, el máximo de APB fue encontrado por la comparación del valor de cada parámetro APB en un modelo. Por último, RMSE total podría ser fácilmente alcanzado sumando el valor RMSE de cada parámetro en un modelo. Los resultados de la comparación basada en el análisis de los tres criterios de evaluación descritos en el párrafo anterior se resumen en la Tabla 4.

A partir de la tabla 4, observamos los siguientes resultados:

(1) Como era de esperar, los tres modelos muestran la misma tendencia observado con la simulación de datos: el aumento de tamaño de la muestra conduce a la reducción en todos los tres criterios (media de APB, Max de APB y RMSE total), la mejora de la exactitud del modelo de

Page 19: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

Fig. 5. Los intervalos de confianza de los parámetros de tamaño de la muestra para el modelo logit mixto.Estimación, una vez más, ya que los estimadores de máxima verosimilitud son consistentes, ya que el tamaño de la muestra tiende a infinito (o se convierte en muy grande), los parámetros estimados tendrán errores estándar más

Page 20: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

pequeños y esto conduce a un mejor rendimiento del modelo (Washington et al, 2011).(2) En términos de los valores de los tres criterios, el logit multinomial y logit mixto son más sensibles a los pequeños tamaños de las muestras que el modelo probit ordenado y esto es especialmente notable para los tamaños de la muestra igual a 100 y 500. Sin embargo, para un tamaño de muestra por debajo de 500, todos los modelos funcionan mal.

Fig. 6. Media de los parámetros de tamaño de la muestra para el modelo logit mixto.

Page 21: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

(3) De manera similar a los resultados que se muestran en la sección anterior, el modelo logit mixto necesita una gran cantidad de datos para disminuir el valor de la tres criterios. Incluso en 5000 observaciones, la media de APB, Max de APB y RMSE total para el modelo logit mixto es todavía dos veces más grande que los del modelo logit multinomial.(4) De acuerdo con los tres criterios, el tamaño mínimo de la muestra para el probit ordenado, logit multinomial y modelos logit mixtos debe ser 2.000, 5.000 y 10.000, respectivamente. En ese punto, los valores estimados se vuelven muy cerca de los valores "verdaderos" para los tres criterios. En resumen, estos resultados son consistentes con los encontrados con los datos simulados sobre qué modelos están más afectados por el problema pequeño de tamaño de la muestra. Sin embargo, los números son más grandes que los propuestos en simulación. Esto puede explicarse en parte por la gran variabilidad de los datos de accidentes y el número de muestras aleatorias corriendo (30 para cada tamaño de la muestra).

6. CONCLUSIONES Y RECOMENDACIONES

Ha habido una gran cantidad de estudios que han documentado la aplicación de los modelos de gravedad del choque para explorar la relación entre la gravedad del accidente y sus factores contribuyentes tales como las características del conductor, características de los vehículos, las condiciones de la calzada, y factores de carreteras y medio ambiente. Aunque una gran cantidad de trabajo se ha hecho sobre diferentes tipos de modelos, ninguna investigación ha sido realizada sobre la cuantificación de los requisitos de tamaño de la muestra para los modelos de gravedad del accidente. Similar a contar los modelos de datos, conjuntos de datos pequeños podría influir de manera significativa el rendimiento del modelo. El objetivo de este estudio consistió en examinar y cuantificar los efectos de los diferentes tamaños de la muestra sobre el desempeño de los tres modelos de gravedad más utilizados del choque más utilizados: el logit multinomial, Probit ordenados y modelos logit mixtos. El objetivo de este estudio se llevó a cabo mediante el uso de un análisis de Monte-Carlo basado en simulación de datos y datos observados. El tamaño de muestra investigada variaba entre 100 y 10.000 observaciones.

El uso de 26.175 accidentes de tráfico de un solo vehículo que involucran objetos fijos en las zonas rurales de dos vías en la carreteras en Texas, fue la primera encontrado que el modelo logit mixto tiene un mejor poder interpretativo que el modelo logit multinomial, mientras que este último modelo tenía el poder interpretativo superior que el modelo probit ordenado. Por otro lado, el modelo probit ordenado tenía un poco mejor bondad de ajuste que el del logit multinomial y modelos logit mixtos, pero el modelo logit mixto tuvo una significativa mejor ya que el ajuste que el modelo logit multinomial.Los resultados de la simulación de datos y muestras aleatorias extraídas de 26.175 registros de choque son consistentes con antes las expectativas de que los pequeños tamaños de muestra afectan de manera significativa el desarrollo de modelos de gravedad del choque, no importa qué tipo es utilizado. Además,

Page 22: La Comparación de Los Tres Modelos de Gravedad de Choque de Uso Comúnsobre Los Requisitos de Tamaño de La Muestra 2

entre los tres modelos, el modelo logit mixto requiere el mayor tamaño de la muestra, mientras que el modelo de probit ordenado requiere que el menor tamaño de la muestra. El requisito de tamaño de la muestra para el modelo logit multinomial se encuentra entre estos dos modelos. En general, los números absolutos mínimos recomendados de observaciones para el probit ordenado, logit multinomial, y modelos logit mixtos son 1000, 2000 y 5000, respectivamente. A pesar de que esos valores son pautas recomendadas, conjuntos más grande de datos se deben buscar, como lo demuestra el análisis utilizando datos de accidentes observados (mayor variabilidad en los datos de accidentes o más aleatoriedad estimado en el modelo logit mixto). Con el fin de minimizar el sesgo producido por el tamaño de la muestra insuficiente, la secuencia de la selección de un modelo de los tres es el modelo probit ordenado, modelo logit multinomial y el modelo de logit mixto como se mencionó anteriormente. Este estudio es un primer paso en la comparación de modelos del tamaño de la muestra en los modelos de gravedad del choque. Se necesitan más investigaciones para generalizar los requisitos de tamaño de la muestra para el desarrollo de los tres modelos evaluados en este estudio, que puede ser parcialmente dependiente de las características de los datos, como se discute en Savolainen et al. (2011). Por último, el mismo tipo de investigación debe ampliarse a otros modelos de gravedad de accidente (por ejemplo, los parámetros aleatorios ordenados modelo probit, modelos finito de mezcla, modelos de Markov de conmutación, etc.).