modelos generalizados luis m. carrascal los modelos generalizados lineales tienen tres propiedades:...

22
MODELOS GENERALIZADOS Luis M. Carrascal modelos Generalizados Lineales tienen tres propied la estructura del error el predictor lineal la función de vínculo

Upload: fernanda-macia

Post on 24-Jan-2016

226 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

MODELOS GENERALIZADOS

Luis M. Carrascal

Los modelos Generalizados Lineales tienen tres propiedades:

1) la estructura del error

2) el predictor lineal

3) la función de vínculo

Page 2: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

ESTRUCTURA DEL ERROR

En modelos Generales Lineales la variable dependiente y sus residuos debían ajustarse a una normal.

Sin embargo, hay numerosas situaciones en las que esto no ocurre:1) errores fuertemente sesgados o con mucha kurtosis2) los datos están acotados (proporciones; no mayores que 1/1)3) no existen valores menores que cero (conteos).

Ante estos hechos en GLM nos ‘aproximábamos’ transformando para conseguir la normalidad de los errores

(residuos)

Page 3: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

ESTRUCTURA DEL ERROR (2)

Si generalizamos la definición de la distribución de los errores, entonces podemos trabajar con otras distribuciones de los mismos:

1) distribuciones Poisson (útiles con conteos)2) distribuciones Binomiales (útiles con proporciones)3) distribuciones Gamma (datos con CV homogéneo)4) ...

Page 4: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

variable

No

of

ob

s

02468

10121416182022

-1 0 1 2 3 4 5 6

Variable Poisson

Page 5: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

PREDICTOR LINEAL

Se relacionan valores observados con aquellos predichos por el modelo

El valor predicho se obtiene a partir de un predictor lineal (‘eta’).Si el predictor lineal no mantiene una asociación lineal con los valores originales, entonces debe ser transformado.

La estructura lineal viene definida por:

Para i observaciones (casos) y p variables predictoras.xij son los valores del caso i en la variable jbetaj es el coeficeinte de regresión que define una asociación lineal con los valores xij.

Page 6: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

FUNCIÓN DE VÍNCULO

Para determinar la estructura lineal del predictor, el procedimiento GzLM evalua diferentes configuraciones del predictor lineal que incluye los coeficientes betaj, comparando los valores predichos ‘etai’ con los valores observados en la variable respuesta (dependiente).

En estas comparaciones entre valores observados y valores predichos ‘etai’, debe ocurrir que la asociación sea lineal. Por ello necesitamos definir una función que establezca este vínculo lineal (g). g(x) es la función predictora.

g(xi) = α + β1·x1i + ... + βp·xpi

etai = g(xi)

Page 7: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

FUNCIÓN DE VINCULO (2)

El valor predicho para y (E[Yi]) se obtiene efectuando el inverso de la función de vínculo con los valores ‘eta’.

E[Yi] = inverso de la función g(xi)

La mejor función de vínculo es aquella que consigue que los valores observados y predichos estén bastante próximos a lo largo de todo el espectro de variación de la variable dependiente.

Page 8: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

FUNCIÓN DE VINCULO (3)

Page 9: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

PROCEDIMINETOS DE ESTIMA

En GLM, trabajando con distribuciones normales, el procedimiento OLS es adecuado.

Sin embargo, para otras distribuciones de errores que no se ajusten a la normal, el procedimiento OLS proporciona estimas sesgadas de los valores de los parámetros betaj.

El procedimiento utilizado en esta ocasión es el de ‘maximum likelihood’.

Supone una búsqueda iterativa de soluciones (no existe una solución única que pueda obtenerse por álgebra matricial).

Page 10: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

PROCEDIMINETOS DE ESTIMA (2)

Maximum likelihood es un procedimiento laborioso de búsqueda de soluciones.

Se busca el modelo más adecuado que mejor describa los datos observados (variación de la variable dependiente).

El modelo se ajusta a los datos, no a la inversa. El mejor modelo es aquel que produce la mínima variabilidad residual, bajo la premisa de que todos los parámetros en el modelo son estadísticamente significativos.

Page 11: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

PROCEDMINETOS DE ESTIMA (3)

Se asumen los siguientes hechos:1) dado que los datos son correctos2) dado que tenemos un modelo que describe los datos3) ¿cuáles son los parámetros del modelo que

maximizan la probabilidad de predecir correctamentelos datos observados?

Si el modelo es apropiado,y los parámetros obtenidos son buenos, entonces ...

es muy probable que los datos observados en la variable dependiente se deriven de los procesos implícitos en el modelo

Page 12: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

PROCEDIMINETOS DE ESTIMA (4)

El algoritmo de cálculo se denomina:‘iterative, weighted least squares’

La magnitud de discrepancia entre el modelo (aproximación a la realidad y sus mecanismos) y los datos es una medida de lo inadecuado del modelo. Se denomina DEVIANZA.

Comparando la devianza del modelo seleccionado con la devianza del ‘modelo completo’ se tiene una medida de cuan adecuado es el modelo.

Page 13: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

PROCEDIMINETOS DE ESTIMA (5)

‘mu’ es la media

Page 14: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

PROCEDIMINETOS DE ESTIMA (6)

La discrepancia (devianza; S) del ajuste es proporcional a dos veces la diferencia entre el ‘maximum likelihood’ (l) obtenible y el ‘maximum likelihood’ retenido por el modelo.

S(modelo,máxima) = - 2 · ln (lmodelo/lmáxima)

con g.l.máxima - g.l.modelo

grados de libertad

Page 15: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

PROCEDIMINETOS DE ESTIMA (7)

Tipos de modelos:NULO: sólo la gran media

COMPLETO: (‘full’): tantos parámetros como observaciones (dev=0)

MAXIMO: el que contiene todos los efectos identificados como ‘potencialmente’ relevantes.

SELECCIONADO

MINIMO ADECUADO: con el mínimo número de efectos (parámetros estimados), siendo estos significativos.

Page 16: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

PROCEDIMINETOS DE ESTIMA (8)

A la hora de efectuar la selección del modelo adecuado (o el mínimo adecuado) debemos seguir procesos ‘stepwise’.

Esta aproximación no supone un problema si los efectos (i.e., variables independientes) son ortogonales, esto es, efectivamente independientes entre si.

Si este no es el caso (dependencia entre variables independientes), entonces el orden de salida de las variables independientes afectará a la devianza de los sucesivos modelos (en backward stepwise). Por tanto, la significación de efectos dependerá principalmente de la secuencia de la salida de las variables y no de su magnitud de efecto real. Este problema se agrava en ‘forward stepwise’.

Por tanto reducción por AIC.

Page 17: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

SIGNIFICACIÓN DE EFECTOS

Excepto en el caso de los errores normales y la función de vínculo identidad, no podemos asignar probabilidades exactas en el examen de la significación de los efectos.

Para tamaños muestrales grandes (>30) las probabilidades son asintóticamente correctas si no ha habido apreciables desvíos de los supuestos canónicos (las probabilidades reales serán parecidas a las estimadas).

Dos modos de estimar probabilidades:1) mediante los parámetros y sus errores estándar obteniendo t-Student2) comparando el modelo con sus efectos con otros que no incluyen cada uno de ellos (estimar los cambios en devianza) -----> LA MEJOR APROXIMACIÓN

Page 18: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

SIGNIFICACIÓN DE EFECTOS (2)

1) Introducimos todos los efectos anotamos devianza, grados de libertad (modelo 1)

2) Eliminamos un efecto; estimamos su modelo (modelo 2)

3) Contribución del efecto eliminado: DEVIANZA MOD 1 - DEVIANZA MOD 2 Grados de libertad del efecto: GRADOS LIB MOD 1 - GRADOS LIB MOD 2

4) Estima de significación: Chi2 = diferencia de devianzas con grados de libertad = diferencia de los gardos de libertad

Page 19: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

SIGNIFICACIÓN DE EFECTOS (3)

5) También podemos aproximarnos a una F de Fisher comparando dos modelos (1 vs nulo (n)) y el coeficiente de sobredispersión (ρ) devianza residual (D1) y grados de libertad (p) del modelo 1 devianza residual (Dn) y grados de libertad (q) del modelo 2

F ≈ (Dn – D1) / (ρ · (p – q))

6) Estima de significación: F con grados de libertad = diferencia de los grados de libertad

Page 20: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

REVISIÓN DE LA VALIDEZ DEL MODELO

Es un problema importante al trabajar con errores binomiales, multinomiales o poisson.

La devianza escalada, o la Chi2 de Pearson escalada deben aproximarse a UNO.

Si no se aproximan a 1:1) los supuestos canónicos acerca de la distribución de los errores y la función de vínculo establecida son inadecuados2) no se han considerado otras variables independientes que son importantes en el sistema

Si ρ > 1 contribuye a inflar el error de tipo I ρ < 1 contribuye a inflar el error de tipo II

SOBREDISPERSIÓN (OVERDISPERSION)

Page 21: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

REVISIÓN DE LA VALIDEZ DEL MODELO (2)

SOBREDISPERSIÓN (2)

Si el parámetro sobredispersión se desvía “sustancialmente” de UNO:

1) corregimos las estimas de significación con la devianza escalada (no cambian los parámetros de regresión, pero SÍ las p’s)

2) transformamos los valores de las variables independientes

3) rehacemos el modelo con otras distribuciones o funciones de vínculo canónicas.

Page 22: MODELOS GENERALIZADOS Luis M. Carrascal Los modelos Generalizados Lineales tienen tres propiedades: 1) la estructura del error 2) el predictor lineal 3)

EXPLORACIÓN DE RESIDUOS

REVISIÓN DE LA VALIDEZ DEL MODELO (3)

‘Residual plots’: representación de los residuos frente a las predicciones del modelo. Deben producir ‘patrones de cielo estrellados’ ADEMÁS:1) Leverage2) Distancias de Cook

Y