colaboraciÓn especial - mscbs.gob.es...rev esp salud pública 2004; 78: 177-188 n.º 2 -...

12
Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 APLICACIONES DE LOS MODELOS MULTINIVEL AL ANÁLISIS DE MEDIDAS REPETIDAS EN ESTUDIOS LONGITUDINALES (*) María Victoria Zunzunegui(1), María Jesús García de Yébenes (2), Mathieu Forster (3), María Dolores Aguilar Conesa (1), Angel Rodríguez Laso (2) y Ángel Otero (2) (1) Técnicas avanzadas de investigación en servicios de salud (TAISS), Madrid (2) Centro Universitario de Salud Pública, Universidad Autónoma de Madrid (3) Département de Médecine sociale et préventive, Université de Montréal (*) Trabajo financiado por la fundación BBVA, Convocatoria 2002 sobre Economía, Demografía y estudios de población RESUMEN Este trabajo es una introducción al análisis de medidas repetidas en estudios longitudinales. Se utiliza un marco analítico con dos eta- pas, ajustando modelos jerárquicos lineales con dos niveles. El pri- mer nivel corresponde a la ocasión (tiempo) de medida y el segundo al individuo. Estos modelos estadísticos proceden de las ciencias sociales, en las que se han utilizado durante más de 25 años para ana- lizar datos en organizaciones con múltiples niveles. Su aplicación permite estudiar los cambios en alguna característica de interés (esta- do de salud o factor de riesgo) y analizar las circunstancias que expli- can la variabilidad en las trayectorias individuales. En este trabajo se introducen los conceptos básicos de este método: variabilidad entre individuos y dentro de cada individuo a lo largo del tiempo, modelo del nivel individual para describir la trayectoria de cada individuo y modelo «entre individuos» para describir cómo cambian las trayec- torias entre individuos, efectos fijos y efectos aleatorios, modelos de crecimiento lineal y cuadrático. Para ello se ha realizado un análisis de los cambios en la función cognitiva de una cohorte de personas mayores, el estudio «Envejecer en Leganés», seguida cada dos años, entre 1993 y 1999. Se presentan los resultados de modelos ajustados para resolver las preguntas de investigación más frecuentes en la des- cripción y el análisis de las trayectorias de cambio individual. Por último, se comentan posibles generalizaciones de estos modelos lineales jerárquicos a situaciones en las que la variable de interés no es continua, como es el caso de las variables dependientes dicotómi- cas, nominales u ordinales. Palabras clave: Modelos multinivel. Estudios longitudinales. Función cognitiva. ABSTRACT Multilevel models applications to the analysis of longitudinal data This work is an introduction to repeated measurement analysis for longitudinal studies. It uses a two stage modelling framework, using hierarchical linear models with two levels. The first level per- tains to the repeated measures, the second level pertains to the indi- vidual. For the last 25 years, hierarchical linear models have been used in the Social Sciences to analyse data coming from organiza- tions with multiple levels. Their applications have been extended to the study of change in populations, both to describe the average change in an outcome variable in a population and to analyse the fac- tors associated with variability in the individual trajectories of chan- ge. In this article, the basic concepts are introduced: between sub- jects and within subjects variability, the person-specific model for the individual trajectory and the between person model to describe how individuals vary in their trajectories, fixed and random effects, linear and quadratic growth models. At the end of each section, an illustration is given for the study of cognitive function of the older people cohort «Aging in Leganés», followed in four occasions bet- ween 1993 and 1999. Results from fitting the models to answer the most frequently asked research questions in the description and analysis of individual change are presented. Lastly, we present pos- sible generalizations of these linear models to non linear situations which arise when outcomes are dichotomous, nominal or ordinal. Key words: Multinivel models. Longitudinal studies. Cognitive function. Correspondencia: María Victoria Zunzunegui Técnicas avanzadas de investigación en servicios de salud C/Cambrils 41-2 Madrid 28034 Correo electrónico: [email protected] INTRODUCCIÓN El estudio de procesos relacionados con la salud de la población comprende las tres eta- pas clásicas de la investigación epidemioló- gica 1 . La primera consiste en describir la tra- COLABORACIÓN ESPECIAL

Upload: others

Post on 05-Jun-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: COLABORACIÓN ESPECIAL - mscbs.gob.es...Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 ... supuesto un reto para la estadística aplicada, principalmente por dos

Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004

APLICACIONES DE LOS MODELOS MULTINIVEL AL ANÁLISIS DE MEDIDASREPETIDAS EN ESTUDIOS LONGITUDINALES (*)

María Victoria Zunzunegui(1), María Jesús García de Yébenes (2), Mathieu Forster (3), MaríaDolores Aguilar Conesa (1), Angel Rodríguez Laso (2) y Ángel Otero (2)(1) Técnicas avanzadas de investigación en servicios de salud (TAISS), Madrid(2) Centro Universitario de Salud Pública, Universidad Autónoma de Madrid(3) Département de Médecine sociale et préventive, Université de Montréal(*) Trabajo financiado por la fundación BBVA, Convocatoria 2002 sobre Economía, Demografía y estudios de población

RESUMEN

Este trabajo es una introducción al análisis de medidas repetidasen estudios longitudinales. Se utiliza un marco analítico con dos eta-pas, ajustando modelos jerárquicos lineales con dos niveles. El pri-mer nivel corresponde a la ocasión (tiempo) de medida y el segundoal individuo. Estos modelos estadísticos proceden de las cienciassociales, en las que se han utilizado durante más de 25 años para ana-lizar datos en organizaciones con múltiples niveles. Su aplicaciónpermite estudiar los cambios en alguna característica de interés (esta-do de salud o factor de riesgo) y analizar las circunstancias que expli-can la variabilidad en las trayectorias individuales. En este trabajo seintroducen los conceptos básicos de este método: variabilidad entreindividuos y dentro de cada individuo a lo largo del tiempo, modelodel nivel individual para describir la trayectoria de cada individuo ymodelo «entre individuos» para describir cómo cambian las trayec-torias entre individuos, efectos fijos y efectos aleatorios, modelos decrecimiento lineal y cuadrático. Para ello se ha realizado un análisisde los cambios en la función cognitiva de una cohorte de personasmayores, el estudio «Envejecer en Leganés», seguida cada dos años,entre 1993 y 1999. Se presentan los resultados de modelos ajustadospara resolver las preguntas de investigación más frecuentes en la des-cripción y el análisis de las trayectorias de cambio individual. Porúltimo, se comentan posibles generalizaciones de estos modeloslineales jerárquicos a situaciones en las que la variable de interés noes continua, como es el caso de las variables dependientes dicotómi-cas, nominales u ordinales.

Palabras clave: Modelos multinivel. Estudios longitudinales.Función cognitiva.

ABSTRACT

Multilevel models applications to theanalysis of longitudinal data

This work is an introduction to repeated measurement analysisfor longitudinal studies. It uses a two stage modelling framework,using hierarchical linear models with two levels. The first level per-tains to the repeated measures, the second level pertains to the indi-vidual. For the last 25 years, hierarchical linear models have beenused in the Social Sciences to analyse data coming from organiza-tions with multiple levels. Their applications have been extended tothe study of change in populations, both to describe the averagechange in an outcome variable in a population and to analyse the fac-tors associated with variability in the individual trajectories of chan-ge. In this article, the basic concepts are introduced: between sub-jects and within subjects variability, the person-specific model forthe individual trajectory and the between person model to describehow individuals vary in their trajectories, fixed and random effects,linear and quadratic growth models. At the end of each section, anillustration is given for the study of cognitive function of the olderpeople cohort «Aging in Leganés», followed in four occasions bet-ween 1993 and 1999. Results from fitting the models to answer themost frequently asked research questions in the description andanalysis of individual change are presented. Lastly, we present pos-sible generalizations of these linear models to non linear situationswhich arise when outcomes are dichotomous, nominal or ordinal.

Key words: Multinivel models. Longitudinal studies. Cognitivefunction.

Correspondencia:María Victoria Zunzunegui Técnicas avanzadas de investigación en servicios de saludC/Cambrils 41-2Madrid 28034Correo electrónico: [email protected]

INTRODUCCIÓN

El estudio de procesos relacionados con lasalud de la población comprende las tres eta-pas clásicas de la investigación epidemioló-gica1. La primera consiste en describir la tra-

COLABORACIÓN ESPECIAL

Page 2: COLABORACIÓN ESPECIAL - mscbs.gob.es...Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 ... supuesto un reto para la estadística aplicada, principalmente por dos

yectoria que sigue un individuo a lo largo delproceso, es decir a medida que el tiempotranscurre: el crecimiento de un niño, elenvejecimiento de una persona mayor o elcurso natural de una enfermedad. La segun-da consiste en identificar factores de riesgo yfactores de protección y analizar sus relacio-nes con el proceso en estudio. Estos factoresinfluyen sobre la dirección y la magnitud delos cambios. Pueden ser factores inmutablesa lo largo del tiempo, características perma-nentes de los individuos, tales como el sexoo la composición genética, o factores quevarían con el tiempo, como los ingresos eco-nómicos, el peso corporal o los hábitos devida. Además los individuos están expuestosa factores ambientales característicos dellugar donde viven, estudian, trabajan opasan su tiempo libre. La tercera etapa con-siste en estudiar el efecto de las intervencio-nes que tienen como objeto mejorar o mante-ner la salud de la población. El objetivo deestos estudios consiste en diseñar, llevar acabo y evaluar intervenciones que maximi-zen la probabilidad de un óptimo desarrolloinfantil o de conservar la capacidad funcio-nal durante el proceso de envejecimiento.

Los estudios longitudinales son esencialespara aumentar el conocimiento sobre el desa-rrollo infantil, el envejecimiento y sobre loscambios que ocurren en el organismo comoconsecuencia de las enfermedades crónicas.Se trata de describir el cambio medio en lapoblación y las diferencias en los cambios delos individuos que componen la población2-4.Algunas preguntas de interés pueden ser¿Cómo evoluciona la función cognitiva en elprimer año de vida? ¿Varía la evolución de lafunción cognitiva en el primer año de vidasegún los ingresos medios del hogar donde senace? La primera pregunta se dirige a la des-cripción de la evolución media de la funcióncognitiva. La segunda se orienta a identificarun factor que puede explicar diferencias en laevolución de los niños de esa población. Paraestudiar el cambio individual es necesariorealizar medidas repetidas sobre cada indivi-duo a lo largo del tiempo.

El análisis de medidas repetidas hasupuesto un reto para la estadística aplicada,principalmente por dos motivos. El primerode ellos es el manejo de la interdependenciade las observaciones repetidas sobre cadaindividuo; el segundo, la limitación de losmétodos clásicos que requieren disponer delmismo número de observaciones (datoscompletos) para cada individuo. Se ha des-arrollado gran número de procedimientosestadísticos para tener en cuenta la interde-pendencia de las observaciones (MANOVA,Generalized Linear Equations). Sin embar-go, el requisito de datos completos sigue res-tringiendo de forma importante el número decasos disponibles para el análisis. La reduc-ción subsiguiente del tamaño muestral con-lleva una menor precisión en las estimacio-nes y un riesgo de sesgo de selección, ya quela muestra final es una submuestra de losparticipantes en el estudio que puede diferirde la muestra total en cuanto a la distribuciónde las variables consideradas.

El propósito de este trabajo es presentaruna introducción a la formulación de mode-los multinivel para el análisis de medidasrepetidas en estudios longitudinales e ilus-trar su utilidad mediante el estudio de loscambios de la función cognitiva en la pobla-ción mayor de 65 años en Leganés.

El objetivo del estudio longitudinal Enve-jecer en Leganésera analizar la influencia delas redes sociales en la salud, la capacidadfuncional y la utilización de servicios en unacohorte de personas mayores españolas. Enel diseño original se pretendía obtener infor-mación sobre cada participante en 5 ocasio-nes, separadas por intervalos de dos años apartir de 19935. En la práctica se realizaron 4trabajos de campo en 1993, 1995, 1997 y1999. No todas las personas pudieron serentrevistadas en cada ocasión debido adefunciones, rechazos y pérdidas durante elseguimiento. De las 1.558 personas selec-cionadas aleatoriamente a partir del PadrónMunicipal, se completaron 1.283 entrevistasen 1993, 1.012 en 1995, 879 en 1997 y 527

María Victoria Zunzunegui et al.

178 Rev Esp Salud Pública 2004, Vol. 78, N.º 2

Page 3: COLABORACIÓN ESPECIAL - mscbs.gob.es...Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 ... supuesto un reto para la estadística aplicada, principalmente por dos

en 1999. Uno de los indicadores de estado desalud considerado en este estudio fue la fun-ción cognitiva, variable de resultado utiliza-da en el presente trabajo. La función cogniti-va se midió con una escala diseñada y vali-dada específicamente para personas mayo-res con bajo nivel de instrucción, la PruebaCognitiva de Leganés (PCL), con un rangode valores entre 0 y 326,7. Se obtuvierondatos sobre la función cognitiva en al menosuna ocasión para 1.463 personas.

Las variables independientes utilizadas eneste estudio han sido la edad (calculada encada ocasión a partir de la fecha de la entre-vista y la fecha de nacimiento), el sexo y elnivel de instrucción (recogido en cuatrocategorías: analfabetos, sin escolarización,primaria incompleta y primaria completa).Las preguntas de investigación que se dese-an contestar son: 1) ¿Cómo varía la funcióncognitiva con la edad?; 2) ¿Difieren los nive-les medios de función cognitiva de los hom-bres y las mujeres? ¿Difiere la velocidad deldeterioro cognitivo según el sexo?; 3)¿Difieren los niveles medios de función cog-nitiva según nivel de instrucción? ¿Difiere lavelocidad del deterioro cognitivo según elnivel de instrucción?

Formulación del modelo de dos nivelespara las medidas repetidas

El objetivo de los estudios longitudinaleses analizar el cambio individual en algunacaracterística concreta; en nuestro caso, ladisminución de función cognitiva con elenvejecimiento. En resumen, se trata de des-cribir los cambios en una característica desalud en una población mediante dos ecua-ciones. La primera modela la trayectoriaindividual o evolución que sigue cada indi-viduo a lo largo del tiempo. La segunda des-cribe la variación de las trayectorias entreindividuos e identifica factores que explicanlas diferencias entre individuos. Este esque-ma de análisis estadístico recibe varios nom-bres: modelos jerárquicos, modelos multini-

vel, modelos mixtos de efectos fijos y alea-torios y, por ultimo, modelos de crecimiento.

En el análisis de datos longitudinales seutiliza un modelo jerárquico con dos niveles:el nivel 1 serán las medidas repetidas y elnivel 2 el individuo3,4. El nivel 1 describe laevolución de cada individuo mediante unafunción matemática cuyos parámetros serána su vez las variables de resultado en elmodelo de nivel 2. En función de los predic-tores utilizados en las ecuaciones de nivel 1y nivel 2, tendremos diferentes tipos demodelos, los cuales se describen a continua-ción.

Modelo multinivel no-condicional o«modelo vacío»

El modelo lineal jerárquico más sencilloes aquel que no contiene predictores de nin-gún tipo. Este modelo se denomina «Modelovacío»3 o «Modelo no-condicional»y susparámetros tienen interpretaciones útilespara comprender el proceso en estudio.

La ecuación del modelo no condicional seformula de la siguiente manera:

Nivel 1 (medidas repetidas):

Yti= π0i + εti (Eq 1)

donde π0i es la intersección en el origen y εtilos errores de nivel 1. Se asume que los erro-res de nivel 1 (εti) siguen una distribuciónnormal con una media de 0 y una varianzaconstante (σ2). Es importante observar queeste modelo predice el resultado dentro de launidad de nivel 1 (medidas repetidas) con unsolo parámetro de nivel 2, la intersección enel origen, π0i, que representa el resultadopromedio para el individuo i.

Nivel 2 (ecuación entre personas):

π0i= β00 + r0i (Eq 2)

APLICACIONES DE LOS MODELOS MULTINIVEL AL ANÁLISIS DE MEDIDAS REPETIDAS EN ESTUDIOS LONGITUDINALES

Rev Esp Salud Pública 2004, Vol. 78, N.º 2 179

Page 4: COLABORACIÓN ESPECIAL - mscbs.gob.es...Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 ... supuesto un reto para la estadística aplicada, principalmente por dos

El parámetro β00 es la media de la pobla-ción. El parámetro r0i es el efecto aleatoriodel nivel 2 ó desviación de la media de cadaindividuo respecto a la media de toda lapoblación (β00) y se asume que tiene unamedia de 0 y una varianza τ00.

Si sustituimos la segunda ecuación en laprimera obtendremos la formulación com-pleta del modelo no condicional:

Yti= β00 + r0i + εti

En este modelo sin variables predictoras,la varianza entre individuos, var(r0i)= τ00estima la variabilidad de la media de lapoblación, mientras que la variabilidad den-tro de los individuosó varianza de los erro-res, var(εti)=σ2, se calcula teniendo en cuen-ta todas las medidas que se hacen en cadaindividuo de t=0,1... T. La varianza total,var(Yti), será igual a la suma de τ00 y σ2.

La estimación del modelo no condicionales un paso preliminar muy útil en el análisisde datos jerárquicos, ya que permite obteneruna estimación puntual de la media pobla-cional, β00, y ofrece información sobre lavariabilidad del resultado en cada uno de losdos niveles. El coeficiente de correlaciónintraclases(CCI), o cociente entre la varia-bilidad entre individuos (τ00) y la variabili-dad total (τ00+ σ2), expresa la proporción dela variabilidad total que es atribuible a dife-rencias entre individuos. Si este coeficiente,con rango de 0 a 1, es elevado podremos ase-gurar que las trayectorias de diferentes per-sonas son muy variables (τ00 >> σ2), y queestas diferencias podrían deberse a caracte-rísticas del individuo.

En los análisis de medidas repetidas, elmodelo vacío sirve para contestar las dosprimeras preguntas de investigación: 1)¿Hay variabilidad entre individuos? En otraspalabras: ¿Son variables las trayectorias delos individuos?; 2) ¿Hay variabilidad de losindividuos a lo largo del tiempo? En otraspalabras, ¿evoluciona la característica Y amedida que transcurre el tiempo?

La puntuación en la Prueba Cognitiva deLeganés(PCL), variable dependiente utili-zada para este trabajo, no sigue una distribu-ción normal, ya que la mayoría de personasmayores tienen valores superiores a 20 yexiste una minoría de personas con gravedeterioro cognitivo y valores próximos acero. Para intentar normalizar este tipo devariables se puede tomar el logaritmo de(Valor máximo–X +1), siendo X la puntua-ción obtenida en la PCL. Ya que en este casoel valor máximo es 32, el valor de la PCL setransforma en el logaritmo natural de (32-PCL+1). La variable resultante de esta trans-formación es aproximadamente normal y losvalores elevados son indicativos de deterio-ro cognitivo8.

A continuación se presenta la tabla deresultados del ajuste del «modelo vacío» alos datos de Leganés utilizando la variabletransformada de la puntuación PCL comovariable de resultado (tabla 1). Como serecordará, este modelo no incluye ningunavariable predictora. Por tanto, únicamente seobtiene una estimación de la varianza entremedidas repetidas de cada individuo y de lavarianza entre individuos. A partir de estasdos varianzas se puede calcular el CCI.

A partir de esta salida del programa deordenador HLM Versión 57, se puede calcu-lar el valor medio de la función cognitiva enesta muestra de 3.377 observaciones, queproceden de 1.463 individuos observados unnúmero de ocasiones que va de 1 a 4. Estevalor medio es el Log (32-exp(2,06)+1)=25,15 con su intervalo de confianza del95%= (24,9-25,4).

El coeficiente de correlación intraclases(0,2484/(0,2484+0,2708)=0,48) nos infor-ma de que el 48% de la variabilidad en lasmedidas de función cognitiva es atribuible adiferencias entre individuos, mientras queel 52% restante es atribuible a la evolucióncon el transcurso del tiempo en cada indivi-duo.

María Victoria Zunzunegui et al.

180 Rev Esp Salud Pública 2004, Vol. 78, N.º 2

Page 5: COLABORACIÓN ESPECIAL - mscbs.gob.es...Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 ... supuesto un reto para la estadística aplicada, principalmente por dos

Modelo multinivel con variablesexplicativas que cambian en el tiempo

El segundo paso consiste en intentarexplicar la variabilidad observada entre lastrayectorias de los individuos introduciendoen el modelo variables que cambian en eltiempo, como por ejemplo la edad o el añode encuesta.

Modelo de crecimiento lineal

Este modelo asume que existe un creci-miento lineal de la característica de interéscon la edad. En este caso la trayectoria indi-vidual vendrá representada por dos paráme-tros: la intersección en el origen y la pen-diente, más un término de error (εti).

Yi= b0 + b1* edadi + εti

Estos parámetros, b0 (intersección en elorigen) y b1 (pendiente), serán a su vez lasvariables dependientes de las ecuaciones denivel dos.

Ecuación de nivel 1 (trayectoriaindividual):

Yti= π0i + π1i edadti + εti

donde

Yti= valor de la variable de resultado para lapersona i en el instante t. Si las ocasiones demedida son cuatro, t=0,1,2,3.

edadti= edad de la persona i en el instante t.

π0i= Intersección en el origen o valor delresultado cuando la variable predictora esigual a cero. Para facilitar la interpretación

APLICACIONES DE LOS MODELOS MULTINIVEL AL ANÁLISIS DE MEDIDAS REPETIDAS EN ESTUDIOS LONGITUDINALES

Rev Esp Salud Pública 2004, Vol. 78, N.º 2 181

Tabla 1

Modelo 1 o no condicional

Tabla 2

Modelo 2: predictores que cambian en el tiempo

Page 6: COLABORACIÓN ESPECIAL - mscbs.gob.es...Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 ... supuesto un reto para la estadística aplicada, principalmente por dos

de este coeficiente es preciso realizar unatransformación de la variable predictoramediante el método de centrado de variablesque se describe posteriormente.

π1i = Pendiente o aumento esperado en elresultado Y con un incremento en la variableindependiente; en este caso, un año de edado un año desde que comenzó el estudio.También se denomina tasa de cambio en Ypor una unidad de «edad», o velocidad decambio por unidad de tiempo.

Asumimos que los errores εti siguen unadistribución normal con varianza σ2 y queson independientes.

Ecuaciones de nivel 2 (variaciónde trayectorias entre individuos)

π0i=β00 + r0i

π1i= β10 + r1i

El parámetro β00 representa el valor mediode Y al inicio del estudio, (siempre que lavariable edad haya sido centrada en el valorinferior del rango de edad), y el parámetro β10representa la velocidad media de crecimientode Y. La varianza de π1i informa de la varia-bilidad de velocidades entre los individuos.

La correlación de la velocidad de cambiocon el estado inicialtambién tiene interés enel estudio de los cambios en un proceso. Enlos modelos lineales con crecimiento indivi-dual, esta correlación viene dada por:

Corr (π0i, π1i) = τ01 / (τ00 * τ11)½

Donde τ00=var (τ0i)

τ11=var (π1i)

τ01=covar (π0i,π1i)

María Victoria Zunzunegui et al.

182 Rev Esp Salud Pública 2004, Vol. 78, N.º 2

Figura 1

Relación entre la intersección en el origen y la pendiente

Correlación >0 Correlación <0

Page 7: COLABORACIÓN ESPECIAL - mscbs.gob.es...Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 ... supuesto un reto para la estadística aplicada, principalmente por dos

Una elevada correlación entre la intersec-ción y la pendiente indica que la evoluciónde Y (cambios en Y con el tiempo) dependedel valor inicial de Y (figura 1).

Modelo de crecimiento cuadráticocon la edad

Si la relación entre la variable de respues-ta (outcome) y la edad no es lineal, podemosformular otros modelos que se adaptenmejor a las observaciones. Por ejemplo, sesabe que la función cognitiva se deteriora deforma acelerada a edades avanzadas. Portanto, es posible que los cambios en la fun-ción cognitiva se describan mejor medianteuna función matemática que incluya un tér-mino cuadrático para la edad. Este modelose llama modelo de crecimiento cuadrático.

En este caso la ecuación de nivel 1 inclui-rá un término cuadrático π2i * edadti

2 convarianza τ22 y covarianzas con la intersec-ción y la pendiente τ02 y τ12. El parámetro π2irepresenta la aceleración del deterioro cog-nitivo con la edad.

Ecuación de nivel 1:

Yti = π0i + π1i *edadti+ π2i *edad ti2+ εti

Ecuaciones de nivel 2

π0i=β00 + r0i

π1i=β10 + r1i

π2i=β20 + r2i

La estimación de tres componentes alea-torios de error requiere un gran tamaño demuestra. Puesto que la base de Leganés eslimitada y el programa de estimación deHLM que utiliza procedimientos iterativosno converge al intentar calcular los paráme-tros del modelo, se decidió asumir una varia-ción aleatoria únicamente en la interseccióny estimar de forma fija los coeficientes de laedad y la edad al cuadrado. Equivale a asu-mir que la variabilidad entre las personasmayores se manifiesta de forma transversalpero que el envejecimiento cognitivo novaría aleatoriamente con la edad, ni con eltérmino cuadrático de la edad. El modelo aestimar es:

APLICACIONES DE LOS MODELOS MULTINIVEL AL ANÁLISIS DE MEDIDAS REPETIDAS EN ESTUDIOS LONGITUDINALES

Rev Esp Salud Pública 2004, Vol. 78, N.º 2 183

Tabla 3

Predictores que no cambian en el tiempo: sexo y nivel de instrucción

Page 8: COLABORACIÓN ESPECIAL - mscbs.gob.es...Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 ... supuesto un reto para la estadística aplicada, principalmente por dos

Nivel 1:

Yti = π0i + π1i *edadti+ π2i *edadti2+ εti

Nivel 2:π0i=β00 + r0i

π1i=β10

π2i=β20

Centrado de variables

El centrado de variables que miden eltranscurso del tiempo, por ejemplo la edad,permite una interpretación lógica de la inter-sección en el origen. Existen diferentes for-mas de centrado. En este trabajo la edad se hacentrado en 65 años, edad mínima de los par-ticipantes en el estudio; por tanto, la edadcentrada se ha calculado restando 65 a laedad de cada individuo. Con esta transforma-

ción π0i se interpreta como el valor de fun-ción cognitiva para las personas de 65 años.

El coeficiente del término cuadrático de laedad es significativo y el componente linealno es diferente de cero. Los datos muestranuna fuerte dependencia con el cuadrado de laedad. En otras palabras, la media del deterio-ro cognitivo entre los 65 y 66 años de edad esmucho menor que entre los 80 y los 81 años.Del mismo modo, se observa una disminu-ción del componente de la varianza para laintersección en el origen que ha pasado de0,2484-0,1575. Esta disminución indica quela edad explica parte de la variabilidad en laintersección aunque todavía queda variabili-dad por explicar.

1. Modelo multinivel con variablesexplicativas que no cambian en el tiempo

Hasta ahora hemos construido modelospara explicar trayectorias individuales.

María Victoria Zunzunegui et al.

184 Rev Esp Salud Pública 2004, Vol. 78, N.º 2

Tabla 4

Estudio de interacciones entre niveles

Page 9: COLABORACIÓN ESPECIAL - mscbs.gob.es...Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 ... supuesto un reto para la estadística aplicada, principalmente por dos

Hemos descrito una trayectoria media parala población estudiada según la edad perosabemos que existen diferencias significati-vas entre las trayectorias de los individuos.Estas diferencias entre las trayectorias pue-den deberse a características de los sujetosque no se modifican con el tiempo (variablesde nivel 2), como el sexo y el nivel de ins-trucción.

La generalización del modelo se represen-ta extendiendo las ecuaciones anteriores denivel 2 para incluir como variables predicto-ras otras características de los individuos,Xq. La expresión general sería:

π0i=β00+Σ β0q Xqi + r0i

π1i=β10+Σ β1q Xqi + r1i

donde Xq, con q=1... Q son las característi-cas de las personas que pueden influir en latrayectoria de Y y que no cambian con eltiempo.

Hay dos errores aleatorios r0i y r1i. Lavarianza de π0i es τ00 y la varianza de π1i es

τ11. La covarianza de la intersección en elorigen y la pendiente es τ01.

Suponemos que la intersección en el ori-gen varía de forma aleatoria alrededor de unvalor medio y que estas variaciones aleato-rias de la constante pueden depender tam-bién de alguna característica del individuoque no cambie con el tiempo, por ejemplo, elsexo o el nivel instrucción. Construimos dosnuevos modelos introduciendo en la inter-sección el sexo (modelo 3) y el nivel de ins-trucción (modelo 4). Las categorías de refe-rencia utilizadas para el sexo y el nivel deinstrucción serán hombre y estudios prima-rios completos, respectivamente. Es decir,modelamos la intersección según:

modelo 3: π0i=β00 + β10*sexo + r0i

modelo 4: π0i=β00 + β10*sexo + β11*nivelinstrucción+r0i

En el modelo 3 se observa que el sexo tie-ne un efecto significativo y de sentido positi-vo, por lo que se puede afirmar que las muje-res tienen mayor déficit cognitivo que loshombres una vez controlado el efecto de la

APLICACIONES DE LOS MODELOS MULTINIVEL AL ANÁLISIS DE MEDIDAS REPETIDAS EN ESTUDIOS LONGITUDINALES

Rev Esp Salud Pública 2004, Vol. 78, N.º 2 185

Tabla 5

Modelo final

Page 10: COLABORACIÓN ESPECIAL - mscbs.gob.es...Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 ... supuesto un reto para la estadística aplicada, principalmente por dos

edad. La varianza prácticamente no se hareducido, lo que indica que debemos intentarexplicar la variabilidad no explicada intro-duciendo otras características de los indivi-duos. El nivel de instrucción (modelo 4),está asociado de forma importante al dete-rioro cognitivo y su inclusión en el modelodisminuye el efecto del sexo, que pierde susignificación estadística. Esto indica que,una vez tenidas en cuenta las diferencias enel nivel de instrucción, la función cognitivade las mujeres no difiere significativamentede la de los hombres por lo que podemos eli-minar de la intersección la variable sexo.

Además de los efectos principales de lasvariables de nivel 1 y de nivel 2, tambiénpueden existir efectos de interacción entreambos tipos de variables. Por ejemplo, pode-mos estudiar si el sexo o el nivel de instruc-ción modifican la velocidad o la aceleracióndel deterioro cognitivo a medida que avanzala edad. Para ello se introducen en el modelotérminos de interacción formados por losproductos sexo*edad y sexo*edad2 (modelo5) o bien educación*edad y educación*edad2 (modelo 6). Estas interacciones reci-ben el nombre de interacciones entre nivelesya que cada uno de los términos del produc-to pertenece a un nivel diferente.

A la vista de estos resultados podemosafirmar que no existe un efecto de interac-ción entre el sexo y la edad y por tanto, lavelocidad y la aceleración del deterioro cog-nitivo con la edad no dependen del sexo(modelo 5). Por el contrario, si se observauna modificación del efecto debida a la edu-cación, de forma que las personas mayoresque no fueron escolarizadas en la infanciatienen mayor deterioro cognitivo a los 65años y presentan una mayor velocidad y ace-leración del deterioro cognitivo con la edadque aquellas que si fueron escolarizadas,hubieran terminado o no los estudios prima-rios (modelo 6). La ausencia de diferenciassignificativas entre los individuos que nofinalizaron la primaria y los que si lo hicie-ron permite reagrupar estas dos categorías

en una y construir el modelo final utilizandocomo categoría de referencia de la educa-ción el hecho de haber acudido a la escuela(primaria incompleta y completa).

Los resultados de este modelo indican queel nivel de instrucción influye significativa-mente sobre la función cognitiva a los 65años y sobre la velocidad y aceleración deldeterioro. En la intersección en el origen, nohaber recibido escolarización no tiene unefecto diferente de haberla recibido. Sinembargo, el hecho de ser analfabeto predice,como media, una peor función cognitiva alllegar a los 65 años que el ser capaz de leer yescribir.

El parámetro de la varianza se ha reducidosensiblemente en comparación con el valorobtenido en el modelo vacío (0,2484) ya quela educación alcanzada explica gran parte dela variabilidad en la función cognitiva de laspersonas mayores aunque sigue existiendovariabilidad residual que podría deberse aotros factores no considerados, como la des-ventaja económica y social no captadaexclusivamente por el nivel de instrucción,el estado de salud, los síntomas depresivos oalguna variable ligada a la susceptibilidadgenética.

En la figura 2 se representa la evoluciónde la función cognitiva según el nivel de ins-trucción. Adviértase que en esta figura se hautilizado la escala original de la «PruebaCognitiva de Leganés» y no la transforma-ción logarítmica empleada en los análisis.

Este ejemplo ilustra una aplicación de unnuevo método de análisis de medidas repeti-das mediante la utilización adecuada de pro-gramas informáticos disponibles comercial-mente. Sin embargo, la facilidad de acceso aestos programas conlleva el peligro de unamala utilización. Los modelos multinivelson muy flexibles pero también requierenasunciones sobre la distribución de las varia-bles que deben ser verificadas antes de lamodelización.

María Victoria Zunzunegui et al.

186 Rev Esp Salud Pública 2004, Vol. 78, N.º 2

Page 11: COLABORACIÓN ESPECIAL - mscbs.gob.es...Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 ... supuesto un reto para la estadística aplicada, principalmente por dos

Aplicaciones de los modelos multinivel alanálisis de cambios en variables que noson normales

Aunque los modelos multinivel fuerondesarrollados originalmente para variablesde respuesta con distribución normal y bajolos supuestos de una distribución normal delos errores en cada individuo, estos métodoshan sido generalizados para situaciones enlas que la variable de respuesta es binomial,nominal u ordinal y para procesos donde laprobabilidad del evento es pequeña y se pue-de modelar con una distribución de Poisson.Se llama función vínculo de nivel 1 (linkfunction) a la transformación de la variabledependiente de nivel 1 que se iguala a unacombinación lineal de los coeficientes de lasvariables explicativas. Esta función puedeser una función logística binomial, ordinal,multinomial o una transformación de Pois-son. Los dos principales programas informá-ticos que realizan análisis multinivel, elHLM9 y el MLnWin10, permiten la formula-ción de estos modelos no lineales.

Estas generalizaciones no están exentasde problemas y la utilización de modelosmultinivel con variables discretas requiereespecial atención a los supuestos teóricos.Como una ilustración podemos citar la utili-zación de una función logística para mode-

lar la discapacidad en las actividades de lavida diaria de las personas mayores. Estavariable es dicotómica con valores 0=inde-pendiente, 1=dependiente. Sin embargocuando se utiliza el modelo de medidasrepetidas con una variable dicotómica seobserva el problema de la variación extra-binomial, también llamado sobredispersióno sub-dispersión. Este problema está oca-sionado por la fuerte correlación entre unestado y los subsiguientes. Por ejemplo, siuna persona está independiente en el tiempo1 lo más probable es que también lo esté enel tiempo 2 y así sucesivamente. Es decir, lavarianza en la respuesta de nivel 1 es infe-rior a la esperada por el modelo teórico(subdispersión). Otra fuente de variaciónextra-binomial es la ausencia de variablesexplicativas importantes en el modelo. Elprograma HLM versión 5 tiene una opciónpara modelar la varianza extra-binomial. Sieste parámetro es muy diferente de 1, elmodelo teórico no ajusta bien a los datos yse deben buscar alternativas para modelar lavariable dependiente.

Otra extensión de los modelos jerárquicosmultinivel es el estudio de respuestas multi-variables, es decir el análisis multivariablemultinivel. Así, por ejemplo, en el problemaanterior sobre la modelización de la discapa-cidad en las actividades de la vida diaria uti-

APLICACIONES DE LOS MODELOS MULTINIVEL AL ANÁLISIS DE MEDIDAS REPETIDAS EN ESTUDIOS LONGITUDINALES

Rev Esp Salud Pública 2004, Vol. 78, N.º 2 187

Figura 2

Evolución de la función cognitiva según nivel de instrucción

0

5

10

15

20

25

30

Edad 69 74 79 84 89 94 99

PC

L

Escolarizados

Analfabetos

Sin escolarizar

Page 12: COLABORACIÓN ESPECIAL - mscbs.gob.es...Rev Esp Salud Pública 2004; 78: 177-188 N.º 2 - Marzo-Abril 2004 ... supuesto un reto para la estadística aplicada, principalmente por dos

lizando los datos del estudio «Envejecer enLeganés» anteriormente citados, se observasub-dispersión en la variable dependiente denivel 1. Una forma alternativa de analizarestos datos es usar un modelo multivariantedonde la variable de respuesta está constitui-da por los valores de la discapacidad en loscuatro tiempos de recogida de información,1993, 1995, 1997, 1999.Se hacen los mis-mos supuestos que en el modelo de medidasrepetidas pero no se permite variación en elnivel 1 y las variables binomiales covaríanen el nivel 211. El programa HLM versión 5no incluye la opción para realizar análisismultivariable multinivel con variables bina-rias. Esta aplicación está disponible en elprograma MLWin.

BIBLIOGRAFÍA

1. Lilienfeld AM, Lilienfeld D. Foundations of epide-miology. Second edition. New York: Oxford Uni-versity Press; 1972.

2. Raudenbush SW. Comparing personal trajectoriesand drawing causal inferences from longitudinaldata. Ann Rev Psychol 2001;52:501-25.

3. Raudenbush SW, Bryk AS. Hierarchical LinearModels. Applications and data analysis methods.Second Edition. Advance Quantitative Techniquesin the Social Science. London: Sage Publications;2002.

4. Snijders T, Bosker R. Multinivel analysis. An intro-duction to basic and advanced multilevel modeling.London: Sage Publications; 1999.

5. León V, Zunzunegui MV Béland F. El diseño y laejecución de la encuesta «Envejecer en Leganés».Rev Gerontol 1995; 5:215-31.

6. Zunzunegui MV, Gutiérrez CP, Beland F, Del SerT, Wolfson C. Development of simple cognitivefunction measures in a community dwelling popu-lation of elderly in Spain. Int J Geriatr Psychiatry2000; 15(2): 130-40.

7. García de Yébenes MJ, Otero Puime A, Zunzune-gui MV, Rodriguez Laso A, Sanchez Sánchez F,Del Ser Quijano T. Validation of a short cognitivetool for the screening of dementia in elderly peoplewith low educational level. Int J Geriatr Psychiatry2003;18:925-36.

8. Tabachnick BG, Fidell LS. Using multivariate sta-tistics-4th edition. Toronto: Allyn & Bacon; 2001.Disponible en: www.abacon.com/tabachnick/stats

9. HLM Version 5 Hierarchical Linear and Non Line-ar Modeling. Raudenbush S, Bryk A, Cheong YF,Congdon R. SSI Scientific Software InternationalInc; 2001. Disponible en .www.ssicentral.com

10. Center of multilevel analysis Disponible en:www.multilevel.ioe.ac.uk

11. Goldstein H, Rasbash J. Improved approximationsfor multilevel models with binary responses. J RStat Soc Ser A Appl Stat 1996; 159:505-13.

María Victoria Zunzunegui et al.

188 Rev Esp Salud Pública 2004, Vol. 78, N.º 2