4-ajuste%20modelo.pdf

12
46 Nava L., Pradad S., Ajuste e interpretación de modelos de regresión logística con variables categóricas y continuas Ajuste e interpretación de modelos de regresión logística con variables categóricas y continuas * LUIS NAVA PUENTE 1 SURENDRA PRADAD. SINHA 2 * Este artículo corresponde a un resultado obtenido en el Seminario 2 del Doctorado en Estadística de la Universidad de Los Andes, desarrollado por Luis Nava Puente y con la tutoría de Surendra Sinha. 1 Facultad de Economía, Escuela de Estadística, Universidad de Los Andes, Mérida, Venezuela. 2 Facultad de Economía, Instituto de Estadística Aplicada y Computación, Universidad de Los Andes. Recibido: 01-02-2007 Revisado: 05-03-2007 Aceptado: 12-05-2007 Resumen Se desarrolló un procedimiento para ajustar un modelo de regresión logística que relacio- nara la prevalencia de cardiomiopatía clínica con las variables de sexo, consumo de “chimó”, consumo de alcohol, fumar, seropositividad a Trypanosoma cruzi y edad. Se usó la información referente a un grupo de 2.336 habitantes del Estado Trujillo. Los resultados de la investigación indicaron que las variables relacionadas en forma significativa con la presencia de anormalidades electrocardiográficas son sexo, consumo de chimó, fumar y edad. El modelo apropiado incluye la interacción entre las variables sexo y consumo de chimó y un término cuadrático de edad. El consumo de chimó y la edad son variables que incrementan en forma significativa las posibilidades de cardio- miopatía clínica. Podemos concluir con base en los resultados que los hombres tienen mayores posibilida- des que las mujeres de presentar esta anomalía. Palabras clave: Regresión logística, modelo lineal generalizado, Trypanosoma cruzi, cardiomiopatía, anormalidades electrocardiográficas.

Upload: ibraim-rivera

Post on 30-Dec-2014

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 4-AJUSTE%20MODELO.pdf

46

Nava L., Pradad S., Ajuste e interpretación de modelos de regresión logística con variables categóricas y continuas

Ajuste e interpretación de modelos deregresión logística con variables

categóricas y continuas*

LUIS NAVA PUENTE1

SURENDRA PRADAD. SINHA2

* Este artículo corresponde a un resultado obtenido en el Seminario 2 del Doctorado en Estadística de laUniversidad de Los Andes, desarrollado por Luis Nava Puente y con la tutoría de Surendra Sinha.

1 Facultad de Economía, Escuela de Estadística, Universidad de Los Andes, Mérida, Venezuela.

2 Facultad de Economía, Instituto de Estadística Aplicada y Computación, Universidad de Los Andes.

Recibido: 01-02-2007 Revisado: 05-03-2007 Aceptado: 12-05-2007

Resumen

Se desarrolló un procedimiento para ajustar un modelo de regresión logística que relacio-nara la prevalencia de cardiomiopatía clínica con las variables de sexo, consumo de “chimó”,consumo de alcohol, fumar, seropositividad a Trypanosoma cruzi y edad. Se usó lainformación referente a un grupo de 2.336 habitantes del Estado Trujillo.

Los resultados de la investigación indicaron que las variables relacionadas en formasignificativa con la presencia de anormalidades electrocardiográficas son sexo, consumode chimó, fumar y edad. El modelo apropiado incluye la interacción entre las variablessexo y consumo de chimó y un término cuadrático de edad. El consumo de chimó y laedad son variables que incrementan en forma significativa las posibilidades de cardio-miopatía clínica.

Podemos concluir con base en los resultados que los hombres tienen mayores posibilida-des que las mujeres de presentar esta anomalía.

Palabras clave: Regresión logística, modelo lineal generalizado, Trypanosoma cruzi,cardiomiopatía, anormalidades electrocardiográficas.

Page 2: 4-AJUSTE%20MODELO.pdf

47

Univ. Méd. Bogotá (Colombia), 49 (1): 46-57, enero-marzo de 2008

Tittle:

Adjustment and interpretation of logistic regressionmodels with categorical and continuous variables

Abstract

A logistic regression model was fitted to establishthe relation between the prevalence of clinicmyocardiopathy with the variables gender, chimó(a type of chewing tobacco consumption), alcoholconsumption, smoking habits, seropositivity toTrypanosoma cruzi and age. The information wasbased on a group of 2336 persons from the state ofTrujillo, Venezuela.

The results of the research showed that the varia-bles significantly related with the presence ofelectrocardiographic (ECG) abnormalities weregender, chimó consumption, smoking and age. Thebest model included interactions between genderand chimó consumption, and a quadratic term forage. Chimó consumption and age were the varia-bles that made significantly greater the risk of clinicmyocardiopathy. We conclude also that males havea greater risk of developing this kind of abnormality.

Key words: Logistic regression, generalized li-neal model, Trypanosoma cruzi, cardiomyopathy,electrocardiographic anomalies.

Introducción

El modelo lineal generalizado pro-puesto inicialmente por Nelder yWedderburn en 1972, es una exten-sión o generalización del modelo li-neal clásico. Entre otras cosas, ofreceuna mayor variedad de distribucionespara la variable respuesta, es decir,posibilita el ajuste de un modelo condiferentes distribuciones sin necesi-dad de realizar modificaciones en losdatos. Además, permite estableceruna relación entre la variable depen-

diente y la combinación lineal de fac-tores de predicción mediante una fun-ción adecuada del valor esperado dela misma.

Un caso especial del modelo linealgeneralizado es el modelo de regresiónlogística, el cual se distingue del mode-lo de regresión lineal en que la variablerespuesta es dicotómica. El modelo deregresión logística nos permite, en estecaso, estudiar la incidencia de cardio-miopatía clásica en un grupo de pobla-dores del Estado Trujillo. Ilustramos elprocedimiento para ajustar el mejormodelo de regresión logística a los da-tos, determinar la importancia de lasvariables independientes bajo estudio enla prevalencia de anormalidades electro-cardiográficas, así como la forma de in-terpretar los resultados.

Los datos

Varias investigaciones clínico-epidemiológicas han sido realizadaspor el Laboratorio Multidisciplinariode Investigación Clínico-Epidemioló-gicas de la Facultad de Medicina, co-ordinado por Darío Novoa M., encomunidades rurales del EstadoTrujillo con diversos índices de infes-tación por “chipo” (triatomino) y condistintas tasas de prevalencia de sero-positividad a Trypanosoma cruzi. Es-tos estudios fueron realizados entre1978 y 1989, unos han sido publica-dos y otros están en proceso.

Page 3: 4-AJUSTE%20MODELO.pdf

48

Nava L., Pradad S., Ajuste e interpretación de modelos de regresión logística con variables categóricas y continuas

La información analizada en este pro-yecto se refiere a un estudio de prevalen-cia (1986-1987) de cardiomiopatíaclínica, realizado en un grupo de 2.336habitantes del Estado Trujillo. A este con-junto de individuos se les registró, entreotras, las variables de sexo (masculino,femenino), consumo de chimó (no, sí),consumo de alcohol (no, sí), fuma (sí,no), seropositividad a Trypanosomacruzi (positiva, negativa) y edad.

Resultados

Inicialmente se calculó el devianceasociado con el modelo nulo (modelo

que incluye sólo el intercepto). Esteresultado se muestra en la tabla 1. Ensegundo lugar, se efectuó la evalua-ción de cada uno de los factores cua-litativos de interés en el estudio y seconstruyó la tabla 2.

Tenemos, pues, que la tabla 2 pre-senta el deviance de cada modelounifactorial y el efecto global de cadauno de estos factores. Este efecto glo-bal resulta de la diferencia entre lasdesviaciones (deviance) del modelonulo y el de cada modelo de un factor.

Debe señalarse, al comparar losresultados mostrados en la tabla 2 con

Tabla 1Cálculo del deviance para el modelo nulo

Estadísticos de Bondad de Ajuste Deviance y Pearson

Criterio GL Valor Valor/GL Pr > ChiSq

Deviance 28 247.7866 8.8495 <.0001

Pearson 28 244.2682 8.7239 <.0001

GL: Grados de Libertad. Pr: Probabilidad. Chisq: Chi-Cuadrado.

Tabla 2Cálculo de deviance y efecto global para los modelos de un factor

Modelo Deviance GL Efecto global GLNulo 247,7866 28

Sexo 75,4344 27 172,3522* 1

Comechimo 202,0885 27 45,6981* 1

Fuma 240,5551 27 7,2315* 1

Toma 229,8772 27 17,9094* 1

Resultad 238,7436 27 9,043* 1

*Significativo al 5%. GL: Grados de Libertad.

Page 4: 4-AJUSTE%20MODELO.pdf

49

Univ. Méd. Bogotá (Colombia), 49 (1): 46-57, enero-marzo de 2008

c21;0.05

= 3.84146, que todos los efec-tos globales resultan significativos aun nivel de significación del 5%.

Por consiguiente, se consideraapropiado correr un modelo aditivoque incluya los cinco factores cualita-tivos anteriormente evaluados. Losresultados obtenidos al ajustar estemodelo se presentan en la tabla 3 y sepuede observar que el modelo se ajustaa los datos (p=0,1005). Cabe conside-rar, por otra parte, que a un nivel del5% todos los factores, excepto“Toma” (p=0,3879), resultan estadís-

ticamente significativos. Este resulta-do es confirmado al utilizar el proce-dimiento de selección de variableshacia adelante; el mismo considera queel modelo debe incluir las variablessexo, come chimó, fuma y resultado.

Inclusión de la variable edad

El análisis precedente consideró sólolas variables cualitativas. Sin embar-go, una variable cuantitativa que, porlo general, resulta de interés, es la va-riable edad; por lo tanto, debe ser in-cluida en nuestra construcción. Dado

Tabla 3Ajuste de modelo aditivo

Criterio GL V alor Valor/GL Pr > ChiSqDeviance 23 31.9818 1.3905 0.1005Pearson 23 30.9851 1.3472 0.1232Number of unique profiles: 29

Contraste de la hipótesis nula global: BETA=0

Test Chi-Square GL Pr > ChiSqLikelihood Ratio 215.8048 5 <.0001Score 214.2951 5 <.0001Wald 200.7542 5 <.0001

Análisis de las estimaciones máximo verosímil

Parámetro GL Estimación E.E. ChiSq Pr > ChiSqIntercept 1 -1.2122 0.0720 283.0820 <.0001SEXO 1 1 1.1911 0.1027 134.4210 <.0001Comechimo 2 1 0.4421 0.1002 19.4504 <.0001FUMAACTU 1 1 -0.4167 0.1132 13.5436 0.0002Toma 1 1 -0.1056 0.1223 0.7455 0.3879RESULTAD 1 1 0.2718 0.1370 3.9368 0.0472

GL: Grados de Libertad. E.E. Error estándar.Pr: Probabilidad. Chisq: Chi-Cuadrado.

Page 5: 4-AJUSTE%20MODELO.pdf

50

Nava L., Pradad S., Ajuste e interpretación de modelos de regresión logística con variables categóricas y continuas

que edad es cuantitativa, ella produceproblemas en el cumplimiento del re-quisito de la disponibilidad de 10 ob-servaciones por celda o, combinaciónde niveles. Es claro, entonces, que estavariable no puede ser incorporada almodelo en la forma usual. Una formadiferente de lo usual sería la incorpo-ración de esta variable a través de laconstrucción de grupos de edades, esdecir, creando categorías de edades.Otra forma es mediante el uso del pro-cedimiento propuesto por Stokes,Davis y Koch[4]. Este procedimientoconsiste en seguir tres estrategias, lascuales deben coincidir en el modeloideal. La estrategia 1 consiste en ajus-tar dos modelos; un primer modelo queincluye sólo los factores cualitativosy un segundo modelo, que es el pri-mero expandido por la variable cuan-titativa.

Tenemos pues que, al comparar es-tos modelos, evaluando la diferenciaentre sus deviances, mostrados en la ta-bla 4, 1109.4104-1106.7611=2.6493,podemos concluir que el aporte de lavariable edad no es significativo. Estatabla también nos muestra el análisisde las estimaciones de máximo vero-símil. Podemos observar aquí que lasvariables toma, edad y resultado, noson estadísticamente significativas.

Ahora bien, en la estrategia 2 seevalúa la ji al cuadrado residual pro-puesto por Breslow y Day (1980). El

modelo propuesto es el que incluye lasvariables sexo, come chimó, fuma yedad. Dado que p=0,2001, a un nivelde significación del 5%, se concluyeque este modelo se ajusta adecuada-mente a los datos.

Dentro de ese marco, la estrategia3 consiste en el cálculo del estadísticode bondad de ajuste propuesto porHosmer y Lemeshow (1989)[5]. Alcomparar el valor de este estadístico,42.6322, con un ji al cuadrado de 8grados de libertad, podemos observarque esta medida no apoya lo adecua-do del modelo para estos datos. Re-sulta, claro, una inconsistencia en losresultados obtenidos mediante las tresestrategias, es decir, no hay coinciden-cia en el modelo ideal.

Inclusión del término cuadráticode la variable edad

Dada la importancia que representa lavariable edad en esta investigación ydebido a los resultados obtenidos enla sesión anterior, se decidió incorpo-rar al análisis un término cuadrático(edad 2) de esta variable al modelo.En la tabla 5 se muestran los resulta-dos obtenidos al incorporar el térmi-no cuadrático al modelo. El modelono ajusta a los datos (p<0,001). Ob-sérvese que ahora la variable edad re-sulta significativa, mientras que lasvariables toma y resultado, se mantie-nen como no significativas.

Page 6: 4-AJUSTE%20MODELO.pdf

51

Univ. Méd. Bogotá (Colombia), 49 (1): 46-57, enero-marzo de 2008

Tabla 4Ajuste de Modelo incluyendo la variable Edad

Estadísticos de Bondad de Ajuste Deviance y Pearson

Criterio GL Valor Valor/GL Pr > ChiSq

Deviance 827 1109.4104 1.3415 <.0001

Pearson 827 908.8145 1.0989 0.0247

Estadísticos de bondad de ajuste Deviance y Pearson

Criterio GL Valor Valor/GL Pr > ChiSq

Deviance 826 1106.7611 1.3399 <.0001

Pearson 826 903.2268 1.0935 0.0314

Contraste de la hipótesis nula global: BETA=0

Test Chi-Square GL Pr > ChiSq

Likelihood Ratio 218.4542 6 <.0001

Score 216.7855 6 <.0001

Wald 202.6436 6 <.0001

Analysis of Maximum Likelihood estimates

Parámetro GL Estimación E.E. ChiSq Pr > ChiSq

Intercept 1 -1.3633 0.1181 133.2993 <.0001

SEXO 1 1 1.1918 0.1028 134.2673 <.0001

Comechimo 2 1 0.3853 0.1061 13.1816 0.0003

Fumaactu 1 1 -0.4132 0.1132 13.3182 0.0003

toma 1 1 -0.0975 0.1225 0.6339 0.4259

Edad 1 0.00456 0.00280 2.6556 0.1032

Resultad 1 1 0.2205 0.1406 2.4596 0.1168

GL: Grados de Libertad. E.E. Error estándar.Pr: Probabilidad. Chisq: Chi-Cuadrado.

En la tabla 6 se muestran los resul-tados obtenidos al seguir el procedi-miento de las tres estrategias planteadoen la sesión anterior, incluyendo el tér-mino cuadrático para la variable edad.El modelo no se ajusta a los datos(p<0,001). Obsérvese que ahora lavariable edad resulta significativa,

mientras que las variables toma y re-sultado, se mantienen como no signi-ficativas.

Por consiguiente, podemos indicarque el modelo propuesto es Log it(π

i jk) = –0.094 + 1.121sexo+0.427

comechimo – 0.323 fumaactu –0.070edad + 0.00087edad2

Page 7: 4-AJUSTE%20MODELO.pdf

52

Nava L., Pradad S., Ajuste e interpretación de modelos de regresión logística con variables categóricas y continuas

Tabla 5Ajuste de modelo incluyendo el término

Cuadrático para la variable Edad

Estadísticos de bondad de ajuste Deviance y Pearson

Criterio GL Valor Valor/GL Pr > ChiSq

Deviance 825 1069.6080 1.2965 <.0001

Pearson 825 882.9096 1.0702 0.0793

Contraste de la hipótesis nula global: BETA=0

Test Chi-Square GL Pr > ChiSq

Likelihood Ratio 255.6073 7 <.0001

Score 252.8066 7 <.0001

Wald 229.0238 7 <.0001

Analysis of maximum Likelihood estimates

Parámetro GL Estimación E.E. ChiSq Pr > ChiSq

Intercept 1 -0.0665 0.2412 0.0760 0.7828

SEXO 1 1 1.1206 0.1040 116.0274 <.0001

Comechimo 2 1 0.4096 0.1077 14.4639 0.0001

Fumaactu 1 1 -0.3223 0.1151 7.8333 0.0051

toma 1 1 0.00803 0.1244 0.0042 0.9485

Edad 1 -0.0715 0.0129 30.7440 <.0001

Edad 2 1 0.000884 0.000147 36.1823 <.0001

Resultad 1 1 0.2556 0.1432 3.1870 0.0742GL: Grados de Libertad. E.E. Error estándarPr: Probabilidad. Chisq: Chi-Cuadrado

Tabla 6Ajuste de modelo incluyendo el término

Cuadrático para la variable Edad usando las tres estrategias

Contraste de la hipótesis nula global: BETA=0

Test Chi-Square GL Pr > ChiSq

Likelihood Ratio 252.4506 5 <.0001

Score 249.8648 5 <.0001

Wald 226.7564 5 <.0001

Page 8: 4-AJUSTE%20MODELO.pdf

53

Univ. Méd. Bogotá (Colombia), 49 (1): 46-57, enero-marzo de 2008

Análisis de las estimaciones máximo verosímil

Parámetro GL Estimación E.E. ChiSq Pr > ChiSqIntercept 1 -0.0937 0.2395 0.1532 0.6955SEXO 1 1 1.1212 0.0940 142.3389 <.0001Comechimo 2 1 0.4266 0.1071 15.8683 <.0001FUMAACTU 1 1 -0.3227 0.1127 8.1943 0.0042EDAD 1 -0.0695 0.0127 29.8656 <.0001EDAD 2 1 0.000874 0.000145 36.2290 <.0001

Test residual chi-cuadrado

Chi-Square GL Pr > ChiSq3.1957 2 0.2023

Partición para el test de Hosmer y Lemeshow

ekg1 = 1 ekg1 = 2Grupo Total Observado Esperado Observado Esperado1 233 40 37.43 193 195.572 236 44 45.03 192 190.973 231 44 47.98 187 183.024 238 56 56.68 182 181.325 233 54 63.04 179 169.966 234 80 75.64 154 158.367 234 89 96.27 145 137.738 240 129 112.71 111 127.299 246 142 131.28 104 114.7210 211 125 136.93 86 74.07

Test de bondad de ajuste de Hosmer y Lemeshow

Chi-Square GL Pr > ChiSq13.0244 8 0.1110

GL: Grados de libertad. E.E. Error estándarPr: Probabilidad. Chisq: Chi-cuadrado

Comparando los deviances de losmodelos lineal y cuadrático en la va-riable edad, 1106.7611-1069.6080=37.1531, podemos indicar que estetérmino es significativo.

Un modelo con interacción

Con base en el resultado obtenidoen la sesión anterior, se propone el

estudio de un modelo que considerelas interacciones entre los factores cua-litativos, es decir, un modelo que con-sidere las interacciones dobles entrelos factores sexo, come chimó y fumaactualmente, así como su interaccióntriple. Mediante el uso del SAS, seobtienen los resultados mostrados enla tabla 7.

Page 9: 4-AJUSTE%20MODELO.pdf

54

Nava L., Pradad S., Ajuste e interpretación de modelos de regresión logística con variables categóricas y continuas

Tabla 7Ajuste de modelo con interacción

Contraste de la hipótesis nula global: BETA=0

Test Chi-Square GL Pr > ChiSqLikelihood ratio 260.0263 6 <.0001Score 254.8781 6 <.0001Wald 232.3186 6 <.0001

Análisis de las estimaciones máximo verosímil

Parámetro GL Estimación Error Chi-Square Pr > ChiSqIntercept 1 -0.1614 0.2418 0.4454 0.5045Sexo 1 1 1.2969 0.1140 129.3352 <.0001Comechimo 2 1 0.7119 0.1476 23.2673 <.0001Fumaactu 1 1 -0.3018 0.1128 7.1536 0.0075Sexo*Comechimo 1 2 1 -0.5466 0.1979 7.6317 0.0057Edad 1 -0.0699 0.0128 30.0554 <.0001Edad 2 1 0.000875 0.000145 36.2049 <.0001

Estimaciones de las razones de posibilidades3

Point 95% WaldEffect Estimación Confidence LimitsFumaactu 1 vs 2 0.740 0.593 0.923Edad 0.932 0.909 0.956Edad 2 1.001 1.001 1.001

Test residual chi-cuadrado

Chi-Square GL Pr > ChiSq1.9477 3 0.5833

Resumen de la selección hacia delante

Paso Efecto Entrante GL In ChiSq Pr > ChiSq Etiqueta1 Sexo 1 1 173.5261 <.0001 Sexo2 Edad2 1 2 25.1850 <.0001 Edad23 Edad 1 3 31.6636 <.0001 Edad4 Comechimo 1 4 15.4864 <.00015 Sexo*Comechimo 1 5 8.7434 0.00316 Fumaactu 1 6 7.1774 0.0074 umaactu

Test de bondad de ajuste de Hosmer y LemeshowChi-Square GL Pr > ChiSq7.8173 8 0.4515

GL: Grados de libertad. E.E. Error estándarPr: Probabilidad. Chisq: Chi-Cuadrado

3 Razón de posibilidades es la traducción del término Odds Ratio, el cual no tiene traducción directa encastellano. Odds indica P/(1-P), donde P representa la probabilidad de un evento de interés.

Page 10: 4-AJUSTE%20MODELO.pdf

55

Univ. Méd. Bogotá (Colombia), 49 (1): 46-57, enero-marzo de 2008

El procedimiento de selección devariables hacia adelante proponecomo modelo apropiado aquél queinvolucra las variables sexo, comechimó, fuma actualmente, los térmi-nos lineal y cuadrático de edad y lainteracción sexo*come chimó. Esto es,el modelo a considerar está dado por

Log it (πijk

) = –0.161 +1.297sexo+0.712comechimo – 0.302fumaactu – 0.547sexo*comechimo –0.070edad + 0.00087edad2

Ahora bien, lo adecuado de estemodelo a los datos es sustentado porla prueba ji al cuadrado residual(p=0,5833) comparado con un ji al cua-drado de tres grados de libertad y laprueba de bondad de ajuste de Hosmery Lemeshow (p=0,4515) comparadocon una ji al cuadrado de ocho gradosde libertad. Por lo tanto, este modelorepresenta el modelo definitivo.

Interpretación de los coeficientesdel modelo

Para interpretar los resultados ob-tenidos es necesario indicar que losniveles sexo=femenino, comechimó=no y fuma actualmente=no,representan los niveles de referenciausados para las variables cualitativas.

Comenzaremos con la interpreta-ción de los coeficientes de aquellasvariables cualitativas que no estáninvolucradas en la interacción, como es

lo apropiado. El valor –0,3018 (e-0.3018

= 0.7395) asociado con la variable fumaactualmente, indica que el no fumar dis-minuye la posibilidad de tener proble-mas electrocardiográficos en un 26,05%.

Dado que la interacción sexo*comechimó resultó significativa, carece desentido interpretar los coeficientes desexo y come chimó por separado. Laforma de actuar es comparar los nive-les de una variable manteniendo cons-tante la otra en un nivel determinado.De esta forma, se tiene que:

• En el grupo de individuos que noconsumen chimó, los hombres tie-nen casi cuatro veces (e1.2969 =3.658) más posibilidades de pre-sentar problemas electrocardiográ-ficos que las mujeres.

• En el grupo de individuos que con-sumen chimó, las posibilidades deque los hombres presenten proble-mas electrocardiográficos seincrementa en un 111,76% (e1.2969-

0.5466 = 2.1176) con respecto a lasde las mujeres. Esto es, las posibi-lidades de que un hombre presenteproblemas electrocardiográficos esmás de dos veces de las posibilida-des que las presente una mujer.

• En el grupo de las mujeres, el con-sumir chimó incrementa en un103,4% (e0.7119 = 2.034) las posibi-lidades de tener problemas electro-cardiográficos.

• En el grupo de los hombres, elconsumo de chimó incrementa las

Page 11: 4-AJUSTE%20MODELO.pdf

56

Nava L., Pradad S., Ajuste e interpretación de modelos de regresión logística con variables categóricas y continuas

posibilidades de presentar altera-ciones electrocardiográficas en un17,98% (e0.7119-0.5466 = 1.1798).

Para interpretar los coeficientes re-lacionados con la edad, debemos usarun mecanismo que permita medir elcambio que ocurre en los logit o enlas posibilidades, por cada unidad enla que se incrementa la edad. Una for-ma es derivando, otra forma es obte-niendo el cociente entre lasposibilidades en edad y edad+1. Estasegunda resulta, por lo general, mássencilla.

En nuestro caso este cociente esequivalente a:

e log it (πijk

)

= e–0.0699 + 0.000875 + 2*0.00087edad = e–0.069025 + 0.001edad

e log it (πijk

)

Podemos ver, entonces, que lasposibilidades de presentar problemaselectrocardiográficos es una funcióncreciente de la edad, es decir, a medi-da que se incrementa la edad, mayores esa posibilidad.

Conclusiones

1. El fumar incrementa las posibilida-des de presentar anormalidadeselectrocardiográficas en un 26,1%.

2. El hombre tiene más posibilidadesque la mujer de presentar cardio-miopatía clínica.

3. Entre los hombres, el grupo conmayores posibilidades de presen-tar cardiomiopatía clínica es el queconsume chimó: 17,98% más quelos que no consumen chimó.

4. El consumo de chimó afecta enmayor grado a las mujeres que alos hombres.

5. Las posibilidades de presentar pro-blemas electrocardiográficos es unafunción creciente de la edad.

6. El consumo de chimó, la edad y elsexo son variables de gran impor-tancia en la explicación de la pre-sencia de cardiomiopatía clínica,mientras que el consumo de alco-hol y la seropositividad a Trypano-soma cruzi son irrelevantes.

Bibliografía

1. Dumett MA. Modelos lineales genera-lizados. Bogotá: Universidad Nacionalde Colombia, Departamento de Mate-máticas y Estadística; (1995).

2. Hosmer DW, Lemeshow S. Appliedlogistic regression. Second edition.New York: John Wiley & Sons; 2000.

3. López LA, Rincón LF. Modelo lineal.Bogotá: Universidad Nacional de Co-lombia, Departamento de Matemáticasy Estadística; 1999.

4. Rodríguez G. Generalized lnearmodels. Princeton: PrincetonUniversity; 2002.

Page 12: 4-AJUSTE%20MODELO.pdf

57

Univ. Méd. Bogotá (Colombia), 49 (1): 46-57, enero-marzo de 2008

5. Solomon PR. Guía para redactar in-formes de investigación. México: Edi-torial Trillas; 1998.

6. Stokes ME, Davis CS, Koch GG.Categorical data analysis using theSAS system. Cary, N.C.: SAS Institute,U.S.A.; 2000.