chi cuadrda

Upload: javier-rosas-dominguez

Post on 07-Jan-2016

216 views

Category:

Documents


0 download

DESCRIPTION

BUENO

TRANSCRIPT

CHI CUADRDA

Asociacin de variables cualitativas: test de Chi-cuadradoAutores:

Salvador Pita Fernndez(1), Sonia Prtega Daz(2)(1) Mdico de Familia.Centro de Salud de Cambre (A Corua).(2) Unidad de Epidemiologa Clnica y Bioestadstica. Complexo Hospitalario Universitario de A Corua (A Corua).

Actualizada el 03/11/2004.

Tabla de contenidos:

ndice

Introduccin

La prueba de ji-cuadrado en el contraste de independencia de variables aleatorias cualitativas

Bibliografa

Imprimir documento[206 Kb]Problemas con PDF?

-----------------------

Ms enFisterra

Clculo del Test de chi-cuadrado para tablas de contingencia de 2x2(Excel)

En la investigacin biomdica nos encontramos con frecuencia con datos o variables de tipo cualitativo, mediante las cuales un grupo de individuos se clasifican en dos o ms categoras mutuamente excluyentes. Las proporciones son una forma habitual de expresar frecuencias cuando la variable objeto de estudio tiene dos posibles respuestas, como presentar o no un evento de inters (enfermedad, muerte, curacin, etc.). Cuando lo que se pretende es comparar dos o ms grupos de sujetos con respecto a una variable categrica, los resultados se suelen presentar a modo de tablas de doble entrada que reciben el nombre de tablas de contingencia. As, la situacin ms simple de comparacin entre dos variables cualitativas es aquella en la que ambas tienen slo dos posibles opciones de respuesta (es decir, variables dicotmicas). En esta situacin la tabla de contingencia se reduce a una tabla dos por dos como la que se muestra en laTabla 11,2.Tabla 1. Tabla de contingencia general para la comparacin de dos variables dicotmicas.

Caracterstica A

Caracterstica BPresenteAusenteTotal

Presentaaba + b

Ausentecdc + d

Totala + cb + dn

Supongamos que se quiere estudiar la posible asociacin entre el hecho de que una gestante fume durante el embarazo y que el nio presente bajo peso al nacer. Por lo tanto, se trata de ver si la probabilidad de tener bajo peso es diferente en gestantes que fumen o en gestantes que no fumen durante la gestacin. Para responder a esta pregunta se realiza un estudio de seguimiento sobre una cohorte de 2000 gestantes, a las que se interroga sobre su hbito tabquico durante la gestacin y se determina adems el peso del recin nacido. Los resultados de este estudio se muestran en laTabla 2.Tabla 2. Tabla de contingencia para estudiar la asociacin entre fumar durante la gestacin y el bajo peso del nio al nacer. Estudio de seguimiento de 2000 gestantes.

Recin nacido de bajo peso

GestanteSNoTotal

Fumadora43 (a)207 (b)250

No fumadora105 (c)1645 (d)1750

Total14818522000

En laTabla 1, a, b, c y d son las frecuencias observadas del suceso en la realidad de nuestro ejemplo de estudio (43, 207, 105 y 1647), siendo n (2000) el nmero total de casos estudiados, y a+b, c+d, a+c y b+d los totales marginales. En el ejemplo, a+b=250 sera el nmero total de mujeres fumadoras durante el embarazo, c+d=1750 el nmero total de mujeres no fumadoras, a+c=148 el nmero de nios con bajo peso al nacer y b+d=1852 el nmero de nios con peso normal al nacimiento.Ante una tabla de contingencia como la anterior pueden plantersenos distintas cuestiones. En primer lugar, se querr determinar si existe una relacin estadsticamente significativa entre las variables estudiadas. En segundo lugar, nos interesar cuantificar dicha relacin y estudiar su relevancia clnica. Esta ltima cuestin podr resolverse mediante las denominadas medidas de asociacin o de efecto (riesgo relativo (RR), odds ratio (OR), reduccin absoluta del riesgo (RAR)), que ya han sido abordadas en otros trabajos3,4. Por otro lado, para responder a la primera pregunta, la metodologa de anlisis de las tablas de contingencia depender de varios aspectos como son: el nmero de categoras de las variables a comparar, del hecho de que las categoras estn ordenadas o no, del nmero de grupos independientes de sujetos que se estn considerando o de la pregunta a la que se desea responder5.Existen diferentes procedimientos estadsticos para el anlisis de las tablas de contingencia como la prueba, la prueba exacta de fisher, la prueba de McNemar o la prueba Q de Cochran, entre otras. En este artculo se expondr el clculo e interpretacin de la pruebacomo mtodo estndar de anlisis en el caso de grupos independientes1,2,5,6.La pruebaen el contraste de independencia de variables aleatorias cualitativas.La pruebapermite determinar si dos variables cualitativas estn o no asociadas. Si al final del estudio concluimos que las variables no estn relacionadas podremos decir con un determinado nivel de confianza, previamente fijado, que ambas son independientes.Para su cmputo es necesario calcular las frecuencias esperadas (aquellas que deberan haberse observado si la hiptesis de independencia fuese cierta), y compararlas con las frecuencias observadas en la realidad. De modo general, para una tabla r x k (r filas y k columnas), se calcula el valor del estadsticocomo sigue:(1)

donde: denota a las frecuencias observadas. Es el nmero de casos observados clasificados en la fila i de la columna j. denota a las frecuencias esperadas o tericas. Es el nmero de casos esperados correspondientes a cada fila y columna. Se puede definir como aquella frecuencia que se observara si ambas variables fuesen independientes.As, el estadsticomide la diferencia entre el valor que debiera resultar si las dos variables fuesen independientes y el que se ha observado en la realidad. Cuanto mayor sea esa diferencia (y, por lo tanto, el valor del estadstico), mayor ser la relacin entre ambas variables. El hecho de que las diferencias entre los valores observados y esperados estn elevadas al cuadrado en (1) convierte cualquier diferencia en positiva. El testes as un test no dirigido (test de planteamiento bilateral), que nos indica si existe o no relacin entre dos factores pero no en qu sentido se produce tal asociacin.Para obtener los valores esperados, estos se calculan a travs del producto de los totales marginales dividido por el nmero total de casos (n). Para el caso ms sencillo de una tabla 2x2 como laTabla 1, se tiene que:

Para los datos del ejemplo en la Tabla 2 los valores esperados se calcularan como sigue:

De modo que los valores observados y esperados para los datos del ejemplo planteado se muestran en laTabla 3.Tabla 3. Tabla de contingencia para estudiar la asociacin entre fumar durante la gestacin y el bajo peso del nio al nacer. Valores observados y valores esperados (entre parntesis) si los factores fuesen independientes.

Recin nacido de bajo peso

GestanteSNoTotal

Fumadora43 (18.5)207 (231.5)250

No fumadora105 (129.5)1645 (1620.5)1750

Total14818522000

El valor del estadstico, para este ejemplo en concreto, vendra dado entonces como:

A la vista de este resultado, lo que tenemos que hacer ahora es plantear un contraste de hiptesis entre la hiptesis nula:H0: No hay asociacin entre las variables (en el ejemplo, el bajo peso del nio y el hecho de fumar durante la gestacin son independientes, no estn asociados).Y la hiptesis alternativa:Ha: S hay asociacin entre las variables, es decir, el bajo peso y el fumar durante la gestacin estn asociados.Bajo la hiptesis nula de independencia, se sabe que los valores del estadsticose distribuyen segn una distribucin conocida denominada ji-cuadrado, que depende de un parmetro llamado grados de libertad (g.l.). Para el caso de una tabla de contingencia de r filas y k columnas, los g.l. son igual al producto del nmero de filas menos 1 (r-1) por el nmero de columnas menos 1 (k-1). As, para el caso en el que se estudie la relacin entre dos variables dicotmicas (Tabla 2x2) los g.l. son 1.De ser cierta la hiptesis nula, el valor obtenido debera estar dentro del rango de mayor probabilidad segn la distribucin ji-cuadrado correspondiente. El valor-p que usualmente reportan la mayora de paquetes estadsticos no es ms que la probabilidad de obtener, segn esa distribucin, un dato ms extremo que el que proporciona el test o, equivalentemente, la probabilidad de obtener los datos observados si fuese cierta la hiptesis de independencia. Si el valor-p es muy pequeo (usualmente se considera p