chi cuadrado

16
CHI CUADRADO Como interpretar el chi cuadrado? necesito que me expliquen como interpretar cada uno de los indices al momento de realizar el chi cuadrado en realidad, solo se sacar l estadístico y se para que sirve pero no interpretarlo, X^2 (calculada) se compara con la X^2(tabla), para probar la hipótesis. La verdad mejor ve esta liga: http://tgrajales.net/chicuadrada.pdf http://es.wikipedia.org/wiki/Distribuci%… Otras respuestas (1) Claudio Javier T La prueba del Chi cuadrado es solo un cálculo que se utiliza para ver qué tanto se parece la distribución observada con los resultados teóricos, para determinar si un suceso es al azar o tiene alguna tendencia. Por ejemplo, si lanzas una moneda, en teoría tienes 50% de probabilidad de cara o cruz en cada uno. Si la lanzas y te sale un resultado más seguido que el otro, entonces puedes determinar mediante el Chi cuadrado que los resultados no son al azar. Para interpretar este dato, el resultado que te salga lo tienes que comparar con un "nivel de tolerancia" que quieras dar al error en una distribución. Entre más alta sea el valor de la chi cuadrada, será mayor la probabilidad de que los datos tengan una tendencia. Normalmente se utiliza la siguiente fórmula para aceptar o rechazar el valor del chi cuadrado. x²<x²t(r-1)(k-1) Donde x²=chi cuadrada t=Valor proporcionado por las tablas, según el nivel de significación elegido. r=número de filas k=número de columnas Fuente(s): http://es.wikipedia.org/wiki/Prueba_de_c… XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Upload: robylop30

Post on 09-Feb-2016

129 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Chi Cuadrado

CHI CUADRADO

Como interpretar el chi cuadrado?necesito que me expliquen como interpretar cada uno de los indices al momento de realizar el chi cuadrado en realidad, solo se sacar l estadístico y se para que sirve pero no interpretarlo, X^2 (calculada) se compara con la X^2(tabla), para probar la hipótesis.La verdad mejor ve esta liga:http://tgrajales.net/chicuadrada.pdfhttp://es.wikipedia.org/wiki/Distribuci%…

Otras respuestas (1)Claudio Javier TLa prueba del Chi cuadrado es solo un cálculo que se utiliza para ver qué tanto se parece la distribución observada con los resultados teóricos, para determinar si un suceso es al azar o tiene alguna tendencia. Por ejemplo, si lanzas una moneda, en teoría tienes 50% de probabilidad de cara o cruz en cada uno. Si la lanzas y te sale un resultado más seguido que el otro, entonces puedes determinar mediante el Chi cuadrado que los resultados no son al azar. Para interpretar este dato, el resultado que te salga lo tienes que comparar con un "nivel de tolerancia" que quieras dar al error en una distribución. Entre más alta sea el valor de la chi cuadrada, será mayor la probabilidad de que los datos tengan una tendencia. Normalmente se utiliza la siguiente fórmula para aceptar o rechazar el valor del chi cuadrado.x²<x²t(r-1)(k-1)Donde x²=chi cuadradat=Valor proporcionado por las tablas, según el nivel de significación elegido.r=número de filask=número de columnasFuente(s):http://es.wikipedia.org/wiki/Prueba_de_c…

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Rev. Chil Pediatr 2007; 78 (4): 414-417

BIOESTADÍSTICA 

Interpretación del test de Chi-cuadrado (X2) en investigación pediátrica 

JAIME CERDA L.1, LUIS VILLARROEL DEL P.2

Page 2: Chi Cuadrado

1. Pediatra, Programa de Especialidad en Salud Pública. Departamento de Salud Pública, Facultad de Medicina, Pontificia Universidad Católica de Chile. 2. Doctor en Estadística. Departamento de Salud Pública, Facultad de Medicina, Pontificia Universidad Católica de Chile.

RESUMEN

Numerosos protocolos de investigación en pediatría trabajan con variables de tipo cualitativo, por ejemplo, sexo del recién nacido (masculino, femenino) o grado de desnutrición (leve, moderado, severo). Para determinar la asociación o independencia de dos variables cualitativas con un cierto grado de significancia, se dispone de una herramienta estadística frecuentemente utilizada, el test de chi–cuadrado (X2). El presente artículo explica el fundamento teórico del test, la metodología de cálculo del estadístico X2 y su correcta interpretación, ejemplificando estos conceptos mediante una investigación real. En términos simples, el test de chi–cuadrado (X2) contrasta los resultados observados en una investigación con un conjunto de resultados teóricos, estos últimos calculados bajo el supuesto que las variables fueran independientes. La diferencia entre los resultados observados y esperados se resume en el valor que adopta el estadístico X2, el cual tiene asociado un valor–p, por debajo del cual se acepta o rechaza la hipótesis de independencia de las variables. De esta forma, al someter los resultados de una investigación al test de chi–cuadrado (X2) el investigador puede afirmar si dos variables en estudio están asociadas o bien son independientes una de la otra, afirmación que cuenta con un sustento estadístico.

(Palabras clave: X2, estadística, investigación, pediatría).

IntroducciónEn investigación pediátrica, frecuentemente se trabaja con variables de tipo cualitativo (también conocidas como variables categóricas) tales como sexo, grado de desnutrición o “niños mayores de 10 años” (variable cuantitativa transformada en cualitativa). Los valores que toman estas variables se resumen en “tablas de frecuencias”, las cuales permiten ordenarles y comparar su ocurrencia. Si el interés del investigador es establecer la relación (asociación o independencia) entre dos variables, los datos se disponen en “tablas de contingencia”, las cuales incluyen en sus columnas los distintos niveles que adopta la primera variable (ej. masculino, femenino) y en sus filas los distintos niveles que adopta la segunda variable (ej. desnutrición leve, desnutrición moderada y desnutrición severa).

Para determinar la asociación o independencia de dos variables cualitativas, en 1.900 Pearson introdujo el test de chi–cuadrado (χ2), herramienta estadística ampliamente difundida en investigación biomédica1. Este test contrasta dos hipótesis, una hipótesis nula o hipótesis de independencia de las variables (H0) y una hipótesis alternativa o hipótesis de asociación de las variables (H1). En términos simples, el test de χ2 compara los resultados observados con resultados teóricos, estos últimos calculados bajo el supuesto que las variables fuesen independientes entre sí, es decir, bajo el supuesto que H0 fuese verdadera. Si los resultados observados difieren

Page 3: Chi Cuadrado

significativamente de los resultados teóricos, es decir, difieren de H0, es posible rechazar H0 y afirmar que H1 es verdadera, concluyendo que las variables están asociadas. Por el contrario, si los resultados observados y teóricos no difieren significativamente, se confirma la veracidad de H0 y se afirma que las variables son independientes2,3. Mediante el siguiente ejemplo, tomado de una investigación real, se ilustrarán estos conceptos.

Ejemplo

Waisman y colaboradores describieron en 1998 la epidemiología de los accidentes infantiles ocurridos en la Región Centro Cuyo, Argentina4. Uno de sus objetivos fue determinar si existía alguna asociación entre la tasa de incidencia de consultas por accidentes y la estación del año. Para ello, compararon la proporción de consultas por accidentes en invierno y en verano. La tala 1 resume sus observaciones.

Si la variable “tipo de consulta” fuese independiente de la variable “estación del año”, la tasa de incidencia de consultas por accidentes en ambas estaciones deberían ser iguales. En el ejemplo, se observa que la tasa de incidencia de consultas por accidentes en verano es superior a la registrada en invierno (13,5% vs 6,6%), por lo tanto, es posible afirmar que las variables “tipo de consulta” y “estación del año” están asociadas, más ignoramos si esta asociación es estadísticamente significativa. Para objetivar la asociación entre las dos variables, se utiliza el test de χ2.

La hipótesis nula ( H0) del test de χ2 apoya la independencia de las variables, en otras palabras, el tipo de consulta es independiente de la estación del año. Por el contrario, � � � �la hipótesis alternativa (H1) apoya la asociación de las variables, es decir, el tipo de �consulta se asocia a la estación del año. El test de χ2 contrasta los resultados � � �observados con valores teóricos, estos últimos calculados bajo el supuesto que H0 es verdadera. Por consiguiente, se deben calcular los valores teóricos de la tabla de contingencia asumiendo que la proporción de consultas por accidentes en invierno y verano son iguales entre sí e iguales a la proporción de consultas por accidentes totales (9,6%). En la tabla 2 se presentan los valores teóricos que toman las variables asumiendo la veracidad de H0. Nótese que los valores totales no cambian, sólo lo hacen los valores de los niveles que toma cada variable (a, b, c y d).� � � �

El estadístico χ2 dimensiona cuánto difieren los valores observados (tabla 1) de los valores teóricos (tabla 2). Se calcula sumando el valor del cuadrado de la diferencia del valor observado en cada casilla y su valor teórico, dividido por el valor teórico. La razón para elevar las diferencias al cuadrado es convertir todas las diferencias en valores positivos. La siguiente fórmula entrega el valor del estadístico:

χ2 = [(a–a)2/a] + [(b–b)2/b] + [(c–c)2/c] + [(d– d)2/d].� � � � � � � �

Utilizando los valores observados y teóricos del ejemplo, el valor de estadístico χ2 es el siguiente:

χ2 = [(1.418–2.062)2/2.062] + [(2.221– 1.577)2/1.577] + [(20.133–19.489)2/19.489] + [(14.269–14.913)2/14.913] = 512,5. 

Page 4: Chi Cuadrado

A mayor valor del estadístico χ2, mayor es la diferencia entre los valores observados y teóricos, por consiguiente, más alejados están los valores observados de los valores calculados bajo el supuesto que las variables fuesen independientes (H0 verdadera). En consecuencia, a mayor valor del estadístico χ2, mayor es el grado de asociación entre las variables (H1 verdadera).

El siguiente paso consiste en evaluar si el valor que toma el estadístico χ2 es significativo. Para ello, se utiliza la tabla de distribución probabilística de χ2, la cual es dependiente de los “grados de libertad” (estimador del número de categorías independientes en un test particular o experimento estadístico). En una tabla de contingencia de “r” filas y “k” columnas, los grados de libertad son igual al producto del número de filas menos 1 (r–1) por el número de columnas menos 1 (k–1). Para el caso de variables dicotómicas, es decir, variables que toman solamente dos niveles (como las del ejemplo), los grados de libertad son igual a 1. En la tabla de distribución probabilística de χ2, se ubica en la fila correspondiente al número de grados de libertad el valor del estadístico χ2, determinándose su valor–p. En el ejemplo, el estadístico χ2 (512,5) con 1 grado de libertad tiene un valor–p menor a 0,005. Esto significa que existe una probabilidad menor a 0,005 de obtener frecuencias como las observadas en caso de ser H0 verdadera; en consecuencia, se rechaza H0 en favor de H1, apoyando la asociación entre las variables.

Existen algunas consideraciones importantes inherentes al test de χ2. En primer lugar, es un test de tipo no dirigido (test de planteamiento bilateral), es decir, solamente determina la asociación o independencia de dos variables cualitativas, sin informar el sentido ni la magnitud de dicha asociación. Para conocer estos atributos, una vez establecida la asociación entre las variables deben calcularse medidas de riesgo, por ejemplo, odds ratio. En segundo lugar, es importante destacar que el test de χ2 siempre determina la asociación o independencia de dos variables cualitativas, sin embargo, cada una de las variables puede tener más de dos niveles. Un ejemplo de esta situación sería estudiar la asociación entre la variable “nivel socioeconómico”, (alto, medio y bajo) y la variable “grupo sanguíneo Rh positivo” (A, B, AB y 0). En este caso, la tabla de contingencia será de 3 × 4, por consiguiente, los grados de libertad (g.l.) se calculan según la fórmula g.l. = (3-1) × (4-1) = 6. Por último, para realizar el

Page 5: Chi Cuadrado

test de χ2 los valores que toman los niveles de las variables deben cumplir una serie de condiciones numéricas; como norma general, se exigirá que el 80% de las celdas en una tabla de contingencia tengan valores esperados mayores de 5. Así, en una tabla de dos por dos será necesario que todas las celdas verifiquen esta condición; en caso contrario, se deben aplicar herramientas estadísticas tales como el test exacto de Fisher, cuya explicación excede el propósito de esta publicación3,5.

Existen numerosos programas computacionales capaces de realizar el test de χ2, sin embargo, su cálculo es útil solamente cuando lo realiza un investigador familiarizado con su significado estadístico e interpretación. El presente artículo abordó aspectos generales relacionados a este test, siendo necesario para una comprensión más acabada del mismo el estudio personal de estos conceptos en mayor profundidad. Un buen punto de partida es construir tablas de contingencia a partir de los datos reportados en artículos de investigación, calcular el valor del estadístico χ2 para cada una de ellas y determinar su significancia estadística. Esta práctica seguramente aportará al lector una mejor comprensión de los resultados del estudio.

Referencias

1.- Pearson K: On a criterion that a given system of deviations from the probable in the case of correlated system of variables is Duch that it can be reasonably supposed to have arisen from random sampling. Philosophical Magazine 1900; 50: 157-75.         [ Links ]

2.- Bewick V, Cheek L, Ball J: Statistics review 8: qualitative data – tests of association. Critical Care 2004; 8: 46-53.         [ Links ]

3.- Pita S, Pértega S: Asociación de variables cualitativas: test de chi–cuadrado. Disponible en www.fisterra. com [Consultado el 21/03/07].         [ Links ]

4.- Waisman I, Núñez J, Sánchez J: Epidemiología de los accidentes en la infancia en la Región Centro Cuyo. Rev Chil Pediatr 2002; 73: 404-14.         [ Links ]

5.- Pértega S, Pita S: Asociación de variables cualitativas: el test exacto de Fisher y el test de Mcnemar. Disponible en http://www.fisterra.com/ [Consultado el 21/03/ 07].        [ Links ]

Trabajo recibido el 4 de abril de 2007, devuelto para corregir el 07 de mayo de 2007, segunda versión el 24 de mayo de 2007, aceptado para publicación el 18 de junio de 2007.

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Ejercicios del seminario nueve: Chi cuadradoEn este seminario hemos trabajado con la distribución Chi cuadrado,  usada únicamente para las variables categóricas o cualitativas. Es un estadístico que nos ayuda a decidir si las frecuencias observadas están o no en concordancia con las frecuencias esperadas (es decir, si el número de resultados esperados corresponde aproximadamente al número esperado). Para comprobarlo, haremos un contraste de hipótesis usando dicha distribución, Chi cuadrado:

Page 6: Chi Cuadrado

A continuación, se muestran los ejercicios correspondientes con este seminario:Ejercicio 1En un grupo de enfermos que se quejaban de que no dormían se les dio somníferos y placebos. Con los siguientes resultados. Nivel de significación: 0, 05.

¿Es lo mismo tomar somníferos o placebos para dormir bien o mal en este grupo de enfermos?Las hipótesis de este ejercicio, serían las siguientes:- Ho: No es lo mismo tomar somníferos o placebos para dormir mal o bien-H1: Es lo mismo tomar somníferos o placebos para dormir bien o mal.Para la realización del problema se muestran los pasos a seguir, a continuación.Paso 1: Completar la tabla de las frecuencias observadas.

Paso 2: Calcular las frecuencias teóricas.(Es importante caer en la cuenta de que la suma de las frecuencias observadas debe de ser igual a la suma de las frecuencias teóricas).Para este cálculo, tenemos que basarnos en la fórmula: (total  filas x total columnas) / total- ƒe 1 (Duermen bien con somníferos):

- ƒe 2 (Duermen bien con placebos):

- ƒe 3 (Duermen mal con somníferos):

- ƒe 4 (Duermen mal con placebos):

Como dijimos antes, la suma de las frecuencias observables debía de ser igual a la suma de las frecuencias esperadas. En este caso podemos decir, que dicho pronóstico se cumple:- Suma frecuencias observadas = 170- Suma de frecuencias esperadas: 39, 71 + 85, 29 + 14, 29 + 30, 71 = 170Paso 3: Calcular los grados de libertad. En este caso, como son dos los criterios de clasificación, el grado de libertad se calcularía así:Grados de libertad = (nº de filas – 1) por (nº de columnas – 1)Grados de libertad = (2 – 1)(2 – 1) = 1 x 1 = 1Paso 4: Calcular el valor de chi cuadrado (usando para ello la fórmula escrita al principio de esta entrada)

Paso 5: Ver la tabla.En este apartado, buscamos en la tabla de la distribución X2  el valor que se compara con el del resultado del chi cuadrado. Para ello, tenemos que tener en cuenta el nivel de significación (0, 05) y el grado de libertad (1). La tabla que se utiliza,  se muestra en seguida:

Page 7: Chi Cuadrado

Observando la tabla, obtenemos pues que el valor que buscamos es 3, 84.Paso 6: Comparar los valores.- Valor calculado –> 2, 57- Valor de la tabla –> 3, 84Conclusión: como 2, 57 < 3, 84 ——–> ACEPTAMOS H0 y rechazamos H1. Podemos decir que la diferencia no es estadísticamente significativa y que se debe al azar. Es decir, no es lo mismo usar somíferos o placebos para dormir bien o mal en este grupo de enfermos._________________________________________________Ejercicio 2En un C de Salud analizamos las historias de enfermería (292 hombres y 192 mujeres). De ellos tienen úlcera 10 hombres y 24 mujeres y no tienen 282 y 168 respectivamente. Nivel de significación 0, 05. Las hipótesis serías:- Ho: No existe relación entre tener úlcera y el sexo.- H1: Sí existe relación entre tener úlcera y el sexo.Paso 1: Realizar la tabla de las frecuencias observadas.

Paso 2: Calcular las frecuencias teóricas.Para ello, usamos la misma fórmula que en el ejercicio anterior se empleó, teniendo cuenta, además, de que la suma de las frecuencias observadas y la suma de las fecuencias teórias tienen el mismo valor.- ƒe (Hombres son úlcera):

- ƒe (Mujeres con úlcera):

- ƒe (Hombres sin úlcera):

- ƒe (Mujeres sin úlcera):

Dijimos anteriormente, que la suma respectiva de las frecuencias teóricas y la de las frecuencias observadas tenían que tener el mismo valor, pues comprobémoslo:- Suma de frecuencias observadas = 484- Suma de frecuencias teóricas: 20, 51 + 13, 49 + 271, 49 + 178, 51 = 484.Sí se cumple.

Page 8: Chi Cuadrado

Paso 3: Calcular los grados de libertad.Grados de libertad = (nº de filas – 1) por (nº de columnas – 1)Grados de libertad = (2 – 1)(2 – 1) = 1 x 1 = 1Paso 4: Calcular el valor de chi cuadrado.

Paso 5: Ver la tabla.En este apartado, teniendo en cuenta que el nivel de significación es de 0, 05 y el grado de libertad de 1, buscamos en la tabla el valor que necesitamos.Una vez observado la tabla (mostrada en el ejercicio anterior), vemos que el valor que buscamos es 3, 84.Paso 6: Comparar los valores.- Valor calculado –> 14, 61- Valor de la tabla –> 3, 84Conclusión: como 14, 61 > 3, 84 —-> rechazamos Ho y ACEPTAMOS H1. Podemos decir que la diferencia es estadísticamente significativa; es decir, que no existe relación entre  tener úlcera y el sexo de la persona.La otra tarea de este seminario, a parte de los ejercicios ya mostrados, consiste en saber hacer un contraste de hipótesis, solo que en vez de usar esos cálculos, usamos el programa del SSPS. A continuación se muestran los pasos a seguir:- Paso 1: abrir un archivo SPSS y darle a los apartados que aparecen en la imagen.

- Paso 2: Elegir dos variables cuantitativas.

-Paso 3: darle al apartado “estadísticos”.

Page 9: Chi Cuadrado

-Paso 4: Señalar la opción de “Chi cuadrado”; luego, “continuar”, y por último, “aceptar”

         

Como resultado obtenemos lo siguiente:

Page 10: Chi Cuadrado

       

De esto podemos concluir que, sin haber hecho falta el uso de los cálculos que anteriormente sí hemos utilizado,  el valor de chi cuadrado = 10, 115; el grado de libertad = 5; y el valor de p = 0, 072; y como éste último es mayor que alfa (o, o5) decimos pues que ACEPTAMOS Ho y rechazamos H1. Es decir, que la diferencia  no es estadísticamente significativa, y que por tanto no tienen relación ambas variables.

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Chi-Cuadrado Pruebas Estadísticas de SPSS El procedimiento Tablas personalizadas, nos permite realizar tres diferentes pruebas estadísticas para determinar la relación existente entre las variables de fila y columna. A través de la pestaña Estadísticos de contraste se puede solicitar para las variables que se ingresen en la dimensión de filas y columnas, las pruebas de relación / independencia, comparación de medias o la comparación de porcentajes. Para facilitar la interpretación de estos procedimientos generaremos algunos ejemplos de cada una de ella. Debemos resaltar que las pruebas estadísticas aquí mencionadas hacen parte del análisis de inferencia y por lo tanto no serán exploradas a profundidad, sino que las anexamos con el propósito de familiarizarnos con los objetivos de cada prueba, como un preámbulo al estudio de la estadística de inferencia. Prueba de independencia (Chi-cuadrado)La prueba de independencia Chi-cuadrado, nos permite determinar si existe una relación entre dos variables categóricas. Es necesario resaltar que esta prueba

Page 11: Chi Cuadrado

nos indica si existe o no una relación entre las variables, pero no indica el grado o el tipo de relación; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia. A manera de ejemplo crearemos un prueba Chi-cuadrado para las variables Género y Estado civil; desde luego para crear la prueba es necesario realizar la tabla, por lo que debemos volver al generador de tablas y ubicar en la lista la variable género e ingresarla a las columnas, sucesivamente ubicamos la variable Estado civil y la ingresamos a las Filas. Una vez ubicadas la variables en las dimensiones, activamos (Hacer clic) la pestaña Estadísticos de contraste, con lo que aparecen en el cuadro las pruebas estadísticas disponibles [Fig.8-98]. 

Figura 8-98 Cada una de estas pruebas cuenta con la opción Alfa (α); este valor hace referencia al nivel de confianza que deseamos que tengan los cálculos de la prueba; es decir, si queremos tener un nivel de confianza del 95%, el valor de alfa debe ser del 0.05, lo cual corresponde al complemento porcentual de la confianza. Continuando con el ejemplo, seleccionamos la prueba Chi-cuadrado y mantenemos el valor del 0.05 en el Alfa; para finalizar hacemos clic en Aceptar con lo que las tablas se generan el visor de resultados [Fig.8-99]. El programa genera por defecto dos tablas; la primera de ellas corresponde a la tabla de contingencia, en ella aparecen las variables seleccionadas y los estadísticos que se hayan determinado en el procedimiento. La segunda tabla corresponde a la prueba de Chi-cuadrado de Pearson y en ella aparecen los resultados de las pruebas (valor del Chi-cuadrado, los grados de libertad (gl) y el valor de significación (Sig.)). 

Page 12: Chi Cuadrado

Figura 8-99 La prueba de independencia del Chi-cuadrado, parte de la hipótesis que las variables (Estado civil y Género) son independientes; es decir, que no existe ninguna relación entre ellas y por lo tanto ninguna ejerce influencia sobre la otra. El objetivo de esta prueba es comprobar la hipótesis mediante el nivel de significación, por lo que sí el valor de la significación es mayor o igual que el Alfa(0.05), se acepta la hipótesis, pero si es menor se rechaza. Para calcular el valor de significación, el Chi-cuadrado mide la diferencia global entre los recuentos de casilla observados y los recuentos esperados. Entre mayor sea el valor del Chi-cuadrado, mayor será la diferencia entre los recuentos observados y esperados, lo que nos indica que mayor es la relación entre las variables. El valor de significación corresponde a la probabilidad de que una muestra aleatoria, extraída del Chi-cuadrado nos dé cómo resultado un valor superior a 39.672; es decir, es la probabilidad que los datos de una muestra aleatoria extraída de las dos variables sean independientes. Para nuestro ejemplo este valor es menor que el Alfa (0.05), por lo que se rechaza la hipótesis de independencia y por lo tanto, podemos concluir las variables Estado civil y Género están relacionadas. La prueba de independencia Chi-cuadrado, también puede ser empleada con variables Anidadas y/o Apiladas. Si las variables se encuentran anidadas, el programa genera una prueba por cada una de las sub tablas (Categorías) de la variable principal de la anidación. Para comprender cómo se ven afectadas las pruebas de independencia con la anidación de variables, retomaremos el ejemplo anterior, pero anidando la variable Región dentro de las categorías del Género. Para realizarlo debemos volver al generador de tablas; ubicamos en la lista la variable Región y la arrastramos hasta la dimensión de las columnas, de manera que se anide a las categorías del género. Una vez ubicada las variables hacemos clic en Aceptar con lo que las tablas se crean en el visor de resultados [Fig.8-100]. 

Figura 8-100 

Page 13: Chi Cuadrado

Si nos fijamos en los resultados de la tabla, notaremos que el programa realiza dos pruebas de independencia (Una para categoría del Género). Al igual que en el ejemplo anterior, la relación o independencia se determina de acuerdo al valor de significación. Si nos fijamos en los resultados de la significación de las dos pruebas (0.574 y 0.689), notaremos que estos valores superan por un alto margen el valor de alfa (0.05), por lo que debemos aceptar la hipótesis de independencia para los hombres y las mujeres. Notemos que en la parte inferior de la tabla aparecen algunas Notas que nos indican que más del 20% de las casillas de cada tabla tienen frecuencias esperadas menores a 5, por lo que puede que los resultados de la prueba no sean validos. Estas notas nos pueden advertir que existen irregularidades que afectan la muestra, ya sea un sesgo muestral, la fidelidad de los datos o el tamaño de la muestra. Ahora, cuando las variables se encuentran apiladas el programa genera una prueba por cada combinación entre las variables de las filas y las columnas. Para comprender el efecto de la apilación en las pruebas de independencia, retomaremos el ejemplo anterior pero pasando la variable Región de las columnas a las filas, apilándola con el estado civil. Para realizarlo debemos volver al generador de tablas y llevar la variable Región a las filas apilándola con la variable Estado civil. Una vez ubicadas las variables hacemos clic en Aceptar con lo que las tablas se crean en el visor de resultados [Fig.8-101]. 

Figura 8-101 Si nos fijamos en los resultados de la significación para las dos pruebas, notaremos que la variable Género se relaciona con la variable Estado civil, pero es independiente con la variable Región. Las pruebas de independencia nos permiten determinar si existe una relación entre variables, pero para saber el grado de influencia y la dirección (Si es el Género quien influye el Estado civil o viceversa), es necesario realizar una serie de pruebas estadísticas complementarias.

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX