tablas de contingencia(ii)

16

Click here to load reader

Upload: cristina-abad-ramos

Post on 24-Apr-2015

19 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tablas de Contingencia(II)

Curso de introducción al SPSS –

Sesión 4

Tablas de contingencia (I)

Jordi Muñoz ([email protected])Despacho B3‐119/1 

Page 2: Tablas de Contingencia(II)

Tipos de variables

Hasta ahora hemos visto que hay variables de distinta naturaleza. Las podemos clasificar de manera sistemática:

•Contínuas (Numéricas / De intervalo / Escala): Son de naturaleza numérica. Pueden tomar cualquier valor entre -∞

y + ∞

•Categóricas: Toman una serie de valores discretos•Nominales: Los valores se asignan arbitrariamente a las categorias, que no tienen un orden natural•Ordinales : Las categorias se pueden ordenar, y por lo tanto la asignación no es completamente arbitraria.

Introducción al SPSSIntroducción al SPSS

Page 3: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Tablas de contingencia: qué son?

Dos (o más) variables categóricas

Explorar la relación

entre ellas

Ejemplo:

voto

y

asistencia

a servicios

religiosos

Page 4: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Variables dependiente e independiente

Variable dependiente: Lo que queremos explicar. La ‘consecuencia’

Variable independiente: Lo que explica la dependiente. La ‘causa’

Page 5: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Tablas de contingencia: las 3 reglas

Regla 1: Poner siempre la variable

dependiente en las filas, la independiente en las columnas

Regla 2: Calcular los porcentajes de las categorias de la variable independiente (porcentajes de columna)

Regla 3: Interpretar la tabla mediante la comparación entre columnas para el mismo valor de la variable dependiente

Page 6: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Voto y asistencia a servicios religiosos

Page 7: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Tablas de contingencia : La hipótesis nula

La hipótesis nula:

independencia

Distribución

proporcional de los

casos a lo

largo

de la columna, basada en los

totales

de fila

Frecuencia

esperada (bajo supuesto de independencia) en la celda (i,j) = E(i,j) = número total en la

columna j * numero

total en

la

fila i/número total en la tabla

E(i,j)

= [(total fila/total tabla)*(total columna/total tabla)]*total = (total fila*total col)/total tabla

Page 8: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Tablas de contingencia : Residuos

Residuo

en

la celda

(i,j) = frecuencia

observada

(i,j) –

frecuencia esperada

(i,j)

R(i,j)= O(i,j)-E(i,j)

Page 9: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Tablas de contingencia : Resíduos estandarizados

Residuo estandarizado, de Pearson

RS(i,j)=R(i,j)/√E(i,j)

Media 0 y desviación tipica 1

Si son

positivos, la

celda

está

sobrerepresentadaSi son

negativos, está

infrarepresentada

Page 10: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Tablas de contingencia : chi cuadrado

Test del Chi-cuadrado

p2

ij

f ij Eij 2Eij

Grados

de libertad:

(I-1)(J-1)

Page 11: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Tablas de contingencia : chi cuadrado

Page 12: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Tablas de contingencia : chi cuadrado

La tabla del Chi cuadrado nos indicará

la probabilidad de haver obtenido aquel valor bajo supuesto de independencia

•Si p>α; aceptamos

la hipótesis

nula

(no hay

relación)•Si p<α; rechazamos

la hipótesis

nula y nos quedamos con

la alternativa (Hay relación entre las variables)

Si el Chi-cuadrado

nos

indica que hay

relació

entre las

variables, entonces podemos mirar los resíduos estandarizados, que nos indicarán que celdas causan la relación.

Problemas: •Sensible al tamaño

de la muestra

(proporcional a N)

•Debemos cumplir que

Ei,j

>5 (fusionar categorias)

Page 13: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Los Resíduos estandarizados nos dan una indicación sobre indicios de relación entre las variables: si el resíduo es demasiado grande, debemos dudar de la hipótesis de independencia.

Los niveles de significación de los resíduos estandarizados:+/-

1.96, alrededor

de 0.05.

+/-2.58, alrededor de

0.01.

Esto equivale a un test de la hipótesis nula que la frecuencia observada y la esperada de la celda son iguales.

Tablas de contingencia : Resíduos estandarizados

Page 14: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Tablas de contingencia: medidas de asociación

El Chi quadrat ens permet dir si hi ha o no relació

entre les variables. Però com és de forta aquesta relació? Per això hem de veure els estadístics Phi i V de Cramer

•La Phi és adequada per a taules de 2*2•La V de Cramer és adequada per a les altres situacions

•Varien entre -1 i 1-1.0 a -0.7 associació

negativa forta

-0.7 a -0.3 associació

negativa-0.3 a +0.3 poca o cap associació+0.3 a +0.7 associació

positiva

+0.7 a +1.0 associació

positiva forta

Page 15: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Práctica: El perfil sociológico de los votantes de los partidos

1.Exploraremos las opciones de SPSS para hacer tablas de contingencia

(AnalizarEstadísticos descriptivosTablas de

contingencia)

•Filas / Columnas –

Aquí

pondremos las variables que queramos meter en las filas y columnas. Recuerda

que la

variable dependiente normalmente va en las filas, y la independiente en las columna.

•Casillas –

Se nos abrirá

una ventana en la que podremos escoger el contenido de las celdas de la tabla (frecuencias, porcentajes y resíduos)

•Estadísticos –Nos permite escoger los estadísticos de asociación

Page 16: Tablas de Contingencia(II)

Introducción al SPSSIntroducción al SPSS

Práctica: El perfil sociológico de los votantes de los partidos

Ahora debes decidir con qué

variables trabajarás. Que variables independientes crees que són relevantes para estudiar el perfil sociológico de los electorados. Si estuvieses en un gabinete estratégico de un partido, que querrías saber sobre la composición social de tu electorado?

Repasa las variables seleccionadas. Asegúrate de que los casos perdidos están correctamente codificados. En algunos casos puede ser necesaria una recodificación, para reducir el número de categorías, por ejemplo pasando las que no nos interesen a casos perdidos, o colapsando más de una categoría.

Cuando las tengas preparadas, elabora las tablas de contingencia

y haz un esfuerzo por analizar los resultados. Qué

nos indican estas

tablas sobre el perfil de los votantes?