bioestadística inferencias con datos categóricos
Post on 23-Jan-2016
229 Views
Preview:
TRANSCRIPT
Bioestadística
Inferencias con datos categóricos
Posibles escenariosESTADO REAL (VERDAD)
desconocido
Hay diferencia, Ha es verdadera
EVIDENCIA( DATOS)observado
No diferencia (No rechazar H0)
No hay diferencia, H0 es verdadera
Error Tipo II (β)
Error Tipo I (α)
Diferencia (Rechazar H0 y aceptar Ha)
NO HAY ERROR
NO HAY ERROR
Interpretando pruebas:
P-value de la
muestra< 0.05
α o nivel de significancia
Prob. de error tipo Prob(Ho verdadera) Rechazo Ho y acepto Ha
Me preocupo de que Ho pueda ser verdadera, particularmente si el p-
value es < 0.05 pero no muy “pequeño”
No puedo rechazar Ho y no puedo afirmar nada sobre la validez de HaLa diferencia/asociación observada
tiene relevancia biológica?El tamaño de muestra dió suficiente
“potencia” (1-β)?Si es fácil, calcule la potencia
SI
NO
Usos de la prueba Chi2:
Para determinar si dos variables categóricas están asociadas entre sí
Para determinar el ajuste de datos empíricos provenientes de una muestra a una cierta distribución teórica
Para hacer estimación por intervalos y prueba de hipótesis de una muestra sobre la varianza de una población
Principio central: Cálculo de las diferencias (al cuadrado) entre los
valores observados y esperados de una o mas variables
Los valores esperados se calculan de acuerdo a una distribución planteada como hipótesis nula
Si la suma de las diferencias es “grande”, la distribución propuesta para los valores esperados (H0) no “predice” bien los valores que hemos observado. Se rechaza H0.
Ejemplo: relación entre el género y el status social
La pregunta de interés:
¿El status social está relacionado con el género en las personas encuestadas en el estudio de DEVIDA?
¿La distribución por clase social es diferente entre varones y mujeres?
¿La proporción de varones y mujeres difiere entre los grupos sociales estudiados?
Hipótesis: Comparando la distribución por clase social:
– Hipótesis nula (Ho):
Claseshombres = Clasesmujeres
– Hipótesis alternativa (Ha):
Claseshombres Clasesmujeres
Comparando la distribución por sexo:– Hipótesis nula (Ho):
Sexoalta = Sexomedia = Sexobaja
– Hipótesis alternativa (Ha):
Sexoalta , Sexomedia , Sexobajano son iguales. Al menos una de estas proporciones difiere de las otras
Entendiendo el método:
Un eje para calcular marginales
Calculando valores esperados:
108 * 0.4344 = 46.9 108 * 0.5656 = 61.1
1,261 * 0.4344 = 547.8 1,261 * 0.5656 = 713.2
3,481 * 0.4344 = 2,107.0 3,481 * 0.5656 = 2,473.0
Escogiendo otro eje:
Eje para calcular marginales
Calculando valores esperados:
2,107 * 0.0223 = 46.9 2,107 * 0.2600 = 547.82,107 * 0.7177 = 1,512.3
2,743 * 0.0223 = 61.12,743 * 0.2600 = 713.22,743 * 0.7177 = 1,968.7
Cálculo de la Chi2:
Grados de libertad = (filas – 1) * (columnas –1) = (3-1) * (2-1) = 2
Fil. Col. Obs. Esp. Dif. Dif^2 Dif^2/Esp1 1 60 46.9 13.1 171.6 3.71 2 48 61.1 -13.1 171.6 2.82 1 555 547.8 7.2 51.8 0.12 2 706 713.2 -7.2 51.8 0.13 1 1,492 1,512.3 -20.3 412.1 0.33 2 1,989 1,968.7 20.3 412.1 0.2
Total 7.1
En Stata:
Chi2 con 2 grados de libertad:
0.00
0.03
0.06
0.09
0.12
0 2 4 6 8
Chi-cuadrada
Pro
ba
bil
ida
d
Si Chi2>5.99 (α=0.05),rechaza H0
Chi2 calculado = 7.10 (p=0.029)
Interpretación: Según el estadístico Chi2 , el sexo no es
independiente del status social
La proporción de varones y mujeres difiere según el status social
La proporción de varones es diferente estadísticamente entre los tres estratos socioeconómicos
La distribución según estrato social difiere entre varones y mujeres
La prueba Chi2:
Pregunta de Interés:
La distribución entre sexos difiere entre las cuatro regiones
El sexo es independiente de la región (?)
Hipótesis Planteadas:
Hipótesis nula (Ho):
%VaronesLima = %VaronesCosta = %VaronesSierra = %VaronesSelva
Hipótesis alternativa (Ha):
La proporción de varones difiere al menos entre dos de las regiones
Cálculos:
Eje a escoger
Valores esperados
Grados de libertad
Interpretación:
El sexo es independiente de la región geográfica
La proporción de varones no cambia entre las cuatro regiones geográficas
Ejemplo 3:
La proporción de varones y mujeres en la encuesta es 50%
Prueba exacta de Fisher:
Válida para tablas 2x2 y para N x M
Usa permutaciones y se basa en las probabilidades marginales observadas
No requiere un mínimo valor esperado por celda
Prueba exacta de Fisher:
Concordancia entre dos pruebas:
T E S T A
Sin enfermedad (A+) Con enfermedad (A-)
T
E
S
T
B
Sinenfermedad
(B+)
Conenfermedad
(B-)
A+ y B+
a
A- y B+
b
A+ y B-
c
A- y B-
d
El estadístico Kappa:
Concordancia Observada – Concordancia Aleatoria
Kappa = ------------------------------------------- 1 - Concordancia Aleatoria
Concordancia Observada = (a + d) / (a + b + c + d)
Concordancia Aleatoria = [a / (a + b)] * [a / (a + c)] +
(esperada) [d / (c + d)] * [d / (b + d)]
Calculando a mano:
Observada: 0.0509 + .6765 = 0.7274Aleatoria: (86.3 + 3,120.3)/4850 = 0.6612
Cálculos:
Concordancia Observada – Concordancia Aleatoria
Kappa = ---------------------------------------------- 1 - Concordancia Aleatoria
0.7274 – 0.6612 0.0662
Kappa = ----------------- = -------- = 0.1954 1 – 0.6612 0.3388
Estadístico Kappa:
Que debemos recordar de hoy: El concepto y los supuestos para la aplicación de
la prueba Chi2
Como aplicar la prueba Chi2 para determinar si dos variables categóricas están asociadas entre si
El uso de la prueba Chi2 para determinar la validez de una cierta distribución teórica sobre un conjunto de datos empíricos
La aplicación e interpretación de la prueba Kappa de concordancia
top related