bioestadística inferencias con datos categóricos

Report

Post on 23-Jan-2016

229 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Bioestadística

Inferencias con datos categóricos

Posibles escenariosESTADO REAL (VERDAD)

desconocido

Hay diferencia, Ha es verdadera

EVIDENCIA( DATOS)observado

No diferencia (No rechazar H0)

No hay diferencia, H0 es verdadera

Error Tipo II (β)

Error Tipo I (α)

Diferencia (Rechazar H0 y aceptar Ha)

NO HAY ERROR

Interpretando pruebas:

P-value de la

muestra< 0.05

α o nivel de significancia

Prob. de error tipo Prob(Ho verdadera) Rechazo Ho y acepto Ha

Me preocupo de que Ho pueda ser verdadera, particularmente si el p-

value es < 0.05 pero no muy “pequeño”

No puedo rechazar Ho y no puedo afirmar nada sobre la validez de HaLa diferencia/asociación observada

tiene relevancia biológica?El tamaño de muestra dió suficiente

“potencia” (1-β)?Si es fácil, calcule la potencia

Usos de la prueba Chi2:

Para determinar si dos variables categóricas están asociadas entre sí

Para determinar el ajuste de datos empíricos provenientes de una muestra a una cierta distribución teórica

Para hacer estimación por intervalos y prueba de hipótesis de una muestra sobre la varianza de una población

Principio central: Cálculo de las diferencias (al cuadrado) entre los

valores observados y esperados de una o mas variables

Los valores esperados se calculan de acuerdo a una distribución planteada como hipótesis nula

Si la suma de las diferencias es “grande”, la distribución propuesta para los valores esperados (H0) no “predice” bien los valores que hemos observado. Se rechaza H0.

Ejemplo: relación entre el género y el status social

La pregunta de interés:

¿El status social está relacionado con el género en las personas encuestadas en el estudio de DEVIDA?

¿La distribución por clase social es diferente entre varones y mujeres?

¿La proporción de varones y mujeres difiere entre los grupos sociales estudiados?

Hipótesis: Comparando la distribución por clase social:

– Hipótesis nula (Ho):

Claseshombres = Clasesmujeres

– Hipótesis alternativa (Ha):

Claseshombres Clasesmujeres

Comparando la distribución por sexo:– Hipótesis nula (Ho):

Sexoalta = Sexomedia = Sexobaja

– Hipótesis alternativa (Ha):

Sexoalta , Sexomedia , Sexobajano son iguales. Al menos una de estas proporciones difiere de las otras

Entendiendo el método:

Un eje para calcular marginales

Calculando valores esperados:

108 * 0.4344 = 46.9 108 * 0.5656 = 61.1

1,261 * 0.4344 = 547.8 1,261 * 0.5656 = 713.2

3,481 * 0.4344 = 2,107.0 3,481 * 0.5656 = 2,473.0

Escogiendo otro eje:

Eje para calcular marginales

Calculando valores esperados:

2,107 * 0.0223 = 46.9 2,107 * 0.2600 = 547.82,107 * 0.7177 = 1,512.3

2,743 * 0.0223 = 61.12,743 * 0.2600 = 713.22,743 * 0.7177 = 1,968.7

Cálculo de la Chi2:

Grados de libertad = (filas – 1) * (columnas –1) = (3-1) * (2-1) = 2

Fil. Col. Obs. Esp. Dif. Dif^2 Dif^2/Esp1 1 60 46.9 13.1 171.6 3.71 2 48 61.1 -13.1 171.6 2.82 1 555 547.8 7.2 51.8 0.12 2 706 713.2 -7.2 51.8 0.13 1 1,492 1,512.3 -20.3 412.1 0.33 2 1,989 1,968.7 20.3 412.1 0.2

Total 7.1

En Stata:

Chi2 con 2 grados de libertad:

0.00

0.03

0.06

0.09

0.12

0 2 4 6 8

Chi-cuadrada

Pro

bil

ida

Si Chi2>5.99 (α=0.05),rechaza H0

Chi2 calculado = 7.10 (p=0.029)

Interpretación: Según el estadístico Chi2 , el sexo no es

independiente del status social

La proporción de varones y mujeres difiere según el status social

La proporción de varones es diferente estadísticamente entre los tres estratos socioeconómicos

La distribución según estrato social difiere entre varones y mujeres

La prueba Chi2:

Pregunta de Interés:

La distribución entre sexos difiere entre las cuatro regiones

El sexo es independiente de la región (?)

Hipótesis Planteadas:

Hipótesis nula (Ho):

%VaronesLima = %VaronesCosta = %VaronesSierra = %VaronesSelva

Hipótesis alternativa (Ha):

La proporción de varones difiere al menos entre dos de las regiones

Cálculos:

Eje a escoger

Valores esperados

Grados de libertad

Interpretación:

El sexo es independiente de la región geográfica

La proporción de varones no cambia entre las cuatro regiones geográficas

Ejemplo 3:

La proporción de varones y mujeres en la encuesta es 50%

Prueba exacta de Fisher:

Válida para tablas 2x2 y para N x M

Usa permutaciones y se basa en las probabilidades marginales observadas

No requiere un mínimo valor esperado por celda

Prueba exacta de Fisher:

Concordancia entre dos pruebas:

T E S T A

Sin enfermedad (A+) Con enfermedad (A-)

Sinenfermedad

(B+)

Conenfermedad

(B-)

A+ y B+

A- y B+

A+ y B-

A- y B-

El estadístico Kappa:

Concordancia Observada – Concordancia Aleatoria

Kappa = ------------------------------------------- 1 - Concordancia Aleatoria

Concordancia Observada = (a + d) / (a + b + c + d)

Concordancia Aleatoria = [a / (a + b)] * [a / (a + c)] +

(esperada) [d / (c + d)] * [d / (b + d)]

Calculando a mano:

Observada: 0.0509 + .6765 = 0.7274Aleatoria: (86.3 + 3,120.3)/4850 = 0.6612

Cálculos:

Concordancia Observada – Concordancia Aleatoria

Kappa = ---------------------------------------------- 1 - Concordancia Aleatoria

0.7274 – 0.6612 0.0662

Kappa = ----------------- = -------- = 0.1954 1 – 0.6612 0.3388

Estadístico Kappa:

Que debemos recordar de hoy: El concepto y los supuestos para la aplicación de

la prueba Chi2

Como aplicar la prueba Chi2 para determinar si dos variables categóricas están asociadas entre si

El uso de la prueba Chi2 para determinar la validez de una cierta distribución teórica sobre un conjunto de datos empíricos

La aplicación e interpretación de la prueba Kappa de concordancia

top related

bioestadística inferencias con datos categóricos

Documents

enunciados categóricos

inferencias leon

bioestadística probabilidades 2015

estimaciÓn de atributos categÓricos del modelo …

bioestadística. u. málaga.tema 2: estadísticos 1...

bioestadística-capítulo 4

lengua b5 inferencias

bioestadística seminario iii

metodología de tipos ideales con datos categóricos. el

datos categóricos

bioestadÍstica i

silogismos categóricos

inferencias de proporciones

introducción bioestadística

inferencias 2

nc bioestadística 2015sept2

epidemiología y bioestadística

bioestadística sem 10

silogismos inferencias

inferencias 1