muestra y muestreo

57
Dr. Cristian Díaz Vélez Epidemiólogo Clínico Auditor Médico Cálculos muestrales [email protected] [email protected] RED ASISTENCIAL LAMBAYEQUE ESSALUD O F I C I N A D E I N T E L I G E N C I A S A N I T A R I A

Upload: hospital-nacional-almanzor-aguinaga-asenjo

Post on 28-Nov-2014

7.681 views

Category:

Education


2 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Muestra y muestreo

Dr. Cristian Díaz Vélez

Epidemiólogo Clínico

Auditor Médico

Cálculos muestrales

[email protected]

[email protected]

RED ASISTENCIAL LAMBAYEQUE

ESSALUD

OF

ICIN

A D

E

INTELIGENCIA

SA

NIT

AR

IA

Page 2: Muestra y muestreo

Conceptos primarios

►Población

►Muestra

►Parámetro

►Estadístico

►Varianza poblacional

►Inferencia estadística

►Error muestral o Tolerancia de error

►Nivel de confianza.

Page 3: Muestra y muestreo

Conceptos primarios

►Población: conjunto de individuos oelementos que cumplen ciertas propiedadescomunes.

►Muestra: subconjunto representativo de una población.

Page 4: Muestra y muestreo

Conceptos primarios

►Parámetro : Son las medidas o datos quese obtienen sobre la distribución deprobabilidades de la población, tales comola media, la varianza, la proporción, etc.

►Estadístico. Los datos o medidas que seobtienen sobre una muestra y por lo tantouna estimación de los parámetros, es decires igual al parámetro pero de la muestra.

Page 5: Muestra y muestreo

Conceptos primarios

►Varianza Poblacional. Cuando unapoblación es más homogénea la varianza esmenor. Generalmente es un valordesconocido y hay que estimarlo a partir dedatos de estudios previos.

►Inferencia estadística. Inferencias acercade la población a partir de una muestraextraída de la población.

Page 6: Muestra y muestreo

Conceptos primarios

► Error Muestral o Tolerancia de error: deestimación o standard. Es la diferencia entre unestadístico y su parámetro correspondiente.Generalmente 5%, en estudios con fármacos1%.La tolerancia debe ir de la mano de laprevalencia del estudio en cuestión.

► Nivel de Confianza. Probabilidad de que laestimación efectuada se ajuste a la realidad.

Page 7: Muestra y muestreo

Conceptos primarios

►Ejemplo:

Si por ejemplo estudiamos la prevalencia deasma bronquial en un estudio donde secálculo la muestra con tolerancia de errordel 5% y nivel de significancia del 95% y seencontró que la prevalencia es de 20%.

Interpretación: hay un 95% de probabilidadque la prevalencia real este entre 15 y25%.

Que ocurre si las prevalencias son muy bajas, por ejemplo 2%??

Page 8: Muestra y muestreo

Factores que influyen

►Tipo de diseño.

►Tipo de muestreo utilizado.

►Comparación de muestras independientes o pareadas.

Page 9: Muestra y muestreo

Circulo vicioso del cálculo

Cálculo muestral

Frecuencia del

Problema en estudioLa frecuencia se

obtendrá en el estudio

x

p

r

OR

Page 10: Muestra y muestreo

Muestra para la media de población

El nivel de confianza o seguridad (1-α). El nivel de confianza prefijado da lugar

a un coeficiente (Zα). Para una seguridad del 95% = 1.96; para una seguridad

del 99% = 2.58.

d : error máximo permisible o Tolerancia de error (mayormente 5%)

S2: varianza poblacional

Población conocida Población no conocida

Las variables son numéricas

Page 11: Muestra y muestreo

Muestra para la media de población

es la varianza de la población.

es la varianza de la muestra, la cual podrá determinarse en

términos de probabilidad como

es error estándar que está dado por la diferencia entre () la media

poblacional y la media muestral.

es el error estándar al cuadrado, que nos servirá para determinar

, por lo que = es la varianza poblacional.

Variables Nominales

siendo

Page 12: Muestra y muestreo

Muestra para la media de población

► Ejemplo:

En un área sanitaria, la distribución del peso al nacer deniños que cumplen su período de gestación de 40 sem. esaproxim. normal con una media de m=3500 g. y unaDS=430 g.

Un investigador planea llevar a cabo un estudio paraestimar el peso medio al nacer de los niños que llegan altérmino del embarazo y cuyas madres fumaron duranteese período, asumiendo que la DS es la misma. Si elinvestigador desea que el error (precisión) sea de 50 g conuna confianza del 95%, ¿qué tamaño de muestra serequiere en este estudio?

Page 13: Muestra y muestreo

Muestra para la proporción de población

n: Tamaño muestral

N: Tamaño de la población, número total de historias.

Z: Valor correspondiente a la distribución de Gauss 1,96 para α =0,05

p: Prevalencia del fenómeno en estudio.

Q: 1-p

“i” o “d”: Tolerancia de error (mayormente 5%)*.

•Si las prevalencias son bajas, las tolerancias de error lo debe ser aun más.

Ejemplo de la tasa de prevalencia, se puede suponer que la proporción que

ha de estimarse se moverá probablemente entre un 5% y un 15%, y es razonable

aspirar a que no se incurra en un error mayor del 1%.

Población conocida Población no conocida

Las variables son nominales

Page 14: Muestra y muestreo

Muestra para la proporción de población

• Si la seguridad Zα fuese del 90% el coeficiente sería 1.645

• Si la seguridad Zα fuese del 95% el coeficiente sería 1.96

• Si la seguridad Zα fuese del 97.5% el coeficiente sería 2.24

• Si la seguridad Zα fuese del 99% el coeficiente sería 2.576

Page 15: Muestra y muestreo

Muestra para la proporción de población

► Ejemplo: Se quiere calcular la prevalencia desujetos con reacciones positivas a la tuberculinaentre los < de 5 años de su circunscripción.

► Calcular cuántos niños han de figurar en unamuestra simple aleatoria para que puedaestimarse dicha prevalencia con una precisiónabsoluta, expresada en %, entre el 3 y el 5% y un95% de confianza si se cree, por estudios previos,que la tasa de prevalencia pudiera ser, aproxim.del 20%.

Page 16: Muestra y muestreo

Cálculo del tamaño muestral en estudios de casos y controles

p2: probabilidad de exposición entre los controles

W: es el OR previsto

P1: la frecuencia de exposición entre los casos,

Así, el problema del cálculo del tamaño muestral podrá abordarse mediante

las fórmulas habituales empleadas en la comparación de dos proporciones,

asumiendo aquí que las proporciones esperadas son p1 y p2

Page 17: Muestra y muestreo

Cálculo del tamaño muestral en estudios de casos y controles

p1: La frecuencia de la exposición entre los casos.

p2: La frecuencia de la exposición entre los controles.

α : La seguridad con la que se desea trabajar, o riesgo de cometer un error de

tipo I. Generalmente se trabaja con una seguridad del 95% (α = 0,05).

1-β: El poder estadístico que se quiere para el estudio, o riesgo de cometer un

error de tipo II. Es habitual tomar β = 0,2, es decir, un poder del 80%.

Page 18: Muestra y muestreo

Cálculo del tamaño muestral en estudios de casos y controles

son valores que se obtienen de la distribución normal estándar en función de

la seguridad y el poder elegidos para el estudio. En particular, para una

seguridad de un 95% y un poder estadístico del 80% se tiene que.

Donde:

Page 19: Muestra y muestreo

Cálculo del tamaño muestral en estudios de casos y controles

n = número de sujetos sin pérdidas

R = proporción esperada de pérdidas

Page 20: Muestra y muestreo

Cálculo del tamaño muestral en estudios de casos y controles

► Ejemplo: Un estudio de casos y controlesemparejado sobre tabaquismo y cáncer de laringeutilizando controles poblacionales.

► Suponiendo que la prevalencia del hábitotabáquico en la población es del 45% y que el OResperado es aproxim 3

► ¿cuántos pares de casos y controles necesitarápara estimar el OR con una precisión relativa del15% y un nivel de confianza del 95%?

Page 21: Muestra y muestreo

Cálculo del tamaño muestral en estudios de Cohortes

n : sujetos necesarios en cada una de las muestras

Zα : Valor Z correspondiente al riesgo deseado

Zβ : Valor Z correspondiente al riesgo deseado

S2 : Varianza de la variable cuantitativa que tiene el grupo control o de

referencia.

d : Valor mínimo de la diferencia que se desea detectar (datos cuantitativos).

Page 22: Muestra y muestreo

Cálculo del tamaño muestral en estudios de Cohortes

► Un epidemiólogo proyecta un estudio sobre la posibilidadde que cierta enfermedad pulmonar esté favorecida por laexposición a un contaminante atmosférico recién detectadocuyo efecto no ha sido examinado previamente.

► ¿Qué tamaño tendrá que tener la muestra de cada grupo(el de expuestos y el de no expuestos) si se desea estimarel riesgo relativo con una precisión entre el 10% y el 20%del valor real (el cual, verosímilmente, pudiera ascender a2) con un 95% de confianza?

► La enfermedad se manifiesta en el 20% de las personas noexpuestas al contaminante atmosférico y los dos gruposserán de igual tamaño.

Page 23: Muestra y muestreo

Los valores Zα según la seguridad y Zβ

más utilizados

Page 24: Muestra y muestreo

Tamaño muestral del coeficiente correlación lineal

Siendo el error estándar de z aproximadamente igual a

Page 25: Muestra y muestreo

r: magnitud de la correlación que se desea detectar. Esto se obtiene de

estudios anteriores entre las dos variables a estudio.

1−α: la seguridad con la que se desea trabajar o riesgo de cometer un error

de tipo I. Generalmente se trabaja con una seguridad del 95% (α = 0,05 ).

1−β: el poder estadístico que se quiere para el estudio, o riesgo de cometer

un error de tipo II. Es habitual tomar β = 0,2 o, equivalentemente, un poder

estadístico del 80%.

A. Planteamiento bilateral B. Planteamiento Unilateral

Tamaño muestral del coeficiente correlación lineal

Page 26: Muestra y muestreo

Tamaño muestral del coeficiente correlación lineal

se obtienen de la distribución normal estándar en función de la seguridad

y el poder elegidos para el estudio. En particular, para una seguridad del

95% y un poder estadístico del 80% se tiene que

A

B

Page 27: Muestra y muestreo

Tamaño muestral del coeficiente correlación lineal

► Supóngase que la correlación entre el volumenespiratorio forzado en un segundo y la capacidadvital forzada en individuos sanos esaproximadamente de 0,60.

► Supóngase, adicionalmente, que un grupo depacientes con una enfermedad de pulmón estáaccesible en una clínica, e interesa contrastar sihay correlación entre ambas medidas en esospacientes. Con un nivel de confianza del 95% yuna potencia del 90%, ¿cuántos sujetos senecesitan en la muestra?

Page 28: Muestra y muestreo

Ensayos Clínicos

► La formula dependerá del tipo de medida que se estecalculando en el ensayo clinico.

Ejemplo: un ensayo clínico sobre el uso de una droga enembarazos gemelares, un tocólogo desea demostrar quehay un aumento significativo en la duración del embarazoal usar la droga frente a un placebo.

El tocólogo estima que la desviación estándar de laduración de los embarazos es de 1,75 semanas. ¿Cuántosembarazos debe observar como mínimo en cada grupo siconsidera que una semana es un aumento clínicamenteimportante en la duración del embarazo y quiere operarcon una confianza del 95% y una potencia del 80%?

Page 29: Muestra y muestreo

Ejercicio 1

► Se desea hacer una encuesta paradeterminar la proporción de familias quecarecen de medios económicos para atenderlos problemas de salud. Existe la impresiónde que esta proporción está próxima a 0,35.Se desea determinar un intervalo deconfianza del 95% con un error deestimación de 0,05. ¿De qué tamaño debetomarse la muestra?

Page 30: Muestra y muestreo

Ejemplo 2

►Se desea conocer el peso promedio deuna determinada clase de pescado conun error de estimación de 0,02 y conun nivel de confianza del 99%. Pordatos anteriores se sabe que el pesotiene DS. 4,5. ¿De qué tamaño debeescoger la muestra? Suponga que lospesos de estos pescados se distribuyennormalmente.

Page 31: Muestra y muestreo

Ejercicio 3

►Un productor de semillas desea sabercon un error de estimación del 1% elporcentaje de semillas que germinanen la granja de su competidor. ¿Quétamaño de muestra debe tomarse paraobtener un nivel de confianza del95%?

Page 32: Muestra y muestreo

Ejercicio

► En un ensayo clínico sobre el uso de una droga enembarazos gemelares, un tocólogo deseademostrar que hay un aumento significativo en laduración del embarazo al usar la droga frente a unplacebo. El tocólogo estima que la desviaciónestándar de la duración de los embarazos es de1,75 semanas. ¿Cuántos embarazos debe observarcomo mínimo en cada grupo si considera que unasemana es un aumento clínicamente importanteen la duración del embarazo y quiere operar conuna confianza del 95% y una potencia del 80%?

Page 33: Muestra y muestreo

Ejercicio 4

► Se desea realizar una encuesta entre lapoblación juvenil de una determinadalocalidad para determinar la proporción dejóvenes que estaría a favor de una nuevaweb. El número de jóvenes de dichapoblación es N=2.000. Determinar eltamaño de muestra necesario para estimarla proporción de estudiantes que están afavor con un error de estimación de 0.05 yun nivel de confianza del 95%.

Page 34: Muestra y muestreo

Ejercicio 4

► Se desea realizar un estudio de cohortes. Por laliteratura esperamos encontrar un RR enExpuestos de 1.75, se desea estimar este RR consu intervalo de confianza. Además sabemos que elporcentaje de enfermos en población no expuestaes del 10%.

► Calcular que número de Expuestos y NoExpuestos necesitamos estudiar para tener unnivel de confianza del 90% asumiendo un errormáximo en el RR del 10%.

► Estudiar como varía este “n” si asumimos un errormáximo del RR del 25%.

Page 35: Muestra y muestreo

Ejercicio 5

►Usted desea realizar un estudio de casos ycontroles, con 3 controles por caso, paraanalizar la influencia del consumo de alcoholen la aparición de cáncer de esófago.¿Cuántos sujetos debe estudiar si quierepoder declarar como significativo un OR de2,5 o mayor y sabe que la exposición entrelos controles es del 60%? (Suponga un nivelde confianza del 95% y una potencia del80%).

Page 36: Muestra y muestreo

Ejemplo 5:

Suponiendo un 20% de enfermedad en el grupo de No Expuestos en unestudio de cohortes, ¿Cuál es el tamaño mínimo que necesitamos en cadagrupo de Expuestos/No Expuestos para estimar el RR en expuestos con un10% del valor real, pensando que es aproximadamente de 1,75, con un 95%de confianza?

Con los datos observamos que

P2=0,2

Entonces, P1=(RR)P2 = 0,2*1,75 = 0,35

Y

Si quisiéramos tener un nivel de confianza del 99%

95,2026)]1,01[ln(

)]2,0/8,0()35,0/65,0[(96,12

2

N

24,3501)]1,01[ln(

)]2,0/8,0()35,0/65,0[(576,22

2

N

Como RR=(a/n1)/(b/n2); a/n1=p1 y b/n2=p2

Page 37: Muestra y muestreo

Ejemplo 6:

Suponiendo un 15% de enfermedad en el grupo de No Expuestos y unadiferencia máxima del 30% con el grupo de expuestos en un estudio decohortes, ¿Cuál es el tamaño mínimo que necesitamos en cada grupo deExpuesto/No Expuestos para estimar el RR sobre un 20% del valor real, conun 95% de confianza?

Con los datos observamos que

P1=0,45

P2=0,15

Si quisiéramos asumir solo un 10% de variabilidad sobre el valor real.

48,531)]2,01[ln(

)]15,0/85,0()45,0/55,0[(96,12

2

N

99,2383)]1,01[ln(

)]15,0/85,0()40,0/60,0[(96,12

2

N

Page 38: Muestra y muestreo

Ejemplo 8:

Se realiza un estudio multicéntrico para evaluar el efecto de un fármaco sobreuna patología concreta cardiovascular. Los pacientes serán randomizados endos Brazos (A y B). Calcular el número de pacientes que debe haber en cadabrazo para un poder del 90% y un nivel de confianza del 95%, con un diseñode dos colas, asumiendo como peor prevalencia en Brazo B 0,35 y asumiendoun RR=2.Con los datos observamos que

P2=0,35 P1=(RR)P2=0.7 P=P1+P2/2=0.525

Sustituyendo en la fórmula

Si quisiéramos tener un nivel de confianza del 99% y un poder del 80%:

67,40

)35,07,0(

)]65,0)(35,0()3,0)(7,0[(282.1)475,0)(525,0(2[96,12

2

N

09,46

)35,07,0(

)]65,0)(35,0()3,0)(7,0[(842,0)475,0)(525,0(2[576,22

2

N

Page 39: Muestra y muestreo

Ejemplo 9:

Aceptando un 15% de enfermedad en el grupo de No Expuestos y unadiferencia máxima del 30% con el grupo de expuestos en un estudio decohortes, ¿Cuál es el tamaño mínimo que necesitamos en cada grupo deExpuesto/No Expuestos para estimar el RR con un error tipo II del 20% y conun 95% de confianza?

Con los datos observamos que

P1=0,45P2=0,15

Si quisiéramos asumir un poder del 90%.

44,35

)35,07,0(

)]65,0)(35,0()3,0)(7,0[(842,0)475,0)(525,0(2[96,12

2

N

94,46

)35,07,0(

)]65,0)(35,0()3,0)(7,0[(282.1)475,0)(525,0(2[96,12

2

N

Page 40: Muestra y muestreo

Ejercicio 10

► Al realizar un protocolo para un estudio de cohortes, no se encuentra ningún dato sobre el RR de la enfermedad en expuestos. Se sabe que el % de enfermos en expuestos es del 20%. Al 95% de confianza y con un poder del 80%, calcular el tamaño muestral necesario para estimar el RR asumiendo como peor:

► a) RR=1.25

► b) RR=2.00

► c) RR=3.00

► d) RR=3.5

Page 41: Muestra y muestreo

TIPO DE MUESTREO

Page 42: Muestra y muestreo
Page 43: Muestra y muestreo

Muestreo aleatorio simple

►Es aquel en que cada elemento de lapoblación tiene la misma probabilidad de serseleccionado para integrar la muestra.

►Existen dos formas de extraer una muestrade una población: con reposición y sinreposición.

Page 44: Muestra y muestreo

Muestreo aleatorio simple

► Muestreo con reemplazo: un elemento puedeser seleccionado más de una vez en la muestrapara ello se extrae un elemento de la población seobserva y se devuelve a la población, por lo quede esta forma se pueden hacer infinitasextracciones de la población aun siendo esta finita.

► Muestreo sin reemplazo: No se devuelve loselementos extraídos a la población hasta que nose hallan extraídos todos los elementos de lapoblación que conforman la muestra.

Page 45: Muestra y muestreo

Muestreo aleatorio simple

►Ejemplo:

Supóngase que se quiere obtener una MSAde 120 estudiantes de un centrouniversitario que tiene 966 alumnosregistrados.

Page 46: Muestra y muestreo

Muestreo sistemático en fases

►También otorga igual probabilidad deintegrar la muestra a todas las unidades deanálisis de la población.

►Se usa para los casos en los que no secuenta con una base de datos con el casodel muestreo aleatorio simple.

►Para su calculo se debe saber el tamaño dela población y que porcentaje es la muestrade la población.

Page 47: Muestra y muestreo

Muestreo sistemático en fases

►Ejemplo:

Supóngase que se quiere obtener unamuestra sistemática que contengaaproximadamente al 12% de los estudiantesde un centro universitario que tiene 966alumnos registrados.

Page 48: Muestra y muestreo

Muestreo aleatorio estratificado

►Un muestreo aleatorio estratificado es aquelen el que se divide la población de Nindividuos, en k sub-poblaciones o estratos,atendiendo a criterios que puedan serimportantes en el estudio, de tamañosrespectivos.

N1, . . . , Nk,

Page 49: Muestra y muestreo

Muestreo aleatorio estratificado

► Ejemplo:

Supóngase que se quiere obtener una muestrade 120 estudiantes de un centro universitarioque tiene 966 alumnos registrados, distribuidosen cuatro áreas académicas con los siguientestamaños:

Ingeniería: 264

Ciencias económicas: 284

Ciencias salud: 182

Letras: 236

Page 50: Muestra y muestreo

Muestreo por conglomerados monoetápico

►No se pueda disponer de un listado total delas unidades de análisis, solo se sabe decuantas están conformadas cada unidadesde análisis y/o

►Dispersión geográfica de las unidades deanálisis a lo largo del territorio en que sehalla ubicada la población.

Page 51: Muestra y muestreo

Muestreo por conglomerados monoetápico

►Cuando solo se tienen identificados losconglomerados y sus tamaños; en este casose debe conformar un archivo con tantosregistros como conglomerados, con uncampo que identifique el conglomerado yotro campo que contenga su tamaño(número de unidades de que consta).

Page 52: Muestra y muestreo

Muestreo por conglomerados monoetápico

►Ejemplo:

Supóngase que se quiere obtener unamuestra de aproximadamente 120estudiantes de un centro universitario quetiene 966 alumnos registrados y que losalumnos están distribuidos en 52 grupos detamaños variables y conocidos.

Page 53: Muestra y muestreo

Muestreo por conglomerados bietápico

►Este procedimiento de selección muestral seutiliza cuando hay gran variabilidad entrelos tamaños de los conglomerados.

►Se usa para escoger más conglomerados,claro esta manteniéndose la misma cantidadde la muestra.

Page 54: Muestra y muestreo

Muestreo por conglomerados bietápico

► Ejemplo:

Supóngase que se quiere obtener una muestra de120 estudiantes de un centro universitario quetiene 966 alumnos registrados. Supóngase ademásque los alumnos están distribuidos en 52 gruposde tamaños variables y conocidos y que se hadecidido seleccionar 12 de esos grupos, oequivalentemente, 10 alumnos por grupo.

Page 55: Muestra y muestreo

Muestreo por conclomerados bietápico estratificado

►Este procedimiento de selección muestral seutiliza cuando se quiere aplicar un muestreobietápico pero habiendo separado antes lasUnidades de Primera Etapa según estratos.

►Se trata de un método cuyo uso está muyextendido en la práctica.

Page 56: Muestra y muestreo

Muestreo por conclomerados bietápico estratificado

► Ejemplo:Supóngase que se quiere obtener una muestrade 120 estudiantes de un centro universitarioque tiene 966 alumnos registrados. Supóngaseademás que hay cuatro áreas académicas y queen cada una existe cierto número de grupos dealumnos (14, 14, 11 y 13 gruposrespectivamente) de modo que los alumnosestán distribuidos en 52 grupos de tamañosvariables y conocidos. Considérese, finalmente,que se ha decidido seleccionar 12 de esosgrupos y 10 alumnos por grupo.

Page 57: Muestra y muestreo