medidas de resumen
TRANSCRIPT
UNIVERSIDAD CATOLICA SANTO TORIBIO DE MOGROVEJO
CHICLAYO - 2010
ESCUELA DE MEDICINA
SALUD PUBLICA II
Medidas de Tendencia Central
Medidas de Frecuencia
Prof: JULIO PATAZCA ULFE
Especialista en Salud Pública
Epidemiología: Medidas de Resumen
Medidas
Frecuencia Proporción; Razón; Tasa; Prevalencia; Incidencia
Tendencia Central Media, Moda, Mediana
Dispersión Rango, Rango intercuartílico, Desvío estándar
Orden Percentiles, Cuartiles
Efecto o Asociación Riesgo Relativo (RR), Odds Ratio (OR), Riesgo
Atribuible (RA)
A.- MEDIDAS DE TENDENCIA CENTRAL
• Resumen el comportamiento de un conjunto de datos
• Las principales medidas de tendencia central son: media
aritmética. mediana, moda.
B.- MEDIDAS DE POSICIÓN
• Permiten conocer otros puntos característicos de la
distribución que no son los valores centrales
• Cuartiles, deciles y percentiles
C.- MEDIDAS DE DISPERSIÓN
• Estudia lo concentrada o dispersa que está la
distribución de los datos con respecto a la media
aritmética.
• Rango o recorrido, desviación media, varianza y
desviación típica o estándar, y coeficiente de variación.
MEDIDAS DE TENDENCIA CENTRAL . MEDIA ARITMÉTICA
CARACTERÍSTICAS:
• Es sensible a la variación de las puntuaciones
• Si hay intervalos de clase abiertos no se puede calcular
• No es recomendable cuando hay valores muy extremos
-DATOS SIN AGRUPAR:
X = x1 + x2 + x3 + ....... + xn = Σxi
N N
Es la suma de todos los valores de una variable dividida
por el número total de ellos.
_
-DATOS AGRUPADOS:
X = Σxi . fi
N
_
Ejercicio 1
a) Encuentra el promedio de los siguientes datos:7, 4, 5, 5, 8, 3, 2, 7, 4
X =
b) Escribe con palabras lo que hiciste para encontrar el resultado.
8
Resultado correcto
51. Se suman todos los datos
2. Se divide el total entre el número de datos
9
Propiedades
• La media aritmética es la medida tendencia central que posee menor varianza.
• Engloba en ella toda la información de la muestra; esto, con ser una ventaja, supone una cierta desventaja pues los valores muy extremos, en muestras pequeñas la afectan.
10
CÁLCULO DE LA MEDIA. EJEMPLOS
1.- DATOS NO AGRUPADOS: Calcular la T.A. sistólica
media de 5 pacientes en los que se han obtenido las
siguientes cifras. 110, 118, 125, 136, 145
X = 110 + 118 + 125 + 136 + 145 = 634 = 126,8
5 5
_
2.- DATOS AGRUPADOS:
xi fi xi . fi
1 3 3
2 4 8
3 6 18
4 5 20
5 2 10
___ ___
20 59
X = Σxi . fi = 59 = 2,95
N 20
_
• En un brote de hepatitis A, 6 personas iniciaron síntomas 24 a 31
días después de la exposición. Calcule el promedio del período de
incubación en éste brote; los períodos de incubación para las i
personas afectadas (X ) fueron: 29,31,24,29,30 y 25
1.- Para calcular el numerador sume las observaciones individuales
x = 29+31+24+29+30+25= 168
2.- Para calcular el denominador cuente el número de las
observaciones : n=6
3.- Para calcular la media divida el numerador sumatoría de las
observaciones) entre el denominador (numero de las
observaciones). media x = 29 31 24 29 30 25 = 168 = 28 días
6 6
• Entonces: el promedio del período de incubación del brote es 28
días.
• En una lista de 5 variables para 11 personas. Vamos a demostrar
como se calcula la media de cada variable (A-E) en el listado.
Persona # Variable A Variable B Variable C Variable D Variable E
1 0 0 0 0 0
2 0 4 1 1 6
3 1 4 2 1 7
4 1 4 3 2 7
5 1 5 4 2 7
6 5 5 5 2 8
7 9 5 6 3 8
8 9 6 7 3 8
9 9 6 8 3 9
10 10 6 9 4 9
11 10 10 10 10 10
1. Para calcular el numerador, sume todas las observaciones individuales: A. ∑ i x = 0+0+1+1+1+5+9+9+9+10+10 = 55 B. ∑ i x = 0+4+4+4+5+5+5+6+6+6+10 = 55 C. ∑ i x = 0+1+2+3+4+5+6+7+8+9+10 = 55 D. ∑ i x = 0+1+1+2+2+2+3+3+3+4+10 = 31 E . ∑ i x = 0+6+7+7+7+8+8+8+9+9+10 = 79
2.- Para calcular el denominador cuente el número de observaciones (n=11) para cada variable.
3.- Para calcular la media, divida el numerador (suma de las observaciones) entre el denominador (número de las observaciones).
» Media de la variable A= 55/11= 5 » Media de la variable B= 55/11= 5 » Media de la variable C= 55/11= 5 » Media de la variable D= 31/11= 2.82 » Media de la variable E= 79/11= 7.18
MEDIDAS DE TENDENCIA CENTRAL : MEDIANA
- DATOS SIN AGRUPAR:
a) Nº de datos impares: Valor central
7,4,2,5,9 2,4,5,7,9 X = 5
b) Nº de datos pares: Media de los dos valores centrales:
7,4,2,5,9,6 2,4,5,6,7,9 X = 5 +6 = 5,5
2
L a mediana de una serie de N datos ordenados en orden
creciente o decreciente es la puntuación que ocupa el valor
central de la distribución.
Rango mediano = (n+1)2
Ejercicio 2
a) Los siguientes datos representan los pesos de 12 niños. Encuentra cuál es el peso mediano de estos niños :
12, 11, 15, 8, 15, 21, 18, 25, 16, 21, 22, 27
b) Escribe con palabras lo que hiciste para calcular el resultado.
16
Resultado correcto
171. Se ordenan los datos
2. Se busca cuál es el dato central
3. Como el número de datos es par se calcula el promedio de los dos datos centrales
17
Propiedades
• Es única.
• Es más fácil de calcular que la media aritmética y apenas se afecta por observaciones extremas.
• Sin embargo tiene mayor varianza que la media y sólo toma en cuenta la información de los valores centrales de la muestra.
18
- DATOS AGRUPADOS:
L a mediana es el valor de la variable que tiene la propiedad
de que los valores menores que él son tan frecuentes como los
mayores que él.
X = L i + N/2 – fd
fc
donde: L i =L ímite inferior del intervalo crítico
N = Nº total de datos
fd = Frecuencia acumulada por debajo del intervalo crítico
fc = Frecuencia del intervalo crítico
i = Amplitud del intervalo
MEDIDAS DE TENDENCIA CENTRAL . MEDIANA
. i
Rango mediano = (n+1)2
INTERVAL OS fi Fac.
151,5 – 172,5 5 5
172,5 – 193,5 7 12
193,5 – 214,5 9 21
214,5 – 235,5 6 27
235,5 – 256,5 3 30
___
30
X = L i + N/2 – fd . i = 193,5 + 30 /2 - 12 . 21 = 200,5
fc 9
Rango mediano = (n+1)2
CARACTERÍSTICAS DE L A MEDIANA
• Es menos sensible que la media a la variación de las
puntuaciones.
• Se puede calcular aunque existan algún intervalo abierto,
siempre que no sea ese el intervalo crítico.
• Es más representativa cuando la distribución tiene
puntuaciones muy extremas.
Ejemplo: A 24,25,29,30,31 Media 28.0 mediana 29
B 24,25,29,30,131 Media 44.7 mediana 29
E jemplo
A 0 0 1 1 1 5 9 9 9 10 10
B 0 4 4 4 5 5 5 6 6 6 10
C 0 1 2 3 4 5 6 7 8 9 10
D 0 1 1 2 2 2 3 3 3 4 10
E 0 6 7 7 7 8 8 8 9 9 10
1.- Organice las observaciones en orden creciente (ya está hecho)
2.- Encuentre el rango medio de las observaciones
(11 observaciones + 1) /2 = 12/2 = 6
3.- Identifique el valor de la mediana que es el de la 6a observación:
La mediana para las variables A, B y C es 5;
L a mediana para la variable D es 2;
L a mediana para la variable E es 8;
MEDIDAS DE TENDENCIA CENTRAL. MODA
Es el valor de la variable a la que corresponde la máxima frecuencia.
Si los datos están agrupados en intervalos, la moda es la marca de
clase del intervalo con mayor frecuencia.
CARACTERÍSTICAS:
• Es muy sencilla de obtener.
• Se puede calcular aunque existan intervalos abiertos, siempre que no
esté incluida en él.
• Es poco representativa.•Es el estadístico de mayor varianza
La moda (continuación)
• La moda puede no existir y cuando existe no es necesariamente única. – Ejemplo, en los valores: 10, 21, 33, 53 y 54 no hay
moda porque todos los valores son diferentes
• No tiene sentido en muestras pequeñas en las que la aparición de coincidencias en los valores es con gran frecuencia más producto del azar que de otra cosa.
24
Ejercicio 3
• Un laboratorio tiene 10 empleados, cuyas edades son:
20, 21, 20, 20, 34, 22, 24, 27, 27, 27
a) ¿Cuál es la edad modal de estos individuos?
b) Explica con tus propias palabras lo que hiciste para calcularla
25
Resultado
Hay 2 modas : 27 (se repite 3 veces) y 20 (que se repite también 3 veces).
1. Se observa en los datos cuál o cuáles se repiten más.
2. Si ninguno se repite no hay moda y si son varios los que se repiten hay varias modas.
26
Ejercicio 4
• Los siguientes datos representan edades de personas con cardiopatía en una muestra :
6, 16, 18, 19, 22, 23, 23, 23, 24, 26, 26
– ¿Cuál es la edad promedio de estas personas?___________________
– ¿Cuál es la mediana?_________________
– ¿Cuál es la moda?________________
27
Ejercicio 5
• Un grupo de pacientes acudió a su valoración preoperatoria, sus resultados de hemoglobina fueron los siguientes:
17.2, 14.1, 16.4, 14.9, 16.9, 14.2, 20, 16.7, 14.9, 15.7, 15.1, 14.9, 15, 13, 15.
– La media del valor de hemoglobina en estos pacientes fue de______________
– La mediana fue de_______________
– Y ¿Cuál es la moda?__________________
28
Ejercicios 4 y 5
• Los siguientes datos representan edades de personas con cardiopatía en una muestra :
6, 16, 18, 19, 22, 23, 23, 23, 24, 26, 26
– ¿Cuál es la edad promedio de estas personas?_____20.55____
– ¿Cuál es la mediana?___23______________
– ¿Cuál es la moda?_____23___________
• Un grupo de pacientes acudió a su valoración preoperatoria, sus resultados de hemoglobina fueron los siguientes:
17.2, 14.1, 16.4, 14.9, 16.9, 14.2, 20, 16.7, 14.9, 15.7, 15.1, 14.9, 15, 13, 15.
– La media del valor de hemoglobina en estos pacientes fue de___15.6____
– La mediana fue de___15____________
– Y ¿Cuál es la moda?_14.9__________
29
30
MEDIDAS DE TENDENCIA CENTRAL
-Media Aritmética (Promedio)
-Mediana
-Moda
n
x
x
n
ii
1
Media Aritmética o Promedio
Mediana
)(EM kx
2M
)1()(
E
kk xx
x
1x
2x
nx
Datos Cuantitativos
x
)1(x
)2(x
)(nx
Datos Cuantitativos ordenados de menor a mayor
Si n es par
Si n es impar
centro del dato)(kx
repite" se más que dato el"Mo
ModaDatos
Cualitativos y Cuantitativos
Estadística
ÍNDICES DE POSICIÓN
• PERCENTIL ES (P): Es el valor de la variable por debajo del cual
se encuentra un porcentaje determinado de observaciones.
• CUARTIL ES (Q): Son los valores de la variable que dejan por
debajo el
25% de los datos ............... Primer cuartil Q1 (25%)
50% de los datos................ Segundo cuartil Q2 (50%)
75% de los datos................ Tercer cuartil Q3 (75%)
32
Percentiles, Deciles o Cuartiles
-Percentil (ejemplo: 25, 50, 75)
-Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n datos
están ordenados de Menor a Mayor
Estadística
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
E l Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.
MEDIDAS DE DISPERSIÓN• VARIANZA: Es la media de los cuadrados de las
diferencias entre cada valor de la variable y la media
aritmética.
_
S² = Σ (xi - X )² o bien S² = 1 Σxi ² - (Σxi )²
N N N
También: S² =Σxi ² - X ²
N
_
Para datos agrupados:
S² = Σfi (xi - X )² o bien S² = 1 Σfi . xi ² - (Σfi . xi )²
N N N
También: S² = Σfixi ² - X ²
N
_
_
• DESVIACIÓN TÍPICA: Es la raíz cuadrada de la varianza
MEDIDAS DE DISPERSIÓN
• COEFICIENTE DE VARIACIÓN DE PEARSON:
Es la «desviación típica medida en unidades de media» y se
mide en %; o lo que es lo mismo, indica el tanto por ciento de
la media que representa la desviación típica. Así:
CV = S / X . 100_
• RANGO, RECORRIDO O AMPL ITUD:
Es la diferencia entre los valores más grande y más pequeño de
la distribución.
• RANGO INTERCUARTÍL ICO:
Es la diferencia entre el tercer cuartil y el primero (Q3 – Q1).
35
MEDIDAS DE DISPERSIÓN
-Rango
-Varianza
-Desviación Estándar
Rango
Varianza
x
1x
2x
nx
Datos Cuantitativos
Coeficiente de VariaciónComparación entre VariablesSe refiere al comportamiento de las variables cuantitativas en un
grupo. Por ejemplo: Si se tiene un conjunto de personas a las que se
les mide Estatura, Peso, Edad: Entre estas variables ¿cuál presenta
mayor variación?
)min()max( ii xxR
Desviación Típica o Estándar
2
1
21 1
22
1
2
2 1)(
1)(
xxnn
xn
x
n
xx
sn
i
i
n
i
n
i
ii
n
i
i
2ss
x
scv
Estadística
E jemplo:
En éste ejemplo se demuestra cómo se encuentran los valores
mínimo y máximo y el rango de los siguientes datos:
29,31,24,29,30,25.
1.- Organice los datos de menor a mayor: 24,25,29,29,29,30,31;
2.- Identifique los valores mínimo y máximo: mínimo=24 y
máximo=31
3.- Calcule el rango: rango = máximo - mínimo =31-24=7; entonces el
rango es igual a 7.
RANGO INTERCUARTÍL ICO:
1. Organice las observaciones en orden ascendente.
Dados estos datos: 13, 7, 9, 15, 11, 5, 8, 4,
hay que organizarlos así: 4, 5, 7, 8, 9, 11, 13, 15.
2. Encuentre la posición del primer y el tercer cuartil. Dado que hay
8 observaciones, n = 8.
posición del primer cuartil (Q1) = (n + 1) / 4
= (8 + 1) / 4 = 2.25
posición del tercer cuartil (Q3) = 3(n + 1) / 4 = 3 x Q1
3(8 + 1) / 4 = 6.75
Así, se encuentra Q1 (1/4) de las observaciones entre 2 y 3 y Q3 (3/4) entre las observaciones entre 6 y 7.
3. Identifique el valor del primer y el tercer cuartil.
Valor de Q1: L a posición de Q1 es 2 1/4; así, el valor de Q1 es el
valor de la observación 2 más 1/4 de la diferencia entre los valores de
las observaciones 2 y 3.
Valor de la observación 3 (ver paso 1) : 7
Valor de la observación 2: 5
Q1 = 5 + 1/4( 7-5 ) = 5 + 1/4(2) = 5 + 0,5 = 5.5
Valor de Q3: L a posición de Q1 es 6 3/4; así, el valor de Q3 es el
valor de la observación 6 más 3/4 de la diferencia entre los
valores de las observaciones 6 y 7.
Valor de la observación 7 (ver paso 1) : 13
Valor de la observación 6: 11
Q3 = 11 + 3/4( 13-11 ) = 11 + 3/4 (2) = 11 + 1.5 = 12.5
4. Calcule el rango intercuartílico como Q3 menos Q1.
Q3 = 12,5 (ver paso 3) Q1 = 5,5
Rango intercuartílico = 12,5 - 5,5 = 7
• En general, se usan los cuartiles y el rango intercuartílico para
describir la variabilidad cuando se está usando la mediana como la
medida de tendencia central.
• Cuando se está usando la media aritmética, hay que usar la
desviación típica.
VARIANZA y DESVIACIÓN TIPICA
• Si se resta la media aritmética de cada observación, la suma de
las diferencias es cero.
• Este concepto de restar la media de cada observación es la base
para dos medidas de dispersión: la varianza y la desviación típica
o estándar.
• Para estas medidas, hay que elevar al cuadrado las diferencias
para eliminar los números negativos.
VARIANZA y DESVIACIÓN TIPICA
• Después, se suma el cuadrado de las diferencias y se divide por
n-1 para encontrar la "media" de las diferencias al cuadrado.
• Esta "media" es la VARIANZA
• Para convertir la varianza a las unidades originales, hay que
obtener la raíz cuadrada. Se denomina DESVIACIÓN TIPICA
Ó ESTANDAR .
Valor menos la media Diferencia Diferencias al cuadrado
24-28 -4 16
25-28 -3 9
29-28 +1.0 1
29-28 +1.0 1
30-28 +2.0 4
31-28 +3.0 9
168-168.0=0 -7+7=0 40
Varianza = ∑ diferencias cuadráticas = 40 = 8
n - 1 5
Desvío estándar= √8 = 2.83
• L a varianza y la desviación estándar son medidas de la desviación o
dispersión de las observaciones alrededor de la media de la distribución.
• L a varianza es la media de las diferencias cuadradas de las
observaciones alrededor de la media. Se representa como "S2 " en las
fórmulas.
• L a desviación estándar es la raíz cuadrada de la varianza; se representa
con "s"
CUARTILES PERCENTILES RANGO VARIANZA
DESV.
STANDART
Q1= n + 1 x 1
4
P(p)= n + 1 (p)
100 R = VM - Vm
S² = Σ(xi - X)²
n -1 DS = √ S²
Q2= n + 1 x 2
4
P(25)=n + 1 (25)
100 R / 6 = DS
δ² = Σ(xi - μ)²
N
Q3= n + 1 x 3
4 δ² = R / 4
COEFICIENTE DE
VARIACIÓN AMPLITUD MEDIA MEDIANA
CV = S x 100
X
A = R / K X = Σ Xi / n Me = n + 1
2
A = VM – Vm
K
Me = n
2
TASA, RAZONES Y PROPORCIONESINCIDENCIA - PREVALENCIA
MEDIDAS DE FRECUENCIA
La construcción de estas medidas se realiza por medio de operaciones
aritméticas simples y de los instrumentos matemáticos conocidos como
razones, proporciones y tasas.
CÁLCULO DE PROPORCIONES, TASAS Y RAZONES
ProporcionesSon medidas que expresan la frecuencia con la que ocurre un evento en
relación con la población total en la cual éste puede ocurrir.
Se calcula dividiendo el número de eventos ocurridos entre la población
en la que ocurrieron.
AA + B
P=
El resultado no puede ser mayor que la unidad y oscila siempre entre
cero y uno.
A menudo las proporciones se expresan en forma de porcentaje, y en
tal caso los resultados oscilan entre cero y 100.
Las proporciones expresan únicamente la relación que existe entre el
número de veces en las que se presenta un evento y el número total de
ocasiones en las que se pudo presentar.
El denominador no incluye el tiempo.
Proporciones
• Proporción de hombres / Población total
• Proporción de Viviendas positivas para Aedes / Total de viviendas
inspeccionadas
• Proporción de casos P. Vivax Dengue / Total de casos de Malaria
• Proporción de casos vacunados contra ASA / Población programada
• Proporción de hombres: N° hombres/Pob.General
• Proporción de Cá de mama: N° mujeres con Cá de mama/Pob. de
MEF
• Proporción de TB MDR : N° de enfermos con TB MDR/Total de
enfermos con TBC
Razones
Las razones pueden definirse como magnitudes que expresan la
relación aritmética existente entre dos eventos en una misma
población, o un solo evento en dos poblaciones.
Razón hombre/mujer =BA
RAZONES
• Forma más común de expresar la frecuencia de un evento.
• A /B
• La naturaleza de cada una de estas dos cifras cambia según la medida de
frecuencia ó de asociación específica, como ocurre en las proporciones,
los porcentajes, las tasas etc..
• En algunos casos el numerador esta incluido dentro del denominador
(Ej: proporciones, porcentajes) en otras razones no.
• Muchas veces no tiene dimensiones Ej las proporciones
• En otras corresponden a la adición algebraica de las dimensiones del
numerador y del denominador
• Índice de peso talla= Kg/cm
• Índice de masculinidad= N° hombres/N° mujeres
• Índice de Femineidad = N° mujeres/N° hombres
• Tasa de desocupación= Pob. desocupada/PEA
Tasas
Expresan la dinámica de un suceso en una población a lo largo del
tiempo.
Se pueden definir como la magnitud del cambio de una variable
(enfermedad o muerte) por unidad de cambio de otra (usualmente el
tiempo) en relación con el tamaño de la población que se encuentra en
riesgo de experimentar el suceso.
El denominador de una tasa no expresa el número de sujetos en
observación sino el tiempo durante el cual tales sujetos estuvieron enriesgo de sufrir el evento.
La unidad de medida empleada se conoce como tiempo-persona deseguimiento
Las unidades de tiempo pueden ser horas, días, meses o años,
dependiendo de la naturaleza del evento que se estudia.
Número de eventos ocurridos en una población en un periodo t
Sumatoria de los períodos durante los cuales los sujetos de lapoblación libres del evento estuvieron expuestos al riesgo depresentarlo en el mismo período.
X F
Tasas
Algunas tasas
• Tasa bruta de mortalidad = N° de defunciones / Población total
• Tasa Bruta de natalidad = N° de RN vivos / Población total
• Tasa Global de fecundidad= N° total de nacimientos/ Pob MEF