medidas de tendencia_2013

52
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO Dra. BLANCA FALLA ALDANA

Upload: leslie-eliana-gasco-arteaga

Post on 13-Jun-2015

383 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Medidas de tendencia_2013

UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO

Dra. BLANCA FALLA ALDANA Dra. BLANCA FALLA ALDANA

Page 2: Medidas de tendencia_2013

Ciencia, su sustento es teoría de las probabilidades

Para procesar información y tomar decisiones

Herramienta para investigación

Conjunto de métodos y procedimientos para captar, elaborar e interpretar datos sujetos a variaciones.

Predice fenómenos aleatorios que pueden expresarse cuantitativamente.

Utiliza para ser inferencias validas para una población mas amplia de características similares.

La finalidad del análisis es establecer las conclusiones a una población donde la muestra sea representativa.

ESTADISTICA

Page 3: Medidas de tendencia_2013

SCHWARTS (1981)

Métodos de razonamiento, interpreta datos de la ciencias de la vida.

Su carácter es la variabilidad.

LAST (1988)

Resumen y analiza datos sujetos a variaciones aleatorias.

ESTADÍSTICA

Page 4: Medidas de tendencia_2013

Comprende la organización, presentación de datos de manera científica.

Incluye diversos métodos de organizar y representar gráficamente los datos.

Revisa y clasifica datos.

Calcula medidas de tendencia central y de dispersión.

Representa gráficamente los datos

Comprende la organización, presentación y síntesis de datos de manera científica

ESTADÍSTICA DESCRIPTIVA

Page 5: Medidas de tendencia_2013

• Describe lo que esta pasando y realiza inferencias.

• Toma decisiones probabilísticas.

• Toda generalización tiene un margen de error.

• Comprende las bases lógicas mediante las cuales se establecen conclusiones.

ESTADÍSTICA INFERENCIAL

Page 6: Medidas de tendencia_2013

Proporciona métodos para estimar las características de un grupo (población) basándose en los datos de un conjunto pequeño (muestra).

PoblaciónMuestra

ESTADÍSTICA INFERENCIAL

Población

Page 7: Medidas de tendencia_2013

El resultado de un análisis estadístico no es un objetivo en sí mismo, sino una herramienta para:

Comprobar o rechazar una hipótesis de trabajo, Representar de una forma eficiente y resumida un colectivo de observaciones, para validar un modelo de un proceso fisiológico.

ESTADÍSTICA EN MEDICINA

Page 8: Medidas de tendencia_2013

En el grupo de datos cuantitativos tenemos:

Aquellos cuyo resultado puede variar de forma continua, como puede ser el peso, la presión arterial, el nivel de colesterol, etc.

Los que sólo pueden tomar valores enteros como por ejemplo el número de hijos, el número de ingresados en el Servicio de Ortopedia, un día concreto, etc.

DATOS CUANTITATIVOS

Page 9: Medidas de tendencia_2013

Pueden ser:

Nominales, que constituyen una simple etiqueta como puede ser el sexo, el grupo sanguíneo, etc.

Ordinales, en las que se da una relación de orden entre las respuestas, por ej. resultado de una patología/tratamiento (fallece, empeora, sin cambios, mejora, curación).

DATOS CUALITATIVOS

Page 10: Medidas de tendencia_2013

Indicar un valor central y uno de variabilidad o dispersión.

Cuando es razonable suponer que los datos pueden seguir una distribución normal, se estimará la media y la desviación estándar.

Ejemplo: La media de la PAS fue de 139.2 ± 14.9 mmHg.

PRESENTACIÓN DE DATOS CUALITATIVOS

Page 11: Medidas de tendencia_2013

Son valores promedios que representan a toda la muestra de valores

Indican el punto medio de la distribución.

Nos indican en torno a que valor (centro) se distribuyen los datos.

En una distribución de frecuencias las medidas de tendencia central son: Media, mediana y moda.

MEDIDAS DE TENDENCIA CENTRAL

Page 12: Medidas de tendencia_2013

Es un valor representativo o promedio.

x se calcula a partir de la distribución de frecuencias.

Suma l os valores de todas las observaciones y se divide por el numero total.

Ventaja. Su fácil manejo matemático y estadístico.

Se usa en datos intervalicos y proporcionales.

Limitación sensibilidad a los valores extremos

X1, x2, x3, ………xn

x = x1, x2, x3, … xn

n

x = Ʃ xi

n

MEDIA

Page 13: Medidas de tendencia_2013

PROPIEDADES DE LA MEDIA ARITMÉTICA

Propiedades de la media aritmética La suma de las desviaciones de todas las puntuaciones de una

distribución respecto a la media de la misma igual a cero.

Las suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:

8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 = = 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0

Page 14: Medidas de tendencia_2013

1.- DATOS NO AGRUPADOS: Los pesos de 6 amigos son 84,91,72,68,87 y 78 kilos. Hallar el peso medio.

X = 84 +91 +72 +68 +87 + 78 = 480 = 80

6 6

_

CALCULO DE LA MEDIA : EJEMPLOS

Page 15: Medidas de tendencia_2013

2.- DATOS AGRUPADOS: Si lo s datos vienen agrupados en una tabla de frecuencia

X = Σxi . fi N _xi

fi xi · fi

[10, 20) 15 1 15

[20, 30) 25 8 200

[30,40) 35 10 350

[40, 50) 45 9 405

[50, 60 55 8 440

[60,70) 65 4 260

[70, 80) 75 2 150

42 1 820

Page 16: Medidas de tendencia_2013

En un brote de hepatitis A, 6 personas iniciaron síntomas 24 a 31 días después de la exposición. Calcule el promedio del período de incubación en éste brote; los períodos de incubación para las i personas afectadas (X) fueron: 29,31,24,29,30 y 25.

1.- Para calcular el numerador sume las observaciones individuales

x = 29+31+24+29+30+25= 168

2.- Para calcular el denominador cuente el número de las observaciones : n=6

3.- Para calcular la media divida el numerador sumatoria de las observaciones) entre el denominador (numero de las observaciones).

media x = 29 31 24 29 30 25 = 168 = 28 días

6 6

Entonces: el promedio del período de incubación del brote es 28 días.

Page 17: Medidas de tendencia_2013

En una lista de 5 variables para 11 personas. Vamos a demostrar como se

calcula la media de cada variable (A-E) en el listado.

Persona # Variable A Variable B Variable C Variable D Variable E 1 0 0 0 0 0 2 0 4 1 1 6 3 1 4 2 1 7 4 1 4 3 2 7 5 1 5 4 2 7 6 5 5 5 2 8 7 9 5 6 3 8 8 9 6 7 3 8 9 9 6 8 3 9 10 10 6 9 4 9 11 10 10 10 10 10

Page 18: Medidas de tendencia_2013

1. Para calcular el numerador, sume todas las observaciones individuales:

A. ∑i x = 0+0+1+1+1+5+9+9+9+10+10 = 55

B. ∑i x = 0+4+4+4+5+5+5+6+6+6+10 = 55

C. ∑i x = 0+1+2+3+4+5+6+7+8+9+10 = 55

D. ∑i x = 0+1+1+2+2+2+3+3+3+4+10 = 31

E. ∑i x = 0+6+7+7+7+8+8+8+9+9+10 = 79

2.- Para calcular el denominador cuente el número de observaciones (n=11) para cada variable.

3.- Para calcular la media, divida el numerador (suma de las observaciones) entre el denominador (número de las observaciones).

» Media de la variable A= 55/11= 5

» Media de la variable B= 55/11= 5

» Media de la variable C= 55/11= 5

» Media de la variable D= 31/11= 2.82

» Media de la variable E= 79/11= 7.18

Page 19: Medidas de tendencia_2013

Se define a la observación equidistante de los extremos.

Es un valor que va a dividir una representación ordenada en dos partes iguales.

La mitad de las observaciones tienen valor inferior o igual a la mediana y la otra mitad igual o mayor a la mediana.

Los cálculos se ordenan según su valor en la escala de medición.

Si N es impar la mediana será el valor correspondiente a la observación situada en el centro

1,2, 3,4, 5,7, 9

Si N es par la mediana será la media de las variaciones centrales

3, 7, 5, 4, 2, 8, 11, 1 Ventaja : Se usa en variables ordinales

1, 2, 3, 4, 5, 7, 8, 11 Desventaja: Limitaciones de su manejo matemático.

Me= 4+5 = 4.5

2

MEDIANA

Page 20: Medidas de tendencia_2013

DATOS AGRUPADOS: La mediana es el valor de la variable que tiene la propiedad de que los valores

menores que él son tan frecuentes como los mayores que él.

X = Li + N/2 – fd fc

donde: Li = Límite inferior del intervalo crítico N = Nº total de datos fd = Frecuencia acumulada por debajo del intervalo crítico fc = Frecuencia del intervalo crítico i = Amplitud del intervalo

MEDIDAS DE TENDENCIA CENTRAL. MEDIANA

i Rango mediano = (n+1) 2

Page 21: Medidas de tendencia_2013

INTERVALOS fi Fac.

151,5 – 172,5 5 5

172,5 – 193,5 7 12

193,5 – 214,5 9 21

214,5 – 235,5 6 27

235,5 – 256,5 3 30

30

X = Li + N/2 – fd . i = 193,5 + 30 /2 - 12 . 21 = 200,5

fc 9

Rango mediano = (n+1) 2

Page 22: Medidas de tendencia_2013

Es menos sensible que la media a la variación de las puntuaciones.

Se puede calcular aunque existan algún intervalo abierto, siempre que no

sea ese el intervalo crítico

Es más representativa cuando la distribución tiene puntuaciones muy

extremas.

Ejemplo: A 24,25,29,30,31 Media 28.0 mediana 29 B 24,25,29,30,131 Media 44.7 mediana 29

CARACTERÍSTICAS DE LA MEDIANA

Page 23: Medidas de tendencia_2013

MODA

Es el valor de mayor frecuencia en el conjunto de observaciones. Se representa por MO

Ventaja: se usa para datos nominales.

Limitación: Puede no existir ninguna moda o existir mas de uno.

- Hallar la moda de la distribución:

2, 3, 3,4,4,4,5,5,

MO = 4

Page 24: Medidas de tendencia_2013

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.2, 2, 3, 3, 6, 6, 9, 9.

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.0, 1, 3, 3, 5, 5, 7, 8 Mo = 4

Page 25: Medidas de tendencia_2013

CURVA NORMAL ESTADÍSTICA

Curva de Gauss o en campana.

Se caracteriza porque dado el promedio y la Ds es posible reconstruirlo y precisar el área que existe bajo cualquier segmento.

Se extiende entre – 0 a +0 su comportamiento bajo la curva es igual a la unidad.

En ella coincide la media, mediana y moda.

Es la distribución teórica de probabilidad mas importante y se usa en la mayoría de variables continuas biológicas.

Entre el valor central y una Ds se encuentra el 68.3 del área

Dos Ds equivale al 95%; 2.5 Ds equivale al 98.8 y 3 Ds equivale al 99.7%

Page 26: Medidas de tendencia_2013

IMPORTANCIA

Describe fenómenos biológicos ya que tiene una distribución de este tipo para un valor promedio que establece la tendencia central del fenómeno en medición.

Estima probabilidad de ocurrencia de diversos eventos.

La mayoría de los Test estadísticos dan por supuesto que provienen de una distribución normal.

Page 27: Medidas de tendencia_2013

PROPIEDADESPROPIEDADESPROPIEDADESPROPIEDADES

Es simétrica, una de las partes es fiel reflejo de la otra.

La validez de la media aritmética son iguales en una distribución

normal.

El intervalo de valores o recorrido son las medidas de variabilidad.

Es la distancia entre los valores máximos y mininos.

La media, mediana y moda tienen el mismo valor.

Las colas de la curva están cada vez mas próximos al eje x.

Es unimodal .

Page 28: Medidas de tendencia_2013

INTERPRETACIONINTERPRETACION

Se aplica al raciocinio de las pruebas de significación estadística

La determinación de la significación estadística es un fenómeno probabilístico: Mide la probabilidad de que un evento sea debido al azar.

El resultado de la significación esta estrechamente ligado al numero de observaciones realizadas.

Una diferencias estadísticamente significativa solo indica que existe una baja probabilidad de que el azar explique la diferencia.

El limite de significación para que el hallazgo se considere significativo tiene que ser igual o menor a 0.05 %.

La dos probalidades de error:

- Error tipo 1 o @ existe diferencia significativa cuando de hecho no existe diferencia real.

- Error tipo 2 o ɞ no existe la diferencia cuando en verdad existe

Page 29: Medidas de tendencia_2013
Page 30: Medidas de tendencia_2013

Distribución normal: curva simétrica

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Page 31: Medidas de tendencia_2013

ASIMETRÍA A LA IZQUIERDA

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11 12 13

Page 32: Medidas de tendencia_2013

ASIMETRÍA A LA DERECHA

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11 12 13

Page 33: Medidas de tendencia_2013
Page 34: Medidas de tendencia_2013

Permiten conocer otros puntos característicos de la distribución que no son los valores centrales.

Cuartiles, deciles y percentiles.

MEDIDAS DE ORDENMEDIDAS DE ORDENMEDIDAS DE ORDENMEDIDAS DE ORDEN

Page 35: Medidas de tendencia_2013

PERCENTILES

Los percentiles dividen en dos partes las observaciones. Por ejemplo, el percentil 20, P20, es el valor que deja por debajo un 20% y por encima un 80% de las observaciones.

PERCENTILES (P): Es el valor de la variable por debajo del cual se encuentra un porcentaje determinado de observaciones.

Page 36: Medidas de tendencia_2013

PERCENTILES

Mínimo MáximoPercentil 20

P20

20% 80%

Page 37: Medidas de tendencia_2013

CUARTILES (Q): Son los valores de la variable que dejan por debajo el:

25% de los datos ............... Primer cuartil Q1 (25%)

50% de los datos................ Segundo cuartil Q2 (50%)

75% de los datos................ Tercer cuartil Q3 (75%)

ÍNDICES DE POSICIÓNÍNDICES DE POSICIÓNÍNDICES DE POSICIÓNÍNDICES DE POSICIÓN

Page 38: Medidas de tendencia_2013

CUARTILES

MínimoMáximoCuartil 1

Q1

Cuartil 3

Q3

MedianaCuartil 2

Q2

25% 25% 25%25%

25% 75%

25%75%

Page 39: Medidas de tendencia_2013
Page 40: Medidas de tendencia_2013

Estudia lo concentrada o dispersa que está la distribución de los datos con respecto a la media aritmética.

Rango o recorrido, desviación media, varianza y desviación típica o estándar, y coeficiente de variación.

MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN

Page 41: Medidas de tendencia_2013

_

RANGO, RECORRIDO O AMPLITUD:

Es la diferencia entre los valores más grande y más pequeño de la distribución.Ejemplo:

En éste ejemplo se demuestra cómo se encuentran los valores

mínimo y máximo y el rango de los siguientes datos:

29,31,24,29,30,25.

1.- Organice los datos de menor a mayor: 24,25,29,29,30,31.

2.- Identifique los valores mínimo y máximo: mínimo=24 y máximo=31

3.- Calcule el rango: rango = máximo - mínimo =31-24=7; entonces el rango

es igual a 7.

MEDIDAS DE DISPERSIÓN

Page 42: Medidas de tendencia_2013

Es la diferencia entre el tercer cuartil y el primero (Q3 – Q1).

1. Organice las observaciones en orden ascendente.

Dados estos datos: 13, 7, 9, 15, 11, 5, 8, 4,

hay que organizarlos así: 4, 5, 7, 8, 9, 11, 13, 15.

2. Encuentre la posición del primer y el tercer cuartil. Dado que hay 8 observaciones, n = 8.

posición del primer cuartil (Q1) = (n + 1) / 4

= (8 + 1) / 4 = 2.25

posición del tercer cuartil (Q3) = 3(n + 1) / 4 = 3 x Q1

3(8 + 1) / 4 = 6.75 Así, se encuentra Q1 (1/4) de las observaciones entre 2 y 3 y Q3 es (3/4) entre las observaciones entre 6 y 7.

RANGO INTERCUARTILICO

Page 43: Medidas de tendencia_2013

3. Identifique el valor del primer y el tercer cuartil.

Valor de Q1: La posición de Q1 es 2 1/4; así, el valor de Q1 es el

valor de la observación 2 más 1/4 de la diferencia entre los valores

de las observaciones 2 y 3.

Valor de la observación 3 (ver paso 1) : 7

Valor de la observación 2: 5

Q1 = 5 + 1/4( 7-5 ) = 5 + 1/4(2) = 5 + 0,5 = 5.5

Page 44: Medidas de tendencia_2013

Valor de Q3:

La posición de Q1 es 6 3/4; así, el valor de Q3 es el valor de la

observación 6 más 3/4 de la diferencia entre los valores de las

observaciones 6 y 7.

Valor de la observación 7 (ver paso 1) : 13

Valor de la observación 6: 11

Q3 = 11 + 3/4( 13-11 ) = 11 + 3/4 (2) = 11 + 1.5 = 12.5

Page 45: Medidas de tendencia_2013

4. Calcule el rango intercuartílico como Q3 menos Q1.

Q3 = 12,5 (ver paso 3) Q1 = 5,5

Rango intercuartílico = 12,5 - 5,5 = 7

En general, se usan los cuartiles y el rango intercuartílico para describir la variabilidad cuando se está usando la mediana como la medida de tendencia central.

Cuando se está usando la media aritmética, hay que usar la desviación típica.

Page 46: Medidas de tendencia_2013

VARIANZA: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética.

_S² = Σ (xi - X )² o bien S² = 1 Σxi ² - (Σxi )² N N NTambién: S² = Σxi ² - X ²

N

_

Para datos agrupados:

S² = Σfi (xi - X )² o bien S² = 1 Σfi . xi ² - (Σfi . xi )² N N N

También: S² = Σfixi ² - X ² N

_

_

Page 47: Medidas de tendencia_2013

Si se resta la media aritmética de cada observación, la suma de las diferencias es cero.

Este concepto de restar la media de cada observación es la base para dos medidas de dispersión: la varianza y la desviación típica o estándar.

Para estas medidas, hay que elevar al cuadrado las diferencias para eliminar los números negativos.

Después, se suma el cuadrado de las diferencias y se divide por n-1 para

encontrar la "media" de las diferencias al cuadrado.

Esta "media" es la VARIANZA

VARIANZA Y DESVIACIÓN TIPICA

Page 48: Medidas de tendencia_2013

Para convertir la varianza a las unidades originales, hay que

obtener la raíz cuadrada. Se denomina DESVIACIÓN TIPICA

Ó ESTANDAR .

DESVIACIÓN TÍPICA

DESVIACIÓN TÍPICA: Es la raíz cuadrada de la varianza

Page 49: Medidas de tendencia_2013

Valor menos la media Diferencia Diferencias al cuadrado

24 - 28 - 4 16

25 - 28 - 3 9

29 - 28 +1.0 1

29 - 28 +1.0 1

30 - 28 +2.0 4

31 - 28 +3.0 9

168 - 168 = 0 -7+7=0 40

Page 50: Medidas de tendencia_2013

Varianza = ∑ diferencias cuadráticas = 40 = 8 n - 1 5

Desvío estándar= √8 = 2.83

La varianza y la desviación estándar son medidas de la desviación o dispersión de las observaciones alrededor de la media de la distribución.

La varianza es la media de las diferencias cuadradas de las observaciones alrededor de la media. Se representa como "S2 " en las fórmulas.

La desviación estándar es la raíz cuadrada de la varianza; se representa con "s"

Page 51: Medidas de tendencia_2013

El CV es igual al cociente entre la desviación típica y la media.

Si encontramos que el coeficiente de variación es próximo o mayor que 0.5 y no puede haber datos negativos, la distribución no es normal.

Page 52: Medidas de tendencia_2013

Una distribución tiene X = 140 y s = 28 y otra  X = 150 y s = 24. ¿Cuál de las dos presenta mayor dispersión?

La primera distribución presenta mayor dispersión.

COEFICIENTE DE VARIACIÓN DE PEARSON:

Es la «desviación típica medida en unidades de media» y se mide en %; o lo que es lo mismo, indica el tanto por ciento de la media que representa la desviación típica. Así:

CV = S / X . 100