temas 6 y 7 de bioestadística. semestre b 2012. medidas de dispersión, variación o variabilidad

30
Medidas de dispersión, variación o variabilidad. Rango. Varianza. Desviación Típica. Coeficiente de variación. Tema 2. Estadística Descriptiva

Upload: university-of-the-andes-venezuela

Post on 20-Jul-2015

2.647 views

Category:

Education


0 download

TRANSCRIPT

Medidas de dispersión, variación o variabilidad.

• Rango.

• Varianza.

• Desviación Típica.

• Coeficiente de variación.

Tema 2

. Estadística D

escriptiva

Medidas de dispersión: Rango

Rango (amplitud o recorrido):

• Está determinado por los dos valores extremos de los datos muestrales, es simplemente la diferencia entre la mayor y menor observación.

• Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión.

Tema 2

. Estadística D

escriptiva

Medidas de dispersión: Varianza

• Si la varianza de un conjunto de observaciones es grande se dice que los datos tiene una mayor variabilidad que un conjunto de datos que tenga un varianza menor.

21

2

2

1

2

2

xn

x

s

n

xx

s

n

i

i

n

i

i

Tema 2

. Estadística D

escriptiva

Para datos NOagrupados:

Para datos agrupados en una distribución de frecuencias:

Medidas de dispersión: Varianza

21

2

2

1

2

2

xn

fm

s

n

fxm

s

k

i

ii

k

i

ii

21

2

2

1

2

2

xn

fm

s

n

fxm

s

k

i

ii

k

i

ii

Medidas de dispersión: Desviación Típica

• Es la raíz cuadrada de la varianza.

• Notación: s, .

2ss

Tema 2

. Estadística D

escriptiva

Medidas de dispersión: Coeficiente de Variación

• Es una medida de dispersión relativa que permite comparar el nivel de dispersión de dos muestras de variables estadísticas diferentes.

• No tiene dimensiones.

• Notación: CV

%100x

sCV

Tema 2

. Estadística D

escriptiva

Ventajas y Desventajas del Rango

Ventajas:

• Útil cuando se quiere conocer la extensión de las variaciones extremas (valor máximo de la dispersión).

• Fácil de calcular.

Tema 2

. Estadística D

escriptiva

Ventajas y Desventajas del Rango

Desventajas:

• No es una MD con respecto al centro de la distribución.

• Solo emplea dos valores en su cálculo.

• No se puede calcular en distribuciones de límite de clase abierto.

Tema 2

. Estadística D

escriptiva

Propiedades, Ventajas y Desventajas de la Varianza

Ventajas:

• Es útil cuando se compara la variabilidad de dos o más conjuntos de datos.

• Utiliza toda la información disponible.

Desventajas:

• No proporciona ayuda inmediata cuando se estudia la dispersión de un solo conjunto de datos.

• Difícil de interpretar por tener sus unidades elevadas al cuadrado.

Tema 2

. Estadística D

escriptiva

Propiedades, Ventajas y Desventajas de la Varianza

Propiedades:

1. Siempre es mayor o igual a cero y menor que infinito.

2. La varianza de una constante es cero.

3. Si a una variable X la sometemos a Y=a+bX, la varianza de Y será Var(Y) = b2Var(X)

Tema 2

. Estadística D

escriptiva

Ventajas y Desventajas de la Desviación Típica

Ventajas:

• Esta expresada en las mismas unidades que la variable en estudio.

• Utiliza todas las observaciones en su cálculo.

• Fácil de interpretar.

Desventajas:

• No tiene.

Tema 2

. Estadística D

escriptiva

Ventajas y Desventajas del Coeficiente de Variación

Desventaja:

• No es una MD con respecto al centro de la distribución de los datos. Tem

a 2. Estad

ística Descrip

tiva

Ejercicio: Tomando como referencia la siguiente tabla, calcule la desviación típica de los datos.

Fórmula:

Tabla 3. Distribución de la Concentración de Testosterona en el plasma de 33 varones estudiados

____________________________________________

2

Clases f i mi Fi mi*fi (mi-X)*fi

____________________________________________

2,05 - 4,25 4 3,15 4 12,60 137,35

4,25 - 6,45 2 5,35 6 10,70 26,79

6,45 - 8,65 11 7,55 17 83,05 23,45

8,65 - 10,85 5 9,75 22 48,75 2,74

10,85 - 13,05 6 11,95 28 71,70 51,86

13,05 - 15,25 5 14,15 33 70,75 132,10

____________________________________________

Total 33 297,55 374,30

2ss

Ahora se aplican los pasos que restan para obtener la desviación estándar:

1.- Se calcula la media muestral (X):

X = 9,01

2.- Se obtiene la varianza con la fórmula:

2 2

S = ∑(mi – X) * fi = (374,3 / 32) = 11,70, donde

n – 1

S = 3,42

Se dice entonces que el cambio estacional de la concentración de testosterona del plasma durante el ciclo reproductivo de la muestra estudiada es 9,01 miligramos por mililitro con una desviación estándar de más o menos 3,42 nanogramos por mililitro

- Coeficiente de variación (CV): Es una razón de la desviación estándar a la media. Fórmula:

CV = (S/X)*100

Según la fórmula anterior, los pasos para obtener el coeficiente de variación son:

1.- Obtener la desviación estándar

2.- Aplicar la fórmula dada.

Ejemplo: Con los datos de la siguiente Tabla, obtenga el coeficiente de variación (CV)

Tabla 2. Distribución de la Concentración de Testosterona (ng/ml) en elplasma de 33 sujetos estudiados

_______________________________

Clases fi

_______________________________

2,05 - 4,25 4

4,25 - 6,45 2

6,45 - 8,65 11

8,65 - 10,85 5

10,85 - 13,05 6

13,05 - 15,25 5

_______________________________

Total 33

Solución: Como en el ejemplo anterior ya se realizaron todos los cálculos, lo que queda es sustituir los valores:

CV = (3,42/9,01) * 100 = 38%

Significa que los datos tienen un 38% de variabilidad.

MEDIDAS DE TENDENCIA NO CENTRAL

-Percentiles

-Cuartiles

-Deciles

PERCENTILES

Los percentiles dividen en dos partes las observaciones. Por ejemplo, el percentil 20, P20, es el valor que deja por debajo un 20% y por encima un 80% de las observaciones

PERCENTILES

Mínimo MáximoPercentil 20

P20

20% 80%

Percentiles

L1: es el límite inferior del intervalo crítico (intervalo donde estará contenido el percentil).

I: es la amplitud de los intervalos.fa: es la frecuencia acumulada del intervalo anterior al intervalo crítico.n: es el número de casos.fi: es la frecuencia absoluta del intervalo crítico.

La expresión m ∙ n/100 representa el número de puntuaciones que quedarían por debajo del percentil m en la distribución estudiada. El intervalo crítico es precisamente aquel donde la frecuencia acumulada alcanza o supera ese número de puntuaciones.

DECILES

Es la medida que divide los datos en 10 partes iguales. Cada parte contiene un 10% de las

observaciones. La simbología e “Di” y se obtendrá entonces 10 deciles que son: D1, D2, D3…..D10.

Donde:

• Li: es el límite inferior del intervalo crítico (que contiene a Dm)

• I: es la amplitud de los intervalos.

• fi: es la frecuencia absoluta del intervalo crítico.

• n: es el número de casos.

• fa: es la frecuencia acumulada en el intervalo anterior al intervalo

CUARTILES

Los cuartiles dividen en cuatro partes las observaciones. El primer cuartil Q1 es un valor que deje por debajo de él 25% de las y por encima 75% de las observaciones. El Q2 es la mediana (50%) y Q3 deja por debajo 75% y por encima 25% de las observaciones

Ejercicio:Una prueba de rendimiento en Estadística ha sido calificada con una escala de 0 a 50. Si las puntuaciones obtenidas por los 200 alumnos de una facultad son los que aparecen en la tabla (Tabla 1).

1.- ¿Cuál será el percentil 60 de esa distribución? ¿Qué percentil corresponde a un sujeto cuya puntuación es 25?

2.- Tomando como referencia la distribución de la tabla usada en el ejemplo de los percentiles, determinar la puntuación que constituye el cuarto decil.

3.- Tomando de nuevo la distribución del ejemplo anterior vamos a calcular la calificación obtenida por un alumno que se sitúa en el segundo cuartil.

4.- Realizar en hoja de papel milimetrado tipo ojiva e interprete su sgnificado

Tabla 1.

Calificaciones f1 fa• 2 – 5 4 4

• 6 – 9 18 22

• 10 – 13 14 36

• 14 – 17 20 56

• 18 – 21 20 76

• 22 – 25 54 130

• 26 – 29 14 144

• 30 – 33 21 165

• 34 – 87 10 175

• 38 – 41 15 190

• 42 – 45 6 196

• 46 – 49 4 200

Seguidamente se aplica las correspondientes fórmulas antes indicadas

• Nota: Considerar el debido despeje y la sustitución correspondiente en la respectiva fórmula….