medidas de posición y dispersión bioestadistica 2008

62
Medidas de Posición y Medidas de Posición y Dispersión Dispersión BIOESTADISTICA 2008 BIOESTADISTICA 2008

Upload: ruy-pilar

Post on 18-Apr-2015

17 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Medidas de Posición y Medidas de Posición y

DispersiónDispersión

BIOESTADISTICA 2008BIOESTADISTICA 2008

Page 2: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Objetivo:Objetivo:

Al término de la clase el estudiante estará en condiciones de calcular, interpretar y saber usar las medidas de tendencia central y dispersión.

Page 3: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Medidas de tendencia Medidas de tendencia centralcentral

Las medidas de tendencia central (denominadas también promedios) permiten hallar un solo valor numérico alrededor del cual los datos parecen agruparse de cierta manera, como si fuera el “centro de gravedad de los datos”. Debido a estas circunstancias, suelen ser llamados de POSICIÓN O TENDENCIA CENTRAL.

Page 4: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Principales medidas de Principales medidas de tendencia centraltendencia central

Media Aritmética.Mediana.Moda.Cuantiles.

Page 5: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Media AritméticaMedia Aritmética

Es un valor representativo de un conjunto de datos que se está estudiando y caracteriza a toda una distribución. Se le conoce también como promedio. En su cálculo intervienen todo los valores que se están estudiando.

Page 6: Medidas de Posición y Dispersión BIOESTADISTICA 2008

DefiniciónDefinición

Si tenemos n datos representados por: x1, x2, x3, ......xn. La media aritmética de estos n datos está dado por:

__ X1 + X2 + X3 +..........+ Xn

X = ____________________________ n

Page 7: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Simbólicamente lo Simbólicamente lo podemos representar podemos representar como:como:

Xi = _______ N es el tamaño N de la población

— Xi X = _______ n es el tamaño n de la muestra

Page 8: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Media Aritmética en Media Aritmética en datos agrupadosdatos agrupados

fi es frecuencia

— fi Xi absoluta simple.

X = ________

n Xi es una marca de

clase.

Page 9: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Propiedades de la Media Propiedades de la Media AritméticaAritmética

1.Es única, puede ser un valor positivo, cero o un valor negativo.

2. Si a los valores que estudiamos le sumamos o restamos una constante, el valor de la nueva media quedaría como la media aritmética de los datos originales más o menos la constante que se ha agregado.

3. Si a cada valor de la serie le multiplicamos por una constante, la nueva media aritmética sería igual a la media aritmética original multiplicada por la constante.

Page 10: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Propiedades de la Media Propiedades de la Media AritméticaAritmética

4. La suma de las desviaciones de los datos con respecto a la media es cero, es decir

N _

( xi - X) = 0i=1

5. Como incluye todos los datos, puede estar afectado por valores extremos.

6. Es usada para variables medidas en escala de intervalo o de razón.

Page 11: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Ejemplo 1:Ejemplo 1:

Los siguientes datos son edades de 10 madres que asisten a un centro de salud en un día :

30, 43, 58, 61, 70, 42, 58, 39, 60, 55.

La edad promedio de estas madres será:— 30 + 43 + 58 + ..... + 55 516X = _____________________ = _____ = 51.6 años

10 10

En promedio los valores de edad de las 10 madres es 51.6 años.

Page 12: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Ejemplo 2:Ejemplo 2:A continuación se presenta las edades de 30 personas con cáncer pulmonar que pasan a consulta en el Hospital María Auxiliadora. Lima. Julio 2007:

A continuación se presenta las edades de 30 personas con cáncer pulmonar que pasan a consulta en el Hospital María Auxiliadora. Lima. Julio 2007:

30,43,58,61,70,42,58,3960,5530,43,58,61,70,42,58,3960,55,71,70,65,39,40,6165,56,38,5,71,70,65,39,40,6165,56,38,57,49,61,69,4346,69,44,59, 7,49,61,69,4346,69,44,59, 62,6662,66

Tabla 1Tabla 1

Edad fi Xi fi . XiEdad fi Xi fi . Xi

30 - 36 1 33 3330 - 36 1 33 33

37 - 43 7 40 28037 - 43 7 40 280

44 - 50 3 47 14144 - 50 3 47 141

51 - 57 3 54 16251 - 57 3 54 162

58 - 64 8 61 48858 - 64 8 61 488

65 - 71 8 68 54465 - 71 8 68 544

Total 30 1648Total 30 1648

Page 13: Medidas de Posición y Dispersión BIOESTADISTICA 2008

PROCEDIMIENTO: PROCEDIMIENTO:

— fi Xi 1648 X = ________ = ______ = 54.9

n 30

En promedio los valores de la edad de los 30 pacientes es de 54.9 años.

— fi Xi 1648 X = ________ = ______ = 54.9

n 30

En promedio los valores de la edad de los 30 pacientes es de 54.9 años.

Page 14: Medidas de Posición y Dispersión BIOESTADISTICA 2008

MEDIANA ( Me )

La mediana es un valor que La mediana es un valor que divide a la distribución divide a la distribución ordenada en forma ordenada en forma ascendente o descendente en ascendente o descendente en dos grupos iguales.dos grupos iguales.

50% | 50%50% | 50%

V. min. Me. V. min. Me. V. máx.V. máx.

Page 15: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Propiedades de la Propiedades de la MedianaMediana

1.Es única , existe solamente una mediana

para un conjunto de datos.

2. Los valores extremos no tienen efectos

importantes sobre la mediana.

3. Se aplica también a variables que

pertenecen a la escala ordinal.

4. Es muy variable de muestra a muestra.

Page 16: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Ejemplo:Ejemplo:

Dado los valores: 11, 8, 13, 20, 14, 3, 7, 12. Hallar la medianaOrdenando ascendentemente: 3, 7, 8, 11, 12, 13, 14, 20.

Me = 11 + 12 = 11.5 2Por debajo de 11.5 existe un 50% de observaciones.

Page 17: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Ejemplo:Ejemplo:

Calcular la mediana dado los valores: 1, 9, 2,

6, 3, 5, 7 días.Ordenando los valores: 1, 2, 3, 5, 6, 7, 9.

Es decir por debajo de 5 existe un 50 % de

observaciones .

Page 18: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Mediana en datos Mediana en datos agrupados.agrupados.

Me = Li + (n/2 - Fi-1) x C f Me

n/2 Posición de la medianaLi Límite real inferior de la clase que

contiene a la Men Número total de observacionesFi-1 Frecuencia absoluta acumulada de la

clase anterior a la que contiene a la Me.f Me Frecuencia absoluta de la clase que

contiene a la MeC Amplitud de la clase que contiene a la Me

Page 19: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Ejemplo:Ejemplo:Ejemplo:Ejemplo:

Calcular la Me de la siguiente distribución:

Calcular la Me de la siguiente distribución:

Page 20: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Procedimiento:Procedimiento:Procedimiento:Procedimiento:

1. Calcular las frecuencias acumuladas Fi 2. Calcular n/2 = 40/2 = 20 sirve para detectar la clase

mediana.3. Clase mediana: clase cuyo Fi excede a 20 (15 - 19)4. De la clase mediana se obtiene:

L i = 14.5 Fi - 1 = 12 C = 5 fMe = 15 . Los valores encontrados en (2), (3) y (4) lo reemplazamos en la formula y se tiene:Me = 14.5 + 20 - 12 x 5 Me = 17.17

15Interpretación: El 50% de los puntajes están por debajo

de 17.17 y el 50% está por encima de 17.17

puntos.

1. Calcular las frecuencias acumuladas Fi 2. Calcular n/2 = 40/2 = 20 sirve para detectar la clase

mediana.3. Clase mediana: clase cuyo Fi excede a 20 (15 - 19)4. De la clase mediana se obtiene:

L i = 14.5 Fi - 1 = 12 C = 5 fMe = 15 . Los valores encontrados en (2), (3) y (4) lo reemplazamos en la formula y se tiene:Me = 14.5 + 20 - 12 x 5 Me = 17.17

15Interpretación: El 50% de los puntajes están por debajo

de 17.17 y el 50% está por encima de 17.17

puntos.

Page 21: Medidas de Posición y Dispersión BIOESTADISTICA 2008

LA MODALA MODALA MODALA MODA

Se utiliza mayormente cuando la característica en estudio se ha medido en escala nominal u ordinal. La MODA es la observación que mayormente se repite (observación más COMÚN)

Se utiliza mayormente cuando la característica en estudio se ha medido en escala nominal u ordinal. La MODA es la observación que mayormente se repite (observación más COMÚN)

Ejemplo: Se tiene la siguiente información:

2, 3, 4, 5, 5, 6, 4, 5

Mo = 5

Page 22: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Propiedades de la ModaPropiedades de la Moda

1. Si todos los valores son diferentes, no

hay moda.

2. En una distribución puede existir dos o

más modas

3. Es usada para variables categóricas o

cualitativas.

Page 23: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Ejemplo:Ejemplo:Ejemplo:Ejemplo:

Estado Civil fi

Soltero 30

Casado 60

Divorciado 10

Total 100

Estado Civil fi

Soltero 30

Casado 60

Divorciado 10

Total 100

Page 24: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Ejemplo:Moda para datos Ejemplo:Moda para datos agrupadosagrupadosEjemplo:Moda para datos Ejemplo:Moda para datos agrupadosagrupados

En una tabla de distribución de frecuencias es aproximadamente la marca de clase o punto medio de la clase que tiene la mayor frecuencia absoluta simple.

Variable fi5 - 9 310 - 14 915 - 19 1520 - 24 825 - 29 5total 40

La moda estará ubicado en el intervalo: Variable fi 15 - 19 15

En una tabla de distribución de frecuencias es aproximadamente la marca de clase o punto medio de la clase que tiene la mayor frecuencia absoluta simple.

Variable fi5 - 9 310 - 14 915 - 19 1520 - 24 825 - 29 5total 40

La moda estará ubicado en el intervalo: Variable fi 15 - 19 15

Page 25: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Por lo tanto la marca de clase será:

14.5 + 19.5 = 17.02

Luego la Mo = 17.0

Por lo tanto la marca de clase será:

14.5 + 19.5 = 17.02

Luego la Mo = 17.0

Page 26: Medidas de Posición y Dispersión BIOESTADISTICA 2008

SIMETRÍASIMETRÍASIMETRÍASIMETRÍA

Page 27: Medidas de Posición y Dispersión BIOESTADISTICA 2008

SIMETRÍASIMETRÍASIMETRÍASIMETRÍA

Page 28: Medidas de Posición y Dispersión BIOESTADISTICA 2008

LOS CUANTILESLOS CUANTILESLOS CUANTILESLOS CUANTILES

Son aquellos que dividen a la distribución en cuatro, diez o cien partes iguales:

Cuartiles.Deciles.Percentiles.

Son aquellos que dividen a la distribución en cuatro, diez o cien partes iguales:

Cuartiles.Deciles.Percentiles.

Page 29: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Cuartiles (Q).Cuartiles (Q).

Son aquellos que dividen a la distribución en cuatro partes iguales, en donde cada uno de ellos incluye el 25% de las observaciones. __25%_._25%__.__25%__.__25%__ Q1 Q2 Q3

Me

Son aquellos que dividen a la distribución en cuatro partes iguales, en donde cada uno de ellos incluye el 25% de las observaciones. __25%_._25%__.__25%__.__25%__ Q1 Q2 Q3

Me

Page 30: Medidas de Posición y Dispersión BIOESTADISTICA 2008

DECILES (D)DECILES (D)DECILES (D)DECILES (D)

Son aquellos que dividen a la distribución en diez partes iguales en donde cada uno de ello incluye el 10% de las observaciones

_10%_._10%_.10%_._10%_._10%_._10%_._10%_._10%_._10%_._10%_

D1 D2 D3 D4 D5 D6 D7 D8 D9

Q2

Me

Son aquellos que dividen a la distribución en diez partes iguales en donde cada uno de ello incluye el 10% de las observaciones

_10%_._10%_.10%_._10%_._10%_._10%_._10%_._10%_._10%_._10%_

D1 D2 D3 D4 D5 D6 D7 D8 D9

Q2

Me

Page 31: Medidas de Posición y Dispersión BIOESTADISTICA 2008

PERCENTILES (P)PERCENTILES (P)PERCENTILES (P)PERCENTILES (P)

Son aquellos que dividen a la distribución en cien partes iguales en donde cada uno de ello incluye el 1% de las observaciones:

_1%_._1%_. 1%_._1%_._1%_. .........._1%_._1%_._1%_._1%_._1%_

P1 P2 P3 P4 ........... P96 P97 P98 P99

P10 = Li + (10/100 N - F i-1 ) x C

fP10

P60 = Li + (60/100 N - F i-1 ) x C

fP60

C = ancho de la clase que contiene el P10 ó P60

Son aquellos que dividen a la distribución en cien partes iguales en donde cada uno de ello incluye el 1% de las observaciones:

_1%_._1%_. 1%_._1%_._1%_. .........._1%_._1%_._1%_._1%_._1%_

P1 P2 P3 P4 ........... P96 P97 P98 P99

P10 = Li + (10/100 N - F i-1 ) x C

fP10

P60 = Li + (60/100 N - F i-1 ) x C

fP60

C = ancho de la clase que contiene el P10 ó P60

Page 32: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Ejemplo:Ejemplo:Ejemplo:Ejemplo:

Variable fi Fi

55 - 58 20 20

59 - 62 30 50

63 - 66 80 130

67 - 70 70 200

71 - 74 40 240

75 - 78 10 250

Total 250

Variable fi Fi

55 - 58 20 20

59 - 62 30 50

63 - 66 80 130

67 - 70 70 200

71 - 74 40 240

75 - 78 10 250

Total 250

Page 33: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Recordar:Recordar:

Q1 = P25

Q2 = Mediana = P50

Q3 = P75

Page 34: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Medidas de dispersiónMedidas de dispersiónMedidas de dispersiónMedidas de dispersión

Page 35: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Las medidas de Las medidas de dispersióndispersión

Son útiles porque:1. Permiten juzgar la confiabilidad de la

medida de tendencia central.2. Los datos demasiados dispersos tienen

un comportamiento especial.3. Es posible comparar dispersión de

diversas muestras.

Llamadas también medidas de variabilidad, miden el grado de separación de los datos respecto a un valor central.

Page 36: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Medidas que calculan la Medidas que calculan la dispersióndispersión

RANGO ( Amplitud Total ) Es la medida más simple de

dispersión

A = Obs Max - Obs Min

Page 37: Medidas de Posición y Dispersión BIOESTADISTICA 2008

La varianzaLa varianza

Es una medida de dispersión que cuantifica la variabilidad de los datos con respecto a la Media Arítmetica.

Es una medida de dispersión que cuantifica la variabilidad de los datos con respecto a la Media Arítmetica.

Page 38: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Si tenemos N datos X1, X2, X3, ...., XN . La varianza de estos datos se define como: ( Xi _ μ )2

V(x) = ____________ N

Para una muestra de tamaño n tendremos: __ ( Xi _ X )2

V(x) = ____________ n-1

Definición:Definición:

Page 39: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Varianza PoblacionalVarianza Poblacional

( Xi)2

Xi2 _ __________ N V( x ) = ________________________ N

Page 40: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Varianza MuestralVarianza Muestral

( xi)2

xi2 _ __________

n v(x ) = ________________________ n-1

Page 41: Medidas de Posición y Dispersión BIOESTADISTICA 2008

EjemploEjemplo

Consideremos los siguientes datos de una muestra : 4, 7, 8, 3, 5, 9, 10, 2.

__ 4+7+8+....+ 2X = ____________ = 6 8

(4-6)2 + ( 7-6)2 +...+(2-6)2 V(x) = _____________________ = 8.57 8-1

Page 42: Medidas de Posición y Dispersión BIOESTADISTICA 2008

EjemploEjemplo:

Se tiene la siguiente distribución de frecuencias:

Variable fi Xi fi . Xi fi . Xi2

55-58 20 56.5 1130 6384559-62 30 60.5 1815 109807.563-66 80 64.5 5160 33282067-70 70 68.5 4795 328457.571-74 40 72.5 2900 21025075-78 10 76.5 765 5852.25total 250 16565

1051032.25

Page 43: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Formula para datos Formula para datos agrupadosagrupados

(fi Xi)2

fi Xi2 _ __________ n V( x ) = ________________________ n-1

Page 44: Medidas de Posición y Dispersión BIOESTADISTICA 2008

ResultadosResultados

(16565)2

1051032.25 - _________ 250 V(x) = _______________________ 250-1 = 186.26

Page 45: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Desviación estándarDesviación estándarDesviación estándarDesviación estándar

Es la medida de dispersión más común para

definir datos médicos y del área de la salud.

Es la raiz cuadrada de la varianza s=V(X).

Tanto la desviación estándar como la media

aritmética requieren datos numéricos.

Es la medida de dispersión más común para

definir datos médicos y del área de la salud.

Es la raiz cuadrada de la varianza s=V(X).

Tanto la desviación estándar como la media

aritmética requieren datos numéricos.

Page 46: Medidas de Posición y Dispersión BIOESTADISTICA 2008

El coeficiente de variaciónEl coeficiente de variación

Es una medida relativa de variabilidad de los datos entre la media y la desviación estándar de una población o muestra. Permite comparar la variabilidad de dos o más conjuntos de datos expresados en unidades diferentes (por ejemplo peso en Kg. y libras).

a) Cálculos a partir de datos no agrupadospara la muestra:

para la población: 100

CV

100xs

CV

Page 47: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Ejemplo:Ejemplo:Ejemplo:Ejemplo:

Supongamos que de dos poblaciones se han obtenido los siguientes datos: Grupo 1 Grupo 2 __ Edad X = 25 años 11 años __ Peso X = 72.5 Kgs. 40 Kgs s = 5 Kgs. 5 Kgs. n = 15 15 ¿Que grupo es más homogéneo o menos variable en relación al peso?

Supongamos que de dos poblaciones se han obtenido los siguientes datos: Grupo 1 Grupo 2 __ Edad X = 25 años 11 años __ Peso X = 72.5 Kgs. 40 Kgs s = 5 Kgs. 5 Kgs. n = 15 15 ¿Que grupo es más homogéneo o menos variable en relación al peso?

Page 48: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Grupo 1 Grupo 2 5 5 C.V = ______. 100 C.V = _____.100 72.5 40 = 6.9% = 12.5% La muestra 1 posee menos dispersión de los pesos con respecto a la media en relación a las muestra 2.

Grupo 1 Grupo 2 5 5 C.V = ______. 100 C.V = _____.100 72.5 40 = 6.9% = 12.5% La muestra 1 posee menos dispersión de los pesos con respecto a la media en relación a las muestra 2.

Page 49: Medidas de Posición y Dispersión BIOESTADISTICA 2008

ConsideracionesConsideracionesConsideracionesConsideraciones

SI:

C.V 10% hay poca dispersión10% C.V < 33% Dispersión aceptable33% < C.V < 50% Dispersión altaC.V > 50% La dispersión es muy alta.

SI:

C.V 10% hay poca dispersión10% C.V < 33% Dispersión aceptable33% < C.V < 50% Dispersión altaC.V > 50% La dispersión es muy alta.

Page 50: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Uso de las diferentes Uso de las diferentes medidas de dispersionmedidas de dispersionUso de las diferentes Uso de las diferentes

medidas de dispersionmedidas de dispersion

La desviación estándar se emplea cuando también es apropiado el uso de la media, es decir, con distribuciones simétricas(no sesgadas) de datos numéricos.

Desviación cuartil se emplea cuando la distribución no es simétrica(sesgada) y es apropiado el uso de la mediana.

La desviación estándar se emplea cuando también es apropiado el uso de la media, es decir, con distribuciones simétricas(no sesgadas) de datos numéricos.

Desviación cuartil se emplea cuando la distribución no es simétrica(sesgada) y es apropiado el uso de la mediana.

Page 51: Medidas de Posición y Dispersión BIOESTADISTICA 2008

El rango es una medida apropiada para datos numéricos cuando el propósito es enfatizar valores extremos.

El coeficiente de variación es útil cuando la intención es comparar dos distribuciones numéricas medidas en escalas diferentes.

El rango es una medida apropiada para datos numéricos cuando el propósito es enfatizar valores extremos.

El coeficiente de variación es útil cuando la intención es comparar dos distribuciones numéricas medidas en escalas diferentes.

Page 52: Medidas de Posición y Dispersión BIOESTADISTICA 2008

El “Boxplot” (Diagrama de El “Boxplot” (Diagrama de Caja)Caja)

El “Boxplot” (Diagrama de El “Boxplot” (Diagrama de Caja)Caja)

Al igual que el histograma y los gráficos de Tallo y Hoja permite tener una idea visual de la distribución de los datos (simetría y variabilidad).

Permite detectar outliers (valores extremos).

Permite comparar la media y la variabilidad de varios grupos (alternativa gráfica a pruebas estadísticas)

Al igual que el histograma y los gráficos de Tallo y Hoja permite tener una idea visual de la distribución de los datos (simetría y variabilidad).

Permite detectar outliers (valores extremos).

Permite comparar la media y la variabilidad de varios grupos (alternativa gráfica a pruebas estadísticas)

Page 53: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Boxplot: ProcedimientoBoxplot: ProcedimientoBoxplot: ProcedimientoBoxplot: Procedimiento

1. Dibujar una caja cuyo límite inferior será Q1 y el superior Q3. Dentro de la caja trazar una línea que localice la mediana.

2. Calcular el rango intercuartílico: R.I. (Q) = RIQ = Q3 – Q1

3. Dibujar un “bigote” del borde inferior de la caja hasta Q1-1.5xRIQ o hasta el valor mínimo de los datos (se elige el mayor de estos dos resultados)

1. Dibujar una caja cuyo límite inferior será Q1 y el superior Q3. Dentro de la caja trazar una línea que localice la mediana.

2. Calcular el rango intercuartílico: R.I. (Q) = RIQ = Q3 – Q1

3. Dibujar un “bigote” del borde inferior de la caja hasta Q1-1.5xRIQ o hasta el valor mínimo de los datos (se elige el mayor de estos dos resultados)

Page 54: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Boxplot: ProcedimientoBoxplot: ProcedimientoBoxplot: ProcedimientoBoxplot: Procedimiento

5. Dibujar otro“bigote” del borde

superior de la caja hasta Q3+1.5xRIQ

o hasta el valor máximo de los datos

(se elige el menor de estos dos

resultados)

6. Dibujar cualquier observación que se

ubique fueras de los bigotes (estos

serán los outliers).

5. Dibujar otro“bigote” del borde

superior de la caja hasta Q3+1.5xRIQ

o hasta el valor máximo de los datos

(se elige el menor de estos dos

resultados)

6. Dibujar cualquier observación que se

ubique fueras de los bigotes (estos

serán los outliers).

Page 55: Medidas de Posición y Dispersión BIOESTADISTICA 2008

BoxPlot: EjemploBoxPlot: EjemploBoxPlot: EjemploBoxPlot: Ejemplo

Construir un boxplot con el siguiente grupo de datos que corresponde a diámetros (cm) de sarcomas puros extirpados del pecho de 20 mujeres:

0.5 1.2 2.1 2.5 2.5 3.0 3.8 4.0

4.2 4.5 5.0 5.0 5.0 5.0 6.0 6.5

7.0 8.0 9.5 13.0

Recordar la posición de los cuartiles:

Construir un boxplot con el siguiente grupo de datos que corresponde a diámetros (cm) de sarcomas puros extirpados del pecho de 20 mujeres:

0.5 1.2 2.1 2.5 2.5 3.0 3.8 4.0

4.2 4.5 5.0 5.0 5.0 5.0 6.0 6.5

7.0 8.0 9.5 13.0

Recordar la posición de los cuartiles:

1

2

3

1

42( 1) 1

4 23( 1)

4

nQ

n nQ

nQ

Page 56: Medidas de Posición y Dispersión BIOESTADISTICA 2008

BoxPlot: EjemploBoxPlot: EjemploBoxPlot: EjemploBoxPlot: Ejemplo

Proceso:Q1=(20+1)/4=5.25 2.5+(0.25)(3.0-2.5)= 2.625

Me= 4.75

Q3=3(20+1)/4=15.75 6.0+(0.75)(6.5-6.0)=6.375

RIQ=Q3-Q1= 6.375-2.625=3.75

Outlier> Q3+1.5xRIQ= 6.375 + (1.5)(3.75)= 12.00Outlier< Q1-1.5xRIQ = 2.625 – (1.5)(3.75) = -3.00

Proceso:Q1=(20+1)/4=5.25 2.5+(0.25)(3.0-2.5)= 2.625

Me= 4.75

Q3=3(20+1)/4=15.75 6.0+(0.75)(6.5-6.0)=6.375

RIQ=Q3-Q1= 6.375-2.625=3.75

Outlier> Q3+1.5xRIQ= 6.375 + (1.5)(3.75)= 12.00Outlier< Q1-1.5xRIQ = 2.625 – (1.5)(3.75) = -3.00

Page 57: Medidas de Posición y Dispersión BIOESTADISTICA 2008

BoxPlot: EjemploBoxPlot: EjemploBoxPlot: EjemploBoxPlot: Ejemplo

Page 58: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Medidas de resumen numérico Medidas de resumen numérico para variables cualitativaspara variables cualitativas

Medidas de resumen numérico Medidas de resumen numérico para variables cualitativaspara variables cualitativas

Las medidas de resumen numérico

empleadas para variables cualitativas

son:

Razón

Proporción

Tasa

Las medidas de resumen numérico

empleadas para variables cualitativas

son:

Razón

Proporción

Tasa

Page 59: Medidas de Posición y Dispersión BIOESTADISTICA 2008

RAZONRAZONRAZONRAZON

Es la comparación por cociente entre dos cifras de diferentes o similar naturaleza en donde el numerador y el denominador son excluyentes. Por ejemplo, si tenemos 380 camas hospitalarias y 95 enfermeras y queremos encontrar la razón entre ellas, tenemos que dividir:

380 camas hospitalarias/95 enfermeras=4 camas/enfermera

Este número constituye un valor que refleja una relación. En este caso, el número 4 se interpreta como que por cada cuatro camas hospitalarias hay una enfermera.

Es la comparación por cociente entre dos cifras de diferentes o similar naturaleza en donde el numerador y el denominador son excluyentes. Por ejemplo, si tenemos 380 camas hospitalarias y 95 enfermeras y queremos encontrar la razón entre ellas, tenemos que dividir:

380 camas hospitalarias/95 enfermeras=4 camas/enfermera

Este número constituye un valor que refleja una relación. En este caso, el número 4 se interpreta como que por cada cuatro camas hospitalarias hay una enfermera.

Page 60: Medidas de Posición y Dispersión BIOESTADISTICA 2008

PROPORCIÓNPROPORCIÓNPROPORCIÓNPROPORCIÓN

Es la comparación por cociente entre el número de elementos de un subconjunto y el número de elementos de un conjunto al que pertenece dicho subconjunto. En este caso el numerador está incluido en el denominador, por este motivo los valores siempre van a ser menores que la unidad.

Por ejemplo, si en la población hubo 175 casos de cáncer pulmonar de un total de 1925 casos de todos los tipos de cáncer, la proporción se calculará.

175 / 1925 = 0.09

Es la comparación por cociente entre el número de elementos de un subconjunto y el número de elementos de un conjunto al que pertenece dicho subconjunto. En este caso el numerador está incluido en el denominador, por este motivo los valores siempre van a ser menores que la unidad.

Por ejemplo, si en la población hubo 175 casos de cáncer pulmonar de un total de 1925 casos de todos los tipos de cáncer, la proporción se calculará.

175 / 1925 = 0.09

Page 61: Medidas de Posición y Dispersión BIOESTADISTICA 2008

TASATASATASATASA

Es la comparación por cociente entre un número de eventos ocurridos en un tiempo y lugar determinados y la población que estuvo expuesta al riesgo de que le ocurriera dichos eventos en la misma época y en ese lugar.

Es la comparación por cociente entre un número de eventos ocurridos en un tiempo y lugar determinados y la población que estuvo expuesta al riesgo de que le ocurriera dichos eventos en la misma época y en ese lugar.

Page 62: Medidas de Posición y Dispersión BIOESTADISTICA 2008

Cada esfuerzo en el presente nos permite avanzar hacia el éxito.

Cada esfuerzo en el presente nos permite avanzar hacia el éxito.