media percentil cuartil

Upload: drlarzouse

Post on 14-Jan-2016

17 views

Category:

Documents


0 download

DESCRIPTION

percentil

TRANSCRIPT

  • Jess Reynaga Obregn

    La sntesis estadstica como cuarta etapa del mtodo estadstico. Medidas de resumen para variables cuantitativas. Mediana y percentiles en series simples de datos. Cuando se desea sintetizar una serie de datos cuantitativos discretos, tales como el nmero de emba-razos, el nmero de convulsiones o el nmero de habitaciones que tienen un grupo de viviendas, debe utilizarse a la mediana y a los percentiles. Estas medidas de resumen, a diferencia del promedio y la des-viacin estndar, son perfectamente apropiados para sintetizar a las variables cuantitativas discretas. Con el siguiente ejemplo debe quedar claro que el promedio y la desviacin estndar no son medidas de resumen propias para sintetizar a las variables cuantitativas discretas: qu significara que el promedio de hijos de un grupo de madres fue de 2.75 hijos?, significara que en promedio cada una de las madres tuvo dos hijos completos y otro ms al que le falt un brazo? A diferencia del promedio y la desviacin estndar, que solo deben usarse para sintetizar a variables cuantitativas continuas, la mediana y los percentiles pueden utilizarse para resumir tanto a variables cuantitativas discretas como a variables cuantitativas continuas. La siguiente serie simple de valores se utilizar como ejemplo para ilustrar el clculo e interpreta-cin de la mediana y algunos percentiles:

    Peso en kilogramos de un grupo de 20 nios de un ao de edad

    9.1 9.4 8.9 9.6 10.5 8.8 9.4 9.2 9.0 8.1 9.3 8.8 9.5 9.7 9.2 9.4 9.6 9.0 9.4 9.8

    MEDIANA (o Percentil 50) : Definicin: En una serie de valores ordenados de menor a mayor, o viceversa, es aquel valor que divi-de en dos partes de igual tamao a toda la serie. . Procedimiento: Ordenar la serie y localizar el valor que la divida en dos partes de igual tamao, de tal manera que en una parte quede el 50% de los datos y en la otra el 50% restante.

    8.1 8.8 8.8 8.9 9.0 9.0 9.1 9.2 9.2 9.3

    9.4 9.4 9.4 9.4 9.5 9.6 9.6 9.7 9.8 10.5 En vista de que la serie es par no existe un valor que se ubique exactamente en el centro de la serie y que la divida en dos partes. Por lo anterior se considera que el promedio de los dos valores centrales que estn colocados en las posiciones 10 y 11 corresponde al valor de la mediana; es decir: la mediana equivale al valor promedio de 9.3 y 9.4 (9.35) Interpretacin: "La mitad de los nios tuvieron un peso igual o menor que 9.35 kilogramos y la otra mitad pesaron 9.35 o ms kilogramos"

    77

  • Jess Reynaga Obregn

    PERCENTILES ( Pp ) : Definicin: En una serie de valores ordenados, de menor a mayor o viceversa, es aquel valor que divide en dos partes porcentualmente complementarias a toda la serie. Por ejemplo: el percentil 40 divide a la serie en una parte que contiene al 40 % de los valores iguales o inferiores a l y, simultneamente, en otra parte que contiene al 60% de los valores de la serie iguales o mayores a dicho percentil. Procedimiento: Ordenar la serie y localizar el valor que la divida en los porcentajes complementarios deseados. Por ejemplo, para encontrar el valor del percentil 25 debe localizarse a aquel que deje a una cuarta parte de los valores con menores o iguales magnitudes a l y a las tres cuartas partes restantes de los valores con magnitudes ms grandes o iguales a l.

    8.1 8.8 8.8 8.9 9.0 9.0 9.1 9.2 9.2 9.3 9.4 9.4 9.4 9.4 9.5 9.6 9.6 9.7 9.8 10.5

    En esta serie, entre los valores 9.0 se debe encontrar un valor en una posicin tal que hasta l se en-cuentra el 25% de los casos y, simultneamente, desde l se encuentra el 75% restante de los casos. Usualmente cualquier percentil se ubica en una posicin localizada mediante la siguiente frmula:

    Lugar que ocupa el percentil buscado = 100

    1)(n)(pbuscado +

    Para el caso del percentil 25, a la posicin

    1001)(20)(p25 + le corresponde el lugar 5.25

    100(21)(25) =

    Lo anterior significa que el percentil 25 se encuentra entre el lugar 5 y el lugar 6. En estos casos, por convencin, se considera posible obtener un promedio de los valores que se encuentren en las posicio-nes adyacentes. Como ya se observ, la quinta posicin est ocupada por un valor de 9.0 y la sexta por un valor tambin de 9.0; por lo anterior, el promedio de ambos valores es igual a 9.0. Interpretacin: (Vlida para el Percentil 25 o P25) : " El 25% de los nios tuvo un peso de 9.0 kilo-gramos o menor y el 75% restante tuvo peso de 9.0 kilogramos mayor". Como ejemplo adicional supongamos que se desea encontrar el valor del percentil 75. Para ello debe localizarse a aquel que deje a tres cuartas partes de los valores con menores o iguales magnitudes a l y a la cuarta parte restante de los valores con magnitudes ms grandes o iguales a l.

    8.1 8.8 8.8 8.9 9.0 9.0 9.1 9.2 9.2 9.3

    9.4 9.4 9.4 9.4 9.5 9.6 9.6 9.7 9.8 10.5 En esta serie, entre los valores 9.5 y 9.6 se debe encontrar un valor en una posicin tal que hasta l se encuentra el 75% de los casos y, simultneamente, desde l se encuentra el 25% restante de los casos.

    78

  • Jess Reynaga Obregn

    Utilizando la frmula:

    Lugar que ocupa el percentil buscado = 100

    1)(n)(pbuscado + Se tiene que al percentil 75 le corresponde la posicin

    1001)(20)(p75 + que equivale a 15.75

    100(21)(75) =

    Lo anterior significa que el percentil 75 se encuentra entre el lugar 15 y el lugar 16. Como ya se dijo, en estos casos, y por convencin, se considera posible obtener un promedio de los valores que se encuen-tren en las posiciones adyacentes. Como ya se observ, la posicin 15 est ocupada por un valor de 9.5 y la posicin 16 por un valor tambin de 9.6; por lo anterior, el promedio de ambos valores es igual a 9.55. Interpretacin: (Vlida para el Percentil 75 o P75) : " El 75% de los nios tuvo un peso de 9.55 kilo-gramos o menor y el 25% restante tuvo peso de 9.55 kilogramos mayor". RANGO INTERCUARTLICO (RIC): Se define al rango intercuartlico (RIC) como la diferencia entre los percentiles 75 y 25. El rango intercuar-tlico es una medida que abarca al 50% central de los valores de una serie ordenada de nmeros y viene siendo una medida de sntesis que expresa el grado de homogeneidad o heterogeneidad de dicho por-centaje de datos. Para el ejemplo que se ha venido siguiendo se tiene que la diferencia p75 p25 es igual a 9.55 9.0 = 0.55; lo anterior quiere decir que, especficamente refirindose al 50% central de los datos ya ordenados, la diferencia entre el mayor y el menor de los datos de dicho 50% central de los valores es de 0.55 kilo-gramos. El RIC es una medida que permite comparar con facilidad la homogeneidad o heterogeneidad de dos series de datos semejantes; vease el siguiente ejemplo:

    Peso al nacer de dos grupos de nios segn duracin de la gestacin

    Nmero de nios

    Duracin de la gestacin en semanas

    p25 p75Diferencia p75 p25

    Comentario

    60 32 1,800 2,800 1,000

    El 50% central de la serie de pesos de los 60 nios tiene una diferencia entre el mayor de los pesos y el menor de ellos de 1,000 gramos. Pue-de hablarse de gran hetero-geneidad

    2,709 39 2,884 3,132 248

    El 50% central de la serie de pesos de los 2,709 nios tiene una diferencia entre el mayor de los pesos y el me-nor de ellos de 248 gramos. Puede hablarse de gran homogeneidad

    79

  • Jess Reynaga Obregn

    PROBLEMA RESUELTO Luego de criar durante dos aos a un grupo de 20 cerdos en una granja modelo que funcionaba bajo el rgimen de sociedad cooperativa, en condiciones de estricta higiene animal, se sacrificaron y observaron sus cerebros en bsqueda de quistes de cisticercos. Los hallazgos se compararon con otro grupo de 20 cerdos criados en los patios de las casas de la misma localidad. Cerdos provenientes de la granja modelo

    Cerdo No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14

    15

    16

    17 18 19 20

    Quistes

    1

    3

    0

    2

    3

    1

    2

    2

    1

    4

    1

    0

    1

    1

    2

    1

    0

    2

    4

    1

    Cerdos provenientes de patios de casas

    Cerdo No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14

    15

    16

    17 18 19 20

    Quistes

    7

    4

    2

    4

    5

    1

    0

    2

    2

    9

    2

    3

    4

    4

    1

    6

    4

    4

    3

    1

    Preguntas: a) Para cada grupo identifique la mediana (o percentil 50) y emita una opinin con respecto a los resulta-dos. b) Para cada grupo identifique los valores mnimo y mximo, as como los percentiles 25 y 75 y llene la siguiente tabla: Valor mnimo Percentil 25 Percentil 75 Valor mximo Grupo "Granja" Grupo "Patios" c) Emita una opinin en relacin con los hallazgos en trminos de porcentajes de cada grupo consideran-do a los percentiles 25 y 75. d) No olvide discutir los hallazgos para el 50% central de los animales de uno y otro grupo que se encon-traron entre los percentiles 25 y 75 de cada uno de los grupos. Tambin, opine sobre la homogeneidad y heterogeneidad de los grupos. Para responder a las preguntas, primero se ordenan los datos y se localizan los percentiles bus-cados: Cerdos provenientes de la granja modelo Cerdo No.

    3 12

    17

    1 6 9 11

    13

    14

    16 20 4 7 8 15

    18

    2 5 10 19

    Quistes

    0

    0

    0

    1

    1

    1

    1

    1

    1

    1

    1

    2

    2

    2

    2

    2

    3

    3

    4

    4

    P75 = (2+2) / 2 = 2 P50 = (1+1) / 2 = 1 P25 = (1+1) / 2 = 1

    80

  • Jess Reynaga Obregn

    Cerdos provenientes de patios de casas Cerdo No.

    7 6 15

    20

    3 8 9 11

    12

    19 2 4 13 14 17

    18

    5 16 1 10

    Quistes

    0

    1

    1

    1

    2

    2

    2

    2

    3

    3

    4

    4

    4

    4

    4

    4

    5

    6

    7

    9

    P75 = (4+4) / 2 = 4 P50 = (3+4) / 2 = 3.5 P25 = (2+2) / 2 = 2

    Respuestas: a) La mediana del grupo granja fue 1 y la del grupo patios fue 3.5. Se observ que la mitad de los cerdos del grupo granja tuvo 1 o menos quistes y la otra mitad de ellos tuvieron 1 o ms quistes Se observ que la mitad de los cerdos del grupo patios tuvo 3.5 o menos quistes y la otra mitad de ellos tuvieron 3.5 o ms quistes b) Valor mnimo Percentil 25 Percentil 75 Valor mximo Grupo "Granja" 0 1 2 4 Grupo "Patios" 0 2 4 9 c) En el grupo granja una cuarta parte de los cerdos tuvo hasta 1 quiste y las tres cuartas partes restantes tuvieron desde 1 quiste en adelante. En el grupo granja tres cuartas partes de los cerdos tuvieron hasta 2 quistes y la cuarta parte restante tuvo desde 2 quistes en adelante. En el grupo patios una cuarta parte de los cerdos tuvo hasta 2 quistes y las tres cuartas partes restantes tuvieron desde 2 quistes en adelante. En el grupo patios tres cuartas partes de los cerdos tuvieron hasta 4 quistes y la cuarta parte restante tuvo desde 4 quistes en adelante. d) En el grupo granja el 50% central de los cerdos tuvieron entre 1 y 2 quistes, mientras que en el grupo patios el 50% central de los cerdos tuvieron entre 2 y 4 quistes; por lo anterior puede decirse que los cerdos del grupo granja fueron ms homogneos y los del grupo patios fueron ms heterogneos.

    81

    La sntesis estadstica como cuarta etapa del mtodo estadsMedidas de resumen para variables cuantitativas.Mediana y percentiles en series simples de datos.