bioestadistica (tema 2)

36
CALCULO PRINCIPALES PARÁMETROS DE POSICIÓN Y DISPERSIÓN MEDIDAS DE TENDENCIA CENTRAL

Upload: geralkatiacruzyufra

Post on 29-Sep-2015

260 views

Category:

Documents


3 download

DESCRIPTION

Tema de bioestadistica para la medicina

TRANSCRIPT

  • CALCULO PRINCIPALES PARMETROS DE POSICIN Y DISPERSIN

    MEDIDAS DE TENDENCIA CENTRAL

  • MEDIDAS DE POSICION1.1 MEDIDAS DE CENTRALIZACIN 1.2 MEDIDAS DE POSICIN PROPIAMENTE DICHASMEDIAMEDIANAMODAQUARTILESDECILESCENTITLES

  • Medidas de Posicin: son aquellos valores numricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la variable en dos, o bien fragmentar la cantidad de datos en partes iguales. Las ms usuales son la media, la mediana, la moda, los cuartiles, quintiles, deciles y percentiles. Pueden ser de dos tipos: de tendencia central o de tipismo.

    Medidas de Dispersin: se llaman medidas de dispersin aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentracin de los datos en un cierto sector del recorrido de la variable. Se trata de coeficientes para variables cuantitativas. Las ms usuales son el desvo estndar y la varianza.Medidas de tendencia central

  • medias de los diferentes conjuntos. 3) Es posible hallar la media de La idea de media o promedio (tambin llamada media aritmtica) formaliza el concepto intuitivo de punto de equilibrio de las observaciones. Es decir, es el punto medio del recorrido de la variable segn la cantidad de valores obtenidos. Ese valor tiene varias propiedades importantes. 1) Si se suma la distancia de todos los valores respecto de la media, esa suma da cero. 2) Si se toman una cantidad cualesquiera de conjuntos de valores, cada uno con su respectiva media, la media del conjunto general es igual a la suma de cada una de las un conjunto de valores de una variable a partir de tomar la distancia de las observaciones a un valor cualquiera (pertenezca o no al recorrido de la variable) 4) si a un conjunto de observaciones de una variable se le realiza una operacin matemtica usando un valor constante, entonces la media del nuevo grupo de valores as obtenidos es igual a la aplicacin de la misma operacin matemtica usando ese valor constante sobre la media original.

    La Media

  • El clculo de la Media Dado un conjunto de observaciones

    la media se representa mediante y se obtiene dividiendo la suma de todos los datos por el nmero de ellos, es decir:

    La interpretacin de la media como centro (o punto de equilibrio) de los datos se apoya en una propiedad que afirma que la suma de las desviaciones

    de un conjunto de observaciones a su media es igual a cero; es decir, puede probarse que

  • La media aritmtica de un conjunto de datos es el cociente entre la suma de todos los datos y el nmero de estos. Ejemplo: las notas de Alberto el ao pasado fueron:5, 6, 4, 7, 8, 4, 6 La nota media de Juan es: Nota media = que suman 40Hay 7 datos

  • Clculo de la media aritmtica cuando los datos se repiten. Ejemplo. Las notas de un grupo de alumnos fueron:Datos por frecuenciasTotal de datos1. Se multiplican los datos por sus frecuencias absolutas respectivas, y se suman.2. El resultado se divide por el total de datos.

    Notas

    Frecuencia

    absoluta

    Notas x

    F. absoluta

    3

    5

    15

    5

    8

    40

    6

    10

    60

    7

    2

    14

    Total

    25

    129

  • Mediana

    La mediana, a diferencia de la media no busca el valor central del recorrido de la variable segn la cantidad de observaciones, sino que busca determinar el valor que tiene aquella observacin que divide la cantidad de observaciones en dos mitades iguales. Por lo tanto es necesario atender a la ordenacin de los datos, y debido a ello, este clculo depende de la posicin relativa de los valores obtenidos. Es necesario, antes que nada, ordenar los datos de menor a mayor (o viceversa).

    en caso que N sea impar

  • La mediana de un conjunto de datos es un valor del mismo tal que el nmero de datos menores que l es igual al nmero de datos mayores que l. Los pesos, en kilogramos, de 7 jugadores de un equipo de ftbol son:Ejemplo:72, 65, 71, 56, 59, 63, 721. Ordenamos los datos:56, 59, 63, 65, 71, 72, 722. El dato que queda en el centro es 65.La mediana vale 65. Si el nmero de datos fuese par, la mediana es la media aritmtica de los dos valores centrales.Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es: Caso:

  • ModaLa moda, es aquel dato, aquel valor de la variable que ms se repite; es decir, aquel valor de la variable (que puede no ser un nico valor) con una frecuencia mayor.

  • La moda de un conjunto de datos es el dato que ms se repite.Una zapatera ha vendido en una semana los zapatos que se reflejan en la tabla:Ejemplo.La moda es 41. El nmero de zapato ms vendido, el dato con mayor frecuencia absoluta, es el 41.Lo compran 35 personas

    N de calzado

    38

    39

    40

    41

    42

    43

    44

    45

    N de personas

    16

    21

    30

    35

    29

    18

    10

    7

  • Cuartil, Quintiles, Deciles, Percentiles

    La mediana, como vimos, separa en dos mitades el conjunto ordenado de observaciones. Podemos a su vez subdividir cada mitad en dos, de tal manera que resulten cuatro partes iguales. Cada una de esas divisiones se conoce como Cuartil y lo simbolizaremos mediante la letra Q agregando un subndice segn a cual de los cuatro cuartiles nos estemos refiriendo.Se llama primer cuartil (Q1) a la mediana de la mitad que contiene los datos ms pequeos. Este cuartil, corresponde al menor valor que supera o que deja por debajo de l a la cuarta parte de los datos.Se llama tercer cuartil (Q3) a la mediana de la mitad formada por las observaciones ms grandes. El tercer cuartil es el menor valor que supera o que deja por debajo de l a las tres cuartas partes de las observaciones.Con esta terminologa, la mediana es el segundo cuartil (Q2) y el cuarto cuartil (Q4) coincide con el valor que toma el ltimo dato, luego de ordenados.

  • Cuartiles

    DATOS ORDENADOS MIN Q1 Q2 Q3 MAX

    Son 3 valores que dividen al conjunto de datos ordenados en forma ascendente en 4 partes iguales. Primer (Q1), segundo (Q2) y tercer (Q3) cuartil. A cada uno de ellos corresponde 25 % de los datos.

    25%25%25%25%

  • Uso de los cuartiles Para indicar el porcentaje igual o menor que el valor de un cuartil.Para construir la curva endmicaPara describir el 50% central de las observacionesElaboracin de grafico de cajas

  • Medidas de dispersinRango o amplitud: la diferencia entre el valor mximo y mnimo

    MximoMnimoRangoM11000100M2802060

  • DatosM30 5 5 5 10M40 1 5 9 10

    mediamedianaRango55105510

  • M32010006070M46020806030

    MediamedianaM35060M45060

    *****

    0102030405060708090100

  • Media GeomtricaLa media geomtrica es la raz ensima del producto de todos los valores de la serie.Media ArmnicaLa media armnica se define como el recproco de la media aritmtica de los recprocos de los valores.y reacomodando la frmula se tiene:

  • Medidas de DispersinEl desvo estndarEs posible identificar conjuntos de datos que a pesar de ser muy distintos en trminos de valores absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es la concentracin o dispersin alrededor de la media.

    Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que todas las desviaciones sean positivas. La raz cuadrada del promedio de estas cantidades recibe el nombre de desvo estndar, o desviacin tpica y es representada por la siguiente frmula:

  • A mayor valor del coeficiente del desvo estndar, mayor dispersin de los datos con respecto a su media. Es un valor que representa los promedios de todas las diferencias individuales de las observaciones respecto a un punto de referencia comn, que es la media aritmtica. Se entiende entonces que cuando este valor es ms pequeo, las diferencias de los valores respecto a la media, es decir, los desvos, son menores y, por lo tanto, el grupo de observaciones es ms homogneo que si el valor de la desviacin estndar fuera ms grande. O sea que a menor dispersin mayor homogeneidad y a mayor dispersin, menor homogeneidad.

    La VarianzaEl cuadrado de la desviacin estndar recibe el nombre de varianza y se representa por . La suma de los cuadrados de los desvos de la totalidad de las observaciones, respecto de la media aritmtica de la distribucin, es menor que la suma de los cuadrados de los desvos respecto de cualquier otro valor que no sea la media aritmtica. Si observamos, veremos que la varianza no es ms que el desvo estndar al cuadrado. Precisamente la manera de simbolizarla es. Por lo mismo, el desvo estndar puede definirse como la raz cuadrada de la varianza

  • Aqu tenemos 9 rectngulos cuya altura es de 8 centmetros (y todos tienen la misma base).Existe alguna variacin respecto de su altura entre estos rectngulos?Cul es el promedio de la altura de estos rectngulos?= 8

  • El quinto rectngulo y el octavo rectngulo en un acto de rebelda cambiaron su altura. El quinto rectngulo, ahora de color rojo, mide 10 centmetros, y el octavo rectngulo, de color azul, mide 6 centmetros?Cul es el nuevo promedio de estos 9 rectngulos?= 8... el mismo promedio! Pero... ha habido variacin?

  • El rectngulo rojo tiene +2 centmetros sobre el promedio, y el rectngulo azul tiene 2 centmetros bajo el promedio. Los otros rectngulos tienen cero diferencia respecto del promedio.Si sumamos estas diferencias de la altura respecto del promedio, tenemos0 + 0 + 0 + 0 + 2 + 0 + 0 2 + 0= 0Este valor nos parece indicar que no ha habido variabilidad! Y sin embargo, ante nuestros ojos, sabemos que hay variacin.

  • Una forma de eliminar los signos menos de aquellas diferencias que sean negativas, esto es de aquellos mediciones que estn bajo el promedio, es elevar al cuadrado todas las diferencias, y luego sumar...02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 = 8Y este resultado repartirlo entre todos los rectngulos, es decir lo dividimos por el nmero de rectngulos que es 9= 0,89

  • Se dice entonces que la varianza fue de 0,89Observemos que las unidades involucradas en el clculo de la varianza estn al cuadrado. En rigor la varianza es de 0,89 centmetros cuadrados. De manera que se defineLa raz cuadrada de la varianza se llama desviacin estndar

  • Que la desviacin estndar haya sido de 0,943 significa que en promedio la altura de los rectngulos variaron (ya sea aumentando, ya sea disminuyendo) en 0,943 centmetros.Es claro que esta situacin es en promedio, puesto que sabemos que los causantes de la variacin fueron los rectngulos quinto y octavo. Esta variacin hace repartir la culpa a todos los dems rectngulos que se portaron bien. La desviacin estndar mide la dispersin de los datos respecto del promedio

  • Cul es la varianza y la desviacin estndar de las alturas de los rectngulos?En primer lugar debemos calcular el promedio= 7,44Luego debemos calcular la varianza

  • 0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,5629= 2,469Este es el valor de la varianza

  • Si la varianza fue de 2,469, entonces la desviacin estndar es de... Lo que significa que, en promedio, los rectngulos se desviaron ms o menos (ms arriba o ms abajo) en 1,57 centmetros.

  • Para entender la varianza necesariamente debe saber:SumarRestarMultiplicarDividirPotencia de orden 2Raz cuadradaY es claro que esto no es suficiente (salvo que queramos que aprenda de memoria los clculos). Necesitamos estimular su imaginacin para que vea la variabilidad existente en la naturaleza.Entregue una lista de fenmenos en que un mismo atributo tenga variabilidad si se mide este atributo a un nmero de individuos u objetos.

  • Coeficiente de Variacin PearsonMedida de variabilidad relativa: se usa para comparar la variabilidad entre dos o mas muestras medidas en las mismas unidades o noSi el coeficiente es:50% muy alta

  • Poblacin ( parmetros: X; DS)Muestra(estimadores: x ,s )

  • Un Parmetro es una caracterstica numrica de la poblacin (se representan con letras griegas)Un Estimador a una caracterstica numrica de la muestra ( se representan con letras latinas)

    DEFINICIONES

  • Porque se usa la media junto con la desviacin estndar en el anlisis de datos

    Se requiere expresar una medida que represente a todos los datos (media) pero al mismo tiempo se desea expresar la variacin de los mismos respecto a esa medida de tendencia central

  • ****