estadisticas descriptivas

11
Estadisticas Descriptivas Como escoger la medidas de análisis a utilizar El propósito de estudio ( descriptivo comparativo) El número de variables a analizar La escala de clasificación El número de individuos estudiados Técnicas de análisis en estudios descriptivos Distribuciones de frecuencia( una escala) En escala cualitativa y cuantitativa discreta Frecuencias relativas:Tasas, Porcentajes, Proporciones .Razones Distribuciones de frecuencia( una escala) En escala cuantitativa:Tendencia central y Medidas de dispersión Datos de asociación: +Dos escalas cualitativas: frecuencias relativas +Escala mixta: correlaciones regresiones Análisis univariado en escala cualitativa Que son valores relativos? Relación entre dos valores absolutos Permite la relación entre diferentes realidades. Frecuencias relativas de mayor uso Razones: Es el valor que se obtiene dividiendo una cantidad por otra. Características de las razones: +Los valores del numerador y el denominador son independientes +Ninguno esta contenido en el otro

Upload: jhoan

Post on 26-Sep-2015

214 views

Category:

Documents


2 download

DESCRIPTION

estadistica

TRANSCRIPT

Estadisticas Descriptivas Como escoger la medidas de anlisis a utilizarEl propsito de estudio( descriptivo comparativo)El nmero de variables a analizarLa escala de clasificacin El nmero de individuos estudiadosTcnicas de anlisis en estudios descriptivosDistribuciones de frecuencia( una escala)En escala cualitativa y cuantitativa discretaFrecuencias relativas:Tasas, Porcentajes, Proporciones .Razones Distribuciones de frecuencia( una escala)En escala cuantitativa:Tendencia central y Medidas de dispersin Datos de asociacin: +Dos escalas cualitativas: frecuencias relativas+Escala mixta: correlaciones regresiones Anlisis univariado en escala cualitativa Que son valores relativos?Relacin entre dos valores absolutos Permite la relacin entre diferentes realidades.Frecuencias relativas de mayor usoRazones:Es el valor que se obtiene dividiendo una cantidad por otra.Caractersticas de las razones:+Los valores del numerador y el denominador son independientes+Ninguno esta contenido en el otro Ejemplo de razn: Razn de masculinidad: R=Total de hombre Total de Mujeres Ejemplo de razones R= 180 H con malaria = 3 60 Mujeres con Malaria Razn de masculinidad de casos de malaria 3 hombres por mujer a nivel regional durante el 2.000ProporcionesEs un caso especial de razn en la cual el numerador esta formada por parte de los individuos del denominador. Proporcin: es un cociente de dos variables, el numerador esta contenido en el denominador.La suma de las categoras que componen las proporciones no puede ser mayor de 1 Ejemplos de proporciones Proporcin de establecimiento que tienen insumos del total de establecimientos visitados P= # de establecimientos con insumos Total de establecimiento TasasEs una razn que expresa cambio de una cantidad con respecto a la otra cantidad.Caractersticas de las tasas:Toma en cuento la variable tiempo.Expresa la dinmica del evento.Es la magnitud del cambio de la variable que mide un evento por unidad de cambio de otra( el tiempo), en relacin con la poblacin que se encuentra en riesgo de presentar el evento. Tipos de tasas Tasas brutas: Se calculan para toda la poblacin.Ejemplo: tasa de mortalidad general. Interpretacin de las tasas generalesPrevalencia de tuberculosis:P=#de casos de tuberculosis * K Poblacin a la mitad del periodoEjemploEn un censo realizado en el ao 2002, en la localidad A con 5000 habitantes, se encontraron 12 casos de tuberculosis, calcule la tasa de prevalencia de tuberculosis P por Tuberculosis: 12 * 1000=2 5000Medidas de tendencia central Las medidas de tendencia central corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos. Ellas permiten analizar los datos en torno a un valor central. Entre stas se encuentran la media aritmtica, la moda y la mediana.Se aplica en caso de tener variables cuantitativas continuas o discretas. Media aritmticaEs el centro de gravedad de un conjunto de datos.Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. EjemploMedia aritmtica

( X )

suma de todos los valore x1 + x2 + x3 + x4 + ..

numero total de datos = n

Propiedades de la media aritmtica Depende de las unidades de medida. Es sensible a la presencia de valores extremos.

Ejemplos de media aritmtica

Ventas y gastos en exmenes de laboratorio clnico privado

MedianaEs el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual nmero de valores antes y despus de l en un conjunto de datos agrupados

Propiedades de la mediana Depende de las unidades de medida. Es insensible a la presencia de valores extremos. Coincide con la media si la distribucin es simtrica Como calcular la Mediana Ordenar los datos. Sumar al total de observaciones uno y dividirlo entre dos. El resultado indica la posicin de la mediana.Ejemplo de Mediana Ventas y gastos en exmenes de laboratorio clnico privado

ModaEs la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos, o sea, cual se repite ms

Caracteristicas de la Moda

Cuando en los datos existe una sola moda es unimodal. Si observamos dos modas en la muestra decimos que se presenta una distribucin bimodal lo que indica que existen dos poblaciones mezcladas. Si presenta tres o mas modas es plurimodal e indica sub- poblaciones con comportamientos particulares en la variableEjemplo de ModaVentas y gastos en exmenes de laboratorio clnico privado

n

Medidas de DispersionVARIANZA (S2 2 ):La varianza es una medida de dispersin relativa a algn punto de referencia. Ese punto de referencia es la media aritmtica de la distribucin. Ms especficamente, la varianza es una medida de que tan cerca, o que tan lejos estn los diferentes valores de su propia media aritmtica. Cuando ms lejos estn las Xi de su propia media aritmtica, mayor es la varianza; cuando ms cerca estn las Xi a su media menos es la varianza VARIANZA ( s2Es el promedio del cuadrado de las distancias entre cada observacin y la media aritmtica del conjunto de observaciones. S2=(X-X) 2 NCalculo de Varianza Xi ( Xi - X)=d d2

18(18 25.5)=-7.4(-7.4)2=54.76

23(23 25.5)=-2.4(-2.4)2= 5.76

25(25 25.5)=-0.4(-0.4)2= 0.16

27(27 25.5)= 1.6( 1.64)2= 2.16

34(34 25.5)= 8.6( 8.6)2 =73.96

Total = 137.20

S2=(X-X) 2 =137,20/5=27.4 aos N DESVIACIN TPICA (S):La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica que se define como la raz cuadrada positiva de la varianzaS= S 2 S= 27,4= 5,23 aos RECORRIDO O RANGO MUESTRAL (Re)Es la diferencia entre el valor de las observaciones mayor y el menor. Re = xmax xmin= 34-18= 16 aos Desventaja en el calculo del rangoLa principal desventaja del recorrido es que slo esta influenciado por los valores extremos, puesto que no cuenta con los dems valores de la variable. Por tal razn, siempre existe el peligro de que el recorrido ofrezca una descripcin distorsionada de la dispersin.COEFICIENTE DE VARIACIN DE PEARSONCuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variacin de Pearson que se define como el cociente entre la desviacin tpica y el valor absoluto de la media aritmtica.CV= S X CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.EJEMPLO:Se realiza la estimacin del tiempo en das que trascurre para la entrega de los resultados de exmenes de hormonas en 10 laboratorios de la ciudad de Maracaibo, obteniendo los siguientes datos:21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media, mediana, moda, varianza y desviacin tpica, rango. Interprete los resultados. Resultados X=52,3 das Md=60 das Mo= 60 das S2=(X-X) 2 =4276,1= 427,1 N 10Re = 80-15=65 das CV=20,66/52,3 das =0,39 S=427,1 = 20,66 das Interpretacin un examen de hormona en los laboratorios de Maracaibo investigado pueden tardar entre 31,64 das a 72,92 das Calculo de VARIANZA ( s2 )Observacin(x) X-X=d d 2

15 15-52,3= -37,3 1391.29

21 21-52,3= -31,3 979,69

32 32-52,3= -20,3 412,09

59 59-52,3= 6,7 44,89

60 60-52,3= 7,7 59,29

60 60-52,3= 7,7 59,29

61 61-52,3= 8,7 75,69

64 64-52,3= 11,7 136,89

71 71-52,3= 18,7 349,69

80 80-52,3=27,7 767,29

4276,1

Medidas de Dispersion Percentiles Se simbolizan con la letra (p): Son medidas de dispersin y posicin que nos indica la dispersin de las observaciones que se encuentran por debajo de l.Formula: P(X)=X [ (N + 1)/100]Cuartiles Se simboliza mediante la letra Q y son aquellos valores de la varianza que en una serie ordenada y creciente deja por debajo de si el 25%, 50%, 75% y 100% de las observaciones que corresponden respectivamente al Q1, Q2, Q3,Q4Formula: QX= X[(N +1)/4]Tipos de variables en las que puede aplicarse este tipo de medidas de dispersinVariable cualitativas ordinales y cuantitativas discretas o continuos.RELACIONES ENTRE CURTILES Y PERCENTILES P50=Q2=MdP100=Q4 Calculo de percentiles y cuartilesDada la serie 0, 8,1, 4,6, 11,2 calcular los cuartiles 1 y 3 as como la mediana.1.Ordenar la serie 0, 1,2, 4,6,8,112. Se calcula mediante la formula la posicin de los cuartiles. QX= X[(N +1)/4] Q1= 1[(7 +1)/4]=2 indica que en la posicin 2 se encuentra el cuartil uno es decir Q1=1Q3= 3[(7 +1)/4]=6 Q3=8Md=(N+1)/2=4 Md=4