presentacion diapositivas estadisticas

22
REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN I.U.T. ANTONIO JOSÉ DE SUCRE PUERTO LA CRUZ EXTENSIÓN BARCELONA MEDIDAS DE CENTRALIZACIÓN Estudiante: Yorgelis Ramirez C.I:25.793.862 Escuela De Turismo: 75 Docente: Ranielina Rondon

Upload: yorge1996

Post on 09-Feb-2017

51 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Presentacion diapositivas estadisticas

REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN

I.U.T. ANTONIO JOSÉ DE SUCREPUERTO LA CRUZ EXTENSIÓN BARCELONA

MEDIDAS DE CENTRALIZACIÓN

Estudiante: Yorgelis Ramirez C.I:25.793.862Escuela De Turismo: 75

Docente:Ranielina Rondon

Page 2: Presentacion diapositivas estadisticas

MEDIDAS DE CENTRALIZACIÓN La media aritmética:Para calcular la media se suman todos los valores de los datos y se divide por el número total.Cuando los datos se repiten, es más fácil formar la tabla de frecuencias y sumar los productos de cada valor por las veces que se repite, después dividimos por el nº total de datos.

En el caso de variables agrupadas en intervalos, como en el ejemplo que vemos aquí, xi es la marca de clase o punto medio de cada intervalo.Si sumamos a todos los valores un mismo número, la media aumenta en esa cantidad.Si multiplicamos todos los valores por un mismo número la media queda multiplicada por el mismo número. Por ejemplo:Por ejemplo, el tiempo de espera (en minutos) de cinco clientes de un banco es: 3, 2, 4, 1 y 2.

Page 3: Presentacion diapositivas estadisticas

El tiempo medio de espera es:

LA MODA:La moda de una variable estadística es el valor más repetido, el que tiene mayor frecuencia absoluta.Si la variable es discreta se busca el valor de mayor frecuencia.Si los datos están agrupados, la clase de mayor frecuencia se llama clase modal. A veces se toma la marca de clase de la clase modal como valor de la moda, pero es más preciso utilizar la fórmula:

Donde: i es la clase modal, i-1 e i+1 la anterior y posterior respectivamente, ai es el extremo inferior, ci la amplitud del intervalo, ni la frecuencia absoluta.

Page 4: Presentacion diapositivas estadisticas

Por ejemplo :Se determina al jerarquizar los datos y hallar el número de observación [N + 1] / 2. Si hay un número par de observaciones, la mediana se extrapola como el valor que está justo en el medio entre el valor de las observaciones N / 2 y [N / 2] + 1.

Para estos datos ordenados, la mediana es 13. Es decir, el 50% de los valores es menor que o igual a 13 y el 50% de los valores es mayor que o igual a 13.

La mediana y los cuartiles:

Suponiendo que todos los datos están ordenados la mediana es el valor que ocupa la posición central, de modo que la mitad de los datos son menores y la otra mitad son mayores.Cuando la variable es discreta la mediana es el primer valor cuya frecuencia acumulada es mayor que n/2.Cuando los datos están agrupados, buscaremos la clase mediana que es la que su frecuencia absoluta acumulada sobrepasa la mitad de los datos (n/2). En ocasiones basta tomar como valor de la mediana la marca de clase de ésta pero obtenemos más precisión calculando:

Page 5: Presentacion diapositivas estadisticas

Así como la mediana divide la distribución en dos partes con el mismo número de datos, los cuartiles son los valores de la variable que la dividen en cuatro partes. El primer cuartil, Q1, deja a la izquierda el 25% de los datos, el segundo es la mediana y el tercero, Q3, deja el 75% de los datos a la izquierda.El cálculo se hace de forma análoga al de la mediana:

Por ejemplo:Cuando los datos contienen valores atípicos, la media recortada puede ser una mejor medida de la tendencia central que la media.

La línea azul representa la media original, la cual es influenciada notablemente por los valores extremos que se encuentran más a la derecha. La línea roja representa la media recortada, que se desplaza hacia la izquierda porque Minitab excluye los valores extremos en el 5% más alto de los datos.

Page 6: Presentacion diapositivas estadisticas

Procedimientos Estadísticos Referido Al uso y calculo De las Medidas De

Centralización : MEDIA: Media Aritmética, es la que se obtiene sumando los datos y

dividiéndolos por el número de ellos. Se aplica por ejemplo para resumir el número de pacientes promedio que se atiende en un turno. Otro ejemplo, es el número promedio de controles prenatales que tiene una gestante.

MEDIANA: Corresponde al percentil 50%. Es decir, la mediana divide a la población exactamente en dos. Por ejemplo el número mediana de hijos en el centro de salud “X” es dos hijos. Otro ejemplo es el número mediana de atenciones por paciente en un consultorio.

MODA: Valor o (valores) que aparece(n) con mayor frecuencia. Una distribución unimodal tiene una sola moda y una distribución bimodal tiene dos. Útil como medida resumen para las variables nominales. Por ejemplo, el color del uniforme quirúrgico en sala de operaciones es el verde; por lo tanto es la moda en colores del uniforme quirúrgico.

Page 7: Presentacion diapositivas estadisticas

MEDIDAS DE DISPERCION :

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.Ejemplo: se toman por ejemplo los tres conjuntos de datos que se observan a continuacion.Conjunto de datos 1: 0,5,10Conjunto de datos 2: 4,5,6Conjunto de datos 3: 5,5,5• Los tres (3) tienen una media de cinco (5)¿ Se debe por tanto concluir que los conjuntos de datos son similares ?Hay 2 tipos de medidas de dispersión , que son:1. Medidas dispersión absolutas2. Medidas dispersión relativa

Page 8: Presentacion diapositivas estadisticas

*rango o recorrido :El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.*Desviación mediaLa desviación respecto a la media es la diferencia entre cada valor de la variable estadística y la media aritmética.Di = x - xLa desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.La desviación media se representa por signo

Page 9: Presentacion diapositivas estadisticas

Ejemplo:Calcular la desviación media de la distribución:9, 3, 8, 8, 9, 8, 9, 18

* Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.

La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

Page 10: Presentacion diapositivas estadisticas

Ejemplo:Calcular la varianza para datos no agrupados:9, 3, 8, 8, 9, 8, 9, 18Calcular la varianza de la distribución de la tabla:

* Desviación típica: Se calcula como raíz cuadrada de la varianza.

*Coeficiente de variación de Pearson: se calcula como cociente entre la desviación típica y la media.

Ejemplo: Calcular la desviación media de la distribución:Ø Desviación típica o estandarLa desviación típica es la raíz cuadrada de la varianza.Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.La desviación típica se representa por σ.

Page 11: Presentacion diapositivas estadisticas

MEDIDAS DE POSICIÓN:

Cuartiles: Son los puntos que dividen a una distribución de valores en cuatro porciones iguales o intervalos. Se representan por , , y se ilustran en el esquema siguiente:Q1=25%, Q2=50% Q3=75% Q4=100% =1,2,3,4Ordenamos los datos de menor a mayor.Buscamos el lugar que ocupa cada cuartil mediante la expresión .

Lo cuartiles .son representados como . El primer cuartil considera el 25% de la información a su izquierda y el 75% a la derecha; para el segundo cuartil considera el 50% de la información tanto a la derecha como a la izquierda, este coincide con la mediana; el tercer cuartil considera el 75% de la información a la izquierda y el 75% a la derecha. El cuarto cuartil, que no fue indicado en el gráfico considera a toda la información. Por lo anterior podemos afirmar que los cuartiles son tres valores que dividen a la serie de datos en cuatro partes iguales, como se puede apreciar el gráfico.

Page 12: Presentacion diapositivas estadisticas

El cálculo para los cuartiles se determina a través de la siguiente expresión:donde :k Orden del cuartilLi=Límite inferior del intervalo que contiene al cuartilFa=Frecuencia acumulada considerada al intervalo donde se encuentraFrecuencia del intervalo que contiene el cuartiln=Número de medicionesi=Amplitud del intervalo.Ejemplo: A continuación, se ofrece un ejemplo de cómo calcular el primer y tercer cuartil (Q1 y Q3) en base a la cantidad de alumnos que han asistido a clases a un colegio privado durante la primera quincena de clases (15 días) entre lunes y viernes.En primer lugar se ofrecerán los datos estadísticos correspondientes a la asistencia, según sucedió esta:30 28 27 30 2530 29 29 27 2928 30 30 30 29De esta forma, a fin de calcular el Q1 y el Q3, lo primero que debe hacerse es ordenar de menor a mayor los datos:25 27 27 28 2829 29 29 29 3030 30 30 30 30

Page 13: Presentacion diapositivas estadisticas

*DECILES:Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.D5 coincide con la mediana.

Cálculo de los deciles:

En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.

Cálculo del primer decilCálculo del segundo decilCálculo del tercer decilCálculo del cuarto decilCálculo del quinto decilCálculo del sexto decilCálculo del séptimo decilCálculo del octavo decilCálculo del noveno decil.

Page 14: Presentacion diapositivas estadisticas

*Quintiles: Se representan con la letra K. Es el primer quintil. Separa a la muestra dejando el 20% de los datos a su izquierda.Es el segundo quintil. Es el valor que indica que el 40% de los datos son menores.Es el tercer quintil. Indica que el 60% de los datos son menores que él.Es el cuarto quintil. Separa al 80% de los datos del otro 20%.

*Percentiles O Centiles:Se representan con la letra C.Es el percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que él y el 100-i % restante son mayores.

Cuando los datos no están agrupados en intervalos, los cuartiles, así como el resto de las medidas de posición, tienen un valor claro. Sin embargo, cuando tenemos una agrupación de los datos ya no es tan sencillo realizar el cálculo. Sí que resulta claro ver en cuál de los intervalos está el cuartil (quintil, decil o percentil) buscado, pero para calcular su valor exacto necesitaremos usar una fórmula.

Page 15: Presentacion diapositivas estadisticas

Ejemplo:Moda: 35Mediana: 38Promedio 38.96 120Cuartil 1 33 ∑ = =i 1Xi : 4675Cuartil 3 45Rango intercuartil 12Quintil 3 40Percentil 40 35

Page 16: Presentacion diapositivas estadisticas

RANGO :

Rango es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos de un conjunto.

Ejemplo: Hallar el rango de la siguiente serie de números: 4,5,7,9,10,12,15

Solución: el rango será la diferencia entre los valores extremos. Es decir, 15-4 = 11.

Page 17: Presentacion diapositivas estadisticas

Percentiles:

Los percentiles son los valores que dividen un conjunto ordenado de datos en cien partes iguales. Utilizamos la fórmula para el percentil k: Pk = k(n+1)/100.Principales características:Las distancias entre Centiles, expresadas en términos de las puntuaciones directas, NO son constantes, pero las áreas entre Centiles sí lo son.En distribuciones simétricas, las distancias entre Centiles son menores en la parte central de la distribución que en los extremos.Usos:Sus usos de los percentiles o tablas de crecimiento son cuadros de medidas que permiten valorar y comparar el crecimiento de una niña o un niño con relación a un rango estándar. Los parámetros que se miden son estatura, peso y circunferencia de la cabeza. Los médicos las utilizan fundamentalmente en los primeros años de vida.

Page 18: Presentacion diapositivas estadisticas

Desviaciones típicas:La desviación típica o desviación estándar (denotada con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos) es una medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.Ejemplo:1.Hallar la desviación media, la varianza y la desviación típica de la series de números siguientes:2, 3, 6, 8, 11.12, 6, 7, 3, 15, 10, 18, 5.2, 3, 6, 8, 11.

Media:

Desviación típica:

12, 6, 7, 3, 15, 10, 18, 5.

Page 19: Presentacion diapositivas estadisticas

Media:

Desviación típica:

Page 20: Presentacion diapositivas estadisticas

Varianza y coeficiente de variación:En estadística, cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la variable, se utiliza el coeficiente de variación.Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar. Por otro lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media dé, por tanto, un valor positivo. A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele representarse por medio de las siglas C.V.Ejemplo:Si usted es el inspector de control de calidad de una planta embotelladora de leche que embotella el producto en recipientes pequeños y grandes. Usted toma una muestra de cada producto y observa que el volumen medio de los recipientes pequeños es de una 1 taza, con una desviación estándar de 0.08 tazas, y el volumen medio de los recipientes grandes es 1 galón (16 tazas), con una desviación estándar de 0.4 tazas. Aunque la desviación estándar del recipiente de un galón es cinco veces mayor que la desviación estándar del recipiente pequeño, sus coeficientes de variación (COV) apoyan una conclusión diferente:

Page 21: Presentacion diapositivas estadisticas

Recipiente grande Recipiente pequeñoCV = 100 * 0.4 tazas / 16 tazas = 2.5 CV = 100 * 0.08 tazas / 1 tazas = 8

El coeficiente de variación del recipiente pequeño es más de tres veces mayor que el coeficiente de variación del recipiente grande. En otras palabras, aunque el recipiente grande tiene una mayor desviación estándar, el recipiente pequeño presenta una variabilidad mucho mayor con respecto a su media.

Características: El coeficiente de variación no posee unidades.El coeficiente de variación es típicamente menor que uno. Sin embargo, en ciertas distribuciones de probabilidad puede ser 1 o mayor que 1.

Para su mejor interpretación se expresa como porcentaje.Depende de la desviación típica, también llamada "desviación estándar", y en mayor medida de la media aritmética, dado que cuando ésta es 0 o muy próxima a este valor el C.V. pierde significado, ya que puede dar valores muy grandes, que no necesariamente implican dispersión de datos.

Page 22: Presentacion diapositivas estadisticas

El coeficiente de variación es común en varios campos de la probabilidad aplicada, como teoría de renovación y teoría de colas. En estos campos la distribución exponencial es a menudo más importante que la distribución normal. La desviación típica de una distribución exponencial es igual a su media, por lo que su coeficiente de variación es 1. La distribuciones con un C.V. menor que uno, como la distribución de Erlang se consideran de "baja varianza", mientras que aquellas con un C.V. mayor que uno, como la distribución hiperexponencial se consideran de "alta varianza". Algunas fórmulas en estos campos se expresan usando el cuadrado del coeficiente de variación, abreviado como S.C.V. (por su siglas en inglés).

Utilidad en la estadística:

La utilidad de la estadística ocupa el puesto que el coeficiente de variación no se basa en unidades, se puede utilizar en lugar de la desviación estándar para comparar la dispersión de los conjuntos de datos que tienen diferentes unidades o diferentes medias.Coeficiente de variación la utilidad que tiene en estadística, cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la variable, se utiliza el coeficiente de variación. Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar.