estadística y componentes

17
República Bolivariana de Venezuela Ministerio de Educación Cultura y Deportes Universidad de Carabobo - Núcleo la Morita Facultad de Ciencias Económicas y Sociales Maracay - Estado Aragua Estadística Y Componentes Integrantes: Uzcategui, Evert C.I.N° 20.819.236 PROF: Marcos Ugenio Villano Maracay, Julio del 2014. Introducción

Upload: evert-uzcategui

Post on 19-Jul-2015

74 views

Category:

Science


0 download

TRANSCRIPT

Page 1: Estadística y Componentes

República Bolivariana de Venezuela

Ministerio de Educación Cultura y Deportes

Universidad de Carabobo - Núcleo la Morita

Facultad de Ciencias Económicas y Sociales

Maracay - Estado Aragua

Estadística

Y

Componentes

Integrantes:

Uzcategui, Evert C.I.N° 20.819.236

PROF:

Marcos Ugenio Villano

Maracay, Julio del 2014.

Introducción

Page 2: Estadística y Componentes

En estadística denominamos gráficos a aquellas imágenes que, combinando la utilización De sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema De referencia (coordenadas), permiten presentar información cuantitativa.

La utilidad De los gráficos es doble, ya que pueden servir no sólo como sustituto a las tablas, sino que también constituyen por sí mismos una poderosa herramienta para el análisis De los datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino también para analizarla.

En este sentido la estadística utiliza cada uno de los aspectos de gráficos para cada tipo de datos, bien sea agrupado o no agrupado, constante o no constante.

En este trabajo solo nos vamos a centrar únicamente en los gráficos como vehículo de presentación de datos, sin abordar su otra faceta como herramienta de análisis.

Page 3: Estadística y Componentes

Gráfica

Una gráfica es una representación de datos, generalmente numéricos, mediante líneas, superficies o símbolos, para ver la relación que guardan entre sí. También puede ser un conjunto de puntos, que se plasman en coordenadas cartesianas, y sirven para analizar el comportamiento de un proceso, o un conjunto de elementos o signos que permiten la interpretación de un fenómeno. La estadística gráfica es una parte importante y diferenciada de una aplicación de técnicas gráficas, a la descripción e interpretación de datos e inferencias sobre éstos. Forma parte de los programas estadísticos usados con los ordenadores. Autores como Edward R. Tufte han desarrollado nuevas soluciones de análisis gráficos.

Existen diferentes tipos de gráficas, que se pueden clasificar en:

Gráficos de barras verticales

(Llamados por algúnos software de columnas)

Representan valores usando trazos verticales, aislados o no unos de otros, según la variable a graficar sea discreta o continua. Pueden usarse para representar:

• una serie

• dos o más series (también llamado de barras comparativas)

Page 4: Estadística y Componentes

Gráficos de barras horizontales

Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categoría son muy extensos.

• para una serie

• para dos o más series

Gráficos de barras proporcionales

Se usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos que componen un total.

Las barras pueden ser:

• Verticales

• Horizontales

Page 5: Estadística y Componentes

Gráficos de barras comparativas

Se utilizan para comparar dos o más series, para comparar valores entre categorías.

Las barras pueden ser:

• Verticales

• horizontales

Gráficos de barras apiladas

Se usan para mostrar las relaciones entre dos o más series con el total. Las barras pueden ser:

• verticales

• horizontales

Page 6: Estadística y Componentes

Gráficos de líneas

En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí.

Se pueden usar para representar:

• una serie

• dos o más series

Estos gráficos se utilizan para representar valores con grandes incrementos entre sí.

Gráficos circulares

Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar.

Se pueden ser:

• En dos dimensiones

• en tres dimensiones

Page 7: Estadística y Componentes

Gráficos de Áreas

En estos tipos de gráficos se busca mostrar la tendencia de la información generalmente en un período de tiempo.Pueden ser:

• Para representar una serie

• para representar dos o más series

• en dos dimensiones

• en tres dimensiones.

Cartogramas

Estos tipos de gráficos se utilizan para mostrar datos sobre una base geográfica. La densidad de datos se puede marcar por círculos, sombreado, rayado o color.

Gráficos Mixtos

En estos tipos de gráficos se representan dos o más series de datos, cada una con un tipo diferente de gráfico. Son gráficos más vistosos y se usan para resaltar las diferencias entre las series.

Pueden ser:

• en dos dimensiones

• en tres dimensiones.

Page 8: Estadística y Componentes

Histogramas

Estos tipos de gráficos se utilizan para representa distribuciones de frecuencias. Algún software específico para estadística grafican la curva de gauss superpuesta con el histograma.

Tipos de histograma

• Diagramas de barras simples: Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categoría que representa.

• Diagramas de barras compuesta: Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, las cuales se representan así; la altura de la barra representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad.

• Diagramas de barras agrupadas: Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, el cual es representado mediante un conjunto de barras como se clasifican respecto a las diferentes modalidades.

• Polígono de frecuencias: Es un gráfico de líneas que se usa para presentar las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor.

• Ojiva porcentual: Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.

Page 9: Estadística y Componentes

Otros Gráficos

En esta categoría se encuentran la mayoría de los gráficos utilizados en publicidad. Se los complementa con un dibujo que esté relacionado con el origen de la información a mostrar. Son gráficos llamativos, atraen la atención del lector.

Dispersograma

Los dispersogramas

Son gráficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.

Pictogramas

Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos.

Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen un pictograma.

Page 10: Estadística y Componentes

Pueden ser:

• En dos dimensiones

• En tres dimensiones.

Polígonos de frecuencia

Un polígono de frecuencia es un gráfico que se realiza a través de la unión de los puntos más altos de las columnas en un histograma de frecuencia (que utiliza columnas verticales para mostrar las frecuencias).

Los polígonos de frecuencia para datos agrupados, por su parte, se construyen a partir de la marca de clase que coincide con el punto medio de cada columna del histograma. Cuando se representan las frecuencias acumuladas de una tabla de datos agrupados, se obtiene un histograma de frecuencias acumuladas, que permite diagramar su correspondiente polígono.

Page 11: Estadística y Componentes

Por ejemplo: un polígono de frecuencia permite reflejar las temperaturas máximas promedio de un país en un periodo de tiempo. En el eje X (horizontal), pueden señalarse los meses del año (enero, febrero, marzo, abril, etc.). En el eje Y (vertical), se indican las temperaturas máximas promedio de cada mes (24º, 25º, 21º…). El polígono de frecuencia se crear al unir, con un segmento, todas las temperaturas máximas promedio.

Los polígonos de frecuencia se suelen utilizar cuando se desea mostrar más de una distribución o la clasificación cruzada de una variable cuantitativa continua con una cualitativa o cuantitativa discreta en un mismo gráfico.

El punto con mayor altura de un polígono de frecuencia representa la mayor frecuencia, mientras que el área bajo la curva incluye la totalidad de los datos existentes. Cabe recordar que la frecuencia es la repetición menor o mayor de un suceso, o la cantidad de veces que un proceso periódico se repite por unidad de tiempo.

Cálculo de frecuencias Ordenamos los datos contando los alumnos que han sacado un 0 han sido 2, un 1 han sido

3 y así sucesivamente. Construimos la tabla correspondiente:

N: número total de datos N = 30.

xi: variable estadística, nota del examen.

fi: frecuencia absoluta, número de veces que se repite una nota. El sumatorio nos da los datos totales N = 30.

Fi: frecuencia absoluta acumulada. F 2 = f 1 + f2= 2 + 3 = 5 F 3 = F 2 + f 3 = 5 + 1 = 6

hi: frecuencia relativa. Cociente f i / N

sumatorio (suma de todos los datos de la columna correspondiente)

x i f i F i h i = f i / N H i

0 2 2 2 /30 2/30

1 3 5 3/30 5/30

2 1 6 1/30 6/30

3 1 7 1/30 7/30

4 1 8 1/30 8/30

Page 12: Estadística y Componentes

5 3 11 3/30 11/30

6 2 13 2/30 13/30

7 5 18 5/30 18/30

8 7 25 7/30 25/30

9 5 30 5/30 30/30

30 1

Diagrama de barras de frecuencia absoluta y polígono de frecuencias

En el diagrama de barras vemos que la barra más alta es la correspondiente a la nota 8, la han obtenido 7 alumnos. La barra más baja se corresponde con las notas 2, 3 y 4 que sólo las han obtenido un alumno. El polígono de frecuencias es bastante irregular, sube entre las notas 0 y 1 (más alumnos). Es constante en las notas 2, 3, y 4. El pico más alto se corresponde con la nota 8, la más abundante, 7 alumnos es la moda.

Percentil

Representa el porcentaje de los casos de un grupo que alcanzó valores menores que el citado porcentaje. Por ej. Si decimos que una calificación de 127 tiene un rango percentil de 79

Page 13: Estadística y Componentes

significa que el 79% del grupo obtuvo una calificación menor que 127. El rango percentil se calcula dividiendo la frecuencia acumulada entre el total de datos (N) multiplicado por 100. Un rango percentil debe expresarse en relación a algún grupo de referencia. Por ejem. si una persona afirma que ha obtenido un rango percentil de 93 en una prueba de aptitud matemática, la interpretación depende del grupo de referencia:

Ese grupo puede estar constituido por individuos que únicamente han completado el sexto año de primaria.

El grupo de referencia puede estar formado por individuos que recibirán un doctorado en matemáticas.

Los percentiles representan los valores de la variable que están por debajo de un porcentaje, el cual puede ser una valor de 1% a 100% (en otras palabras, el total de los datos es divido en 100 partes iguales).

La notación empleada será:

Donde k es equivalente al porcentaje de datos acumulados, y Pk es el valor de la variable que representa dicho porcentaje. Por ejemplo, P5 es el valor de la variable que deja por debajo el 5% de los datos. P78 será entonces el valor que agrupa el 78% de los datos. Podemos concluir que P50 sería el valor que divide en dos parte iguales la cantidad de datos de la muestra o población siendo equivalente a la mediana. Traslademos el gráfico de barra a su respectiva tabla de frecuencia y tratemos de localizar los Percentiles expuestos en el ejemplo:

Nc Lm Ls f F h H

1 [ 5 15) 14 14 14,00% 14,00%

2 [15 25) 12 26 12,00% 26,00%

3 [25 35) 20 46 20,00% 46,00%

4 [35 45) 18 64 18,00% 64,00%

5 [45 55) 14 78 14,00% 78,00%

Page 14: Estadística y Componentes

6 [55 65) 12 90 12,00% 90,00%

7 [65 75] 10 100 10,00% 100,00%

TOTAL 100

100,00%

Podemos concluir fácilmente (con ayuda de las frecuencias acumuladas), que 14 personas (14% del total) están por debajo de los 15 años (podemos aproximarlo a 15 años), lo cual representaría al percentil 14:

El percentil 5 (P5) no puede ser calculado directamente, pero podemos concluir que dicho valor se encuentra en el primer intervalo, ya que este acumula el 14% de las personas. No ocurre lo mismo con el percentil 78 (P78) que aparece directamente en la tabla:

Nc Lm Ls f F h H

1 [ 5 15) 14 14 14,00% 14,00%

2 [15 25) 12 26 12,00% 26,00%

3 [25 35) 20 46 20,00% 46,00%

4 [35 45) 18 64 18,00% 64,00%

5 [45 55) 14 78 14,00% 78,00%

Page 15: Estadística y Componentes

6 [55 65) 12 90 12,00% 90,00%

7 [65 75] 10 100 10,00% 100,00%

TOTAL 100

100,00%

El 78% de las personas consultadas poseen una edad igual o inferior a los 55 años.

Ejemplo: Calculo de percentiles

A partir de la tabla de frecuencia anterior calcular el percentil 5 (P5)

SOLUCIÓN

PASO 1: Localizar en cuál de los intervalos de clase se encuentra el percentil

Como se había mencionado, el percentil 5 se encuentra en el primer intervalo.

Nc Lm Ls f F h H

1 [ 5 15) 14 14 14,00% 14,00%

2 [15 25) 12 26 12,00% 26,00%

3 [25 35) 20 46 20,00% 46,00%

4 [35 45) 18 64 18,00% 64,00%

5 [45 55) 14 78 14,00% 78,00%

6 [55 65) 12 90 12,00% 90,00%

Page 16: Estadística y Componentes

7 [65 75] 10 100 10,00% 100,00%

TOTAL 100

100,00%

PASO 2: Interpolar los datos para encontrar el percentil. En resumen tenemos que:

Límite Superior H

15,00 (Ls1) 14,00% (H1)

5,00 (Ls0) 0,00% (H0)

Diferencia10,00 14,.00%

En este caso, suponemos un intervalo adicional cuyo límite superior llamaremos Ls0

equivalente a 5 el cual agrupa 0% de los datos. Entre los dos límites superiores abarcan un total de 14% de los datos. Si queremos llegar al 5% de los datos, debemos incrementar el porcentaje en una cantidad igual.

10,00 14,00%

Incremento 5,00%

Para llegar al 5% de los datos, el límite 5 se debe aumentar en 3,57 unidades.

Cuadros Numéricos

Corresponde a una forma de expresar los datos (variables, indicadores, entre otros) de manera sintetizada y de fácil comprensión. Los cuadros numéricos deben cumplir con una serie de

Page 17: Estadística y Componentes

requisitos para que los resultados, en cuanto a la interpretación de la información que estos suministran, sea fácil de lograr .

Un cuadro numérico esta formado de: • Título: debe ser conciso e indicar el qué, dónde, cómo, y cuándo de la información, se

coloca en la parte superior, con letra mayúscula y centrada.

• Una columna principal en donde se anotan las categorías.

• Encabezados de columnas en donde se anotan el objeto de cada una de ellas.

• El cuerpo del cuadro, el cual contiene la información.

• Notas al pie: Se incluye información adicional o relevante que amplié la que aparece en el cuadro, además de la fuente.

Ejemplo: