graficos estadisticos

13
UDH REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS 1 1. REPRESENTACION DE DATOS Y GRAFICOS ESTADISTICOS En los análisis estadísticos, es frecuente utilizar representaciones visuales complementarias de las tablas que resumen los datos de estudio. Con estas representaciones, adaptadas en cada caso a la finalidad informativa que se persigue, se transmiten los resultados de los análisis de forma rápida, directa y comprensible para un conjunto amplio de personas. Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, se emplean para tener una representación visual de la totalidad de la información. Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmente los hechos esenciales y compararlos con otros. 1.1 TIPOS DE DATOS: Cualitativos: Se refieren a cualidades o modalidades que no pueden expresarse numéricamente. Pueden ser: Ordinales: Si siguen un orden o secuencia (ejemplo: El abecedario, los meses del año). Categóricos: Si no siguen ningún orden (ejemplo: El estado civil de las personas: solteros, casados, viudos, divorciados y separados). Cuantitativos: Se refieren a cantidades o valores numéricos. Pueden ser: Discretos: Si toman valores enteros (0, 1, 2, 3...). Ejemplo: El número de hijos, el número de alumnos de una clase. Continuos: Si pueden tomar cualquier valor dentro de un intervalo. Ejemplo: La estatura o el peso de las personas. 2. SINTESIS DE DATOS Una vez organizados los datos en tablas y representados gráficamente, es útil sintetizarlos o resumirlos en medidas o números que permitan trabajar cómodamente y que contengan el máximo de información. Existen dos tipos de medidas que describen las características de la distribución de frecuencias de los valores de una variable: las medidas de centralización y de dispersión. 2.1Medidas de Centralización: Las medidas de centralización definen los valores de la variable en torno a los cuales tienden a concentrarse las observaciones. Son: media, mediana, moda y los cuartiles, deciles y percentiles.

Upload: kelvin-valverde-carhuaricra

Post on 08-Jul-2016

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

1

1. REPRESENTACION DE DATOS Y GRAFICOS ESTADISTICOS

En los análisis estadísticos, es frecuente utilizar representaciones visuales complementarias de las tablas que resumen los datos de estudio. Con estas representaciones, adaptadas en cada caso a la finalidad informativa que se persigue, se transmiten los resultados de los análisis de forma rápida, directa y comprensible para un conjunto amplio de personas.

Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, se emplean para tener una representación visual de la totalidad de la información. Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmente los hechos esenciales y compararlos con otros.

1.1 TIPOS DE DATOS:

Cualitativos: Se refieren a cualidades o modalidades que no pueden expresarse numéricamente. Pueden ser:

•Ordinales: Si siguen un orden o secuencia (ejemplo: El abecedario, los meses del año).

•Categóricos: Si no siguen ningún orden (ejemplo: El estado civil de las personas: solteros, casados, viudos, divorciados y separados).

Cuantitativos: Se refieren a cantidades o valores numéricos. Pueden ser:

•Discretos: Si toman valores enteros (0, 1, 2, 3...). Ejemplo: El número de hijos, el número de alumnos de una clase.

•Continuos: Si pueden tomar cualquier valor dentro de un intervalo. Ejemplo: La estatura o el peso de las personas.

2. SINTESIS DE DATOS

Una vez organizados los datos en tablas y representados gráficamente, es útil sintetizarlos o resumirlos en medidas o números que permitan trabajar cómodamente y que contengan el máximo de información. Existen dos tipos de medidas que describen las características de la distribución de frecuencias de los valores de una variable: las medidas de centralización y de dispersión.

2.1Medidas de Centralización: Las medidas de centralización definen los valores de la variable en torno a los cuales tienden a concentrarse las observaciones. Son: media, mediana, moda y los cuartiles, deciles y percentiles.

Page 2: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

2

2.1.1 Media: La media aritmética es la medida de centralización más conocida y utilizada. Se calcula sumando todos los valores observados y dividiendo por el número de observaciones de la muestra. Se representa como x.

Para datos no agrupados:

El promedio aritmético de un conjunto de valores (X1, X2, X3,….., Xn) es:

Ejemplo:

Durante los últimos 32 días el valor de las compras (soles) en periódicos fue:

El promedio aritmético del valor de las compras en periódicos es:

2.1.2 Mediana: Es al valor que ocupa la posición central de un conjunto de observaciones ordenadas. El 50% de las observaciones son mayores que este valor y el otro 50% son menores.

Para datos no agrupados:

La ubicación de la mediana de n datos ordenados se determina por: (n+1)/2.

Ejemplos.

En los 7 datos ordenados: {4, 5, 5, 6, 7, 8, 9}

La ubicación de la mediana es: (7+1)

2= 4, Luego el valor de la mediana: Me = 6.

En los 8 datos ordenados: {3, 4, 5, 5, 6, 7, 8, 9}.

La mediana se ubica en el lugar (8+1)

2= 4.5, Luego el valor de la mediana es: 𝑀𝑒 =(5+6)

2= 5.5

Page 3: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

3

2.1.3 La Moda: La moda es el valor que se observa con más frecuencia, el más repetido y sus características son:

Puede no existir o existir más de una moda. Su valor no se ve afectado por los valores extremos en los datos. Se utiliza para analizar tanto la información cualitativa como la cuantitativa. Es una medida inestable cuando en número de datos es reducido

Para datos no agrupados:

Por ejemplo. Durante los últimos 32 días el valor de las compras en periódicos fue:

Moda =Mo= 7.1; es el valor más frecuente, ocurre tres veces.

Ejemplo: 2, 2, 5, 5, 7, 7, 7, 7, 9, 9, 9, 10 Mo = 7 y 9 Serie bimodal.

Ejemplo: 6, 5, 6, 6, 3, 4, 6, 6, 7 Mo = 6 Serie Unimodal.

Ejemplo: 13, 15, 12, 11, 20, 22 No tiene Moda o se dice que cada dato es una moda.

2.1.4 Media Geométrica: La media geométrica simple �̅�𝐺 de n observaciones X1, X2, X3,….., Xn positivos, está dado por la raíz enésima del producto de los n valores observados. El promedio geométrico de los valores: (X1, X2, X3,….., Xn) es

Para datos no agrupados:

Ejemplo: Hallar la media geométrica de los números 3, 5, 8, 3, 5, 2.

Solución En este caso n = 6, entonces la media geométrica es:

2.1.5 Cuartiles, Deciles, Percentiles: Son medidas de localización, pero no central, sino que localizan otros puntos de una distribución. Los cuartiles dividen los datos en cuatro partes iguales, los deciles en diez partes iguales y los percentiles, en cien partes iguales. Por definición, el cuartil 2 coincide con el decil 5 y con el percentil 50, y todos ellos con la mediana.

Page 4: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

4

3. REPRESENTACION GRAFICA

Una vez obtenidos los datos es preciso mostrarlos de una forma ordenada y comprensible. La forma más sencilla es colocarlos en una Tabla, donde se muestran las variables, las categorías de cada variable y el número de eventos de cada categoría. En ciertas ocasiones, especialmente cuando trabajamos con un gran número de datos, las tablas no son prácticas y es necesario una mejor visión de los datos con una mirada rápida. Esto se consigue con los gráficos. La selección del gráfico dependerá del tipo de datos empleados. Comenzaremos con los gráficos para datos cuantitativos.

3.1 HISTOGRAMA: Se utiliza para variables cuantitativas continuas. En el eje x se muestran los datos de la variable, que por ser continuos requieren ser agrupados previamente en intervalos, y en el eje y se representa la frecuencia con la que aparece cada dato. La anchura del intervalo y la altura que alcanza determinan el área de cada intervalo, que es proporcional a la frecuencia de cada intervalo.

Da una idea muy aproximada de la forma de la distribución que sigue la variable

Ejemplo: El peso de un grupo de alumnos aparece recogido en la siguiente tabla:

.

Page 5: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

5

3.1.1 POLÍGONOS DE FRECUENCIAS: Utiliza la misma escala que el histograma, y se construye uniendo los puntos medios de la zona más alta de los rectángulos. También aquí lo más importante es el área existente debajo del polígono, que es igual al área del histograma correspondiente. En el polígono de frecuencias acumuladas, la línea representa la frecuencia de cada intervalo sumada a la de los intervalos anteriores. Es un método práctico para determinar percentiles.

Polígono de frecuencias sobre histograma para

representar variables continúas

Polígono de frecuencias acumuladas para

representar variables continúas

3.2 NUBE DE PUNTOS: Es un gráfico donde se muestran dos variables cuantitativas, una en el eje X y otro en él Y, mostrando los valores mediante puntos o símbolos.

Nube de puntos para describir la relación entre dos variables continúas

Page 6: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

6

Para los datos cualitativos, los más utilizados son:

3.3 DIAGRAMA DE BARRAS: Se utiliza para variables cualitativas y cuantitativas discretas, y se construyen de forma similar al histograma, pero las barras están separadas entre sí (indicando que la variable no ocupa todo el eje de abscisas, precisamente por ser discreta o cualitativa). El diagrama de barras compuesto representa dos o más variables en el mismo gráfico.

Ejemplo 1: Un estudio hecho en un conjunto de 25 personas con objeto de determinar su grupo sanguíneo ha conducido a los siguientes resultados:

A, B, A, A, A, AB, O, A, A, A, O, B, O, A, B, O, B, O, A, B, B, A, A, O, B.

Ejemplo 2: Las notas obtenidas por un grupo de alumnos en una prueba de matemáticas vienen resumida en la siguiente tabla

La orientación del gráfico puede ser:

Page 7: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

7

•Vertical: Las distintas categorías están situadas en el eje horizontal y las barras de frecuencias crecen verticalmente.

•Horizontal: las categorías se sitúan en el eje vertical y las barras crecen horizontalmente. Suelen usarse cuando hay muchas categorías o sus nombres son demasiado largos.

Las categorías pueden ordenarse alfabéticamente facilitando su búsqueda o por sus frecuencias facilitando la comparación de los datos. Veamos el siguiente ejemplo del porcentaje habitantes usuarios de internet del año 2007 por países (Fuente: Unión Internacional de Telecomunicaciones).

Se suele usar para:

♦Comparar magnitudes de varias categorías. ♦Ver la evolución en el tiempo de una magnitud concreta

Page 8: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

8

Tipos de gráficos de barras:

Sencillo: Contiene una única serie de datos.

Agrupado: Contiene varias series de datos y cada una se representa por un tipo de barra de un mismo color o textura.

Apilado: Contiene varias series de datos. La barra se divide en segmentos de diferentes colores o texturas y cada uno de ellos representa una serie.

Page 9: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

9

3.4 GRÁFICO CIRCULAR O DE SECTORES: Un gráfico de sectores es una representación circular de las frecuencias relativas de una variable cualitativa o discreta que permite, de una manera sencilla y rápida, su comparación.

El círculo representa la totalidad que se quiere observar en el ejemplo, total de viajeros hospedados en hoteles y cada porción, llamadas sectores, representan la proporción de cada categoría de la variable (en el ejemplo, tipo de hotel) respecto el total. Suele expresarse en porcentajes

Obtención de los ángulos por cada sector:

Frecuencia relativa = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎

𝑆𝑢𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠

Porcentaje = Frecuencia relativa X 100

Angulo = Frecuencia Relativa X 360°

Page 10: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

10

3.4 PICTOGRAMAS: Un pictograma es un gráfico que representa mediante figuras o símbolos las frecuencias de una variable cualitativa o discreta. Al igual que los gráficos de barras suelen usarse para comparar magnitudes o ver la evolución en el tiempo de una categoría concreta.

Tipos de pictogramas:

•Gráficas de barras cuyas barras están constituidas por símbolos o figuras distorsionadas que se adaptan a la longitud de la barra.

Gráficas de barras cuyas barras

están constituidas por símbolos

o figuras del mismo tamaño que

representan una cantidad

específica (a mayor frecuencia,

más acumulación de figuras)

Page 11: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

11

3.5 GRAFICO DE DISPERSIÓN: Un gráfico de dispersión muestra en un eje cartesiano la relación

que existe entre dos variables.

En algunos gráficos se dibuja la recta de regresión obtenida gracias a un método matemático: el ajuste lineal. Esta recta nos muestra más clara y rápidamente la tendencia de los puntos y, por tanto, la relación.

En el ejemplo se puede

apreciar que los países con

más producción agrícola

consumen más

fertilizantes nitrogenados.

Se observa en principio

una relación lineal positiva

Page 12: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

12

3.5 GRÁFICO DE CAJA: Sirve para representar variables cualitativas en escala ordinal y cuantitativa discretas. Se construye un rectángulo de altura igual al recorrido intercuartílico, dentro se traza un segmento en el punto correspondiente a la mediana y se define los valores adyacentes o bigotes: el valor adyacente inferior es el valor más pequeño de la distribución. El valor adyacente superior es la observación más grande de la serie. Los valores de la distribución que sean menores que el valor adyacente inferior o mayores que el superior se denominan observaciones extremas o “outliers”

.

Diagramas de caja (boxplot) para variables cualitativas ordinales y cuantitativas discretas

4. CONSIDERACIONES IMPORTANTES

Podemos considerar la estadística descriptiva como el conjunto de técnicas para ordenar y representar los datos en tablas, y resumirlos mediante el cálculo de diferentes medidas. Por tanto, podemos distinguir tres apartados:

-Tabulación, que consiste en ordenar los datos originales y presentarlos de forma que, sin perder información, sea más fácil conocer la distribución de los mismos. El resultado final es una tabla donde se muestran los valores de la variable que se tabula y sus frecuencias.

-Cálculo de medidas para resumir la distribución. Pueden ser de tendencia central, que indican alrededor de que valores se agrupan los datos observados; y de variabilidad o dispersión, que indican si los valores de la variable están muy dispersos o concentrados.

-Representación gráfica, que facilita un análisis visual de los datos y permite sacar conclusiones acerca de las características globales de la distribución

Page 13: Graficos estadisticos

UDH

REPRESENTACION DE DATOS Y GRAFICOS DESCRIPTIVOS

13