Capítulo
Forma de una
distribución y
datos
© 2010 Pearson Prentice Hall. All rights reserved
3 2
Histogramas y sesgo
• Dos características presentes en una
distribución de frecuencias y que se
pueden observar en un histograma
– Simetría: cuando la mayor cantidad de datos
se acumulan en el centro del histograma.
– Sesgo o asimetría se refiere al grado en que
los datos tienden a concentrarse en los
valores inferiores al promedio, o en los
valores superiores a éste.
© 2010 Pearson Prentice Hall. All rights reserved 2-3
Forma de un histograma
EJEMPLO Identificar la forma de la distribución
Identifcar la forma del siguiente histograma del Old Faithful.
© 2010 Pearson Prentice Hall. All rights reserved 2-4
Como la mayor parte de los datos se acumulan en el lado derecho del
histograma decimos que muestra sesgo negativo o que está sesgado
hacia la izquierda.
EJEMPLO Interpretar un histograma
2-5
Se realizó un experimento en el que dos dados justos fueron arrojados 100
veces. En cada tirada, se anotó la cantidad de puntos mostrados en los
dados.
1. ¿Cuál fue el resultado más
frecuente del experimento?
2. ¿Cuál fue el menos frecuente?
3. ¿Cuántas veces se observa un
3?
4. ¿Cuántas veces más se
observó el 5 que el 4?
5. Determinar el porcentaje de
veces que se observó un 7.
6. Describir la forma de la
distribución.
EJEMPLO Interpretar un histograma
2-6
Un vendedor de autos registra el número de autos que vende cada semana
durante el último año. El siguiente histograma de frecuencias muestra los
resultados.
1. ¿Cuál fue el número de autos
que más frecuentemente se
vendió?
2. ¿Durante cuántas semanas
vendió dos autos?
3. Determinar el porcentaje del
tiempo que vendió 2 autos?
4. Describir la forma de la
distribución. en forma de
campana
El punto medio de la clase o la marca de la clase se
determina sumando los límite inferiores de dos clases
consecutivas y dividiendo el resultado entre 2.
Un polígono de frecuencia se construye localizando para
cada clase el par ordenado compuesto por
(punto medio, frecuencia)
Luego, se unen los puntos consecutivos con segmentos de
recta.
© 2010 Pearson Prentice Hall. All rights reserved 2-7
Otras gráficas
Tiempo
entre
erupciones
Punto medio
de la clase
(marca)
Frecuencia Frecuencia
Relativa
670 – 679 2 0.0444
680 – 689 0 0
690 – 699 7 0.1556
700 – 709 9 0.2
710 – 719 9 0.2
720 – 729 11 0.2444
730 – 739 7 0.1556
© 2010 Pearson Prentice Hall. All rights reserved 2-8
Datos de Old Faithful
Tiempo
entre
erupciones
Punto medio
de la clase
(marca)
Frecuencia Frecuencia
Relativa
670 – 679 675 2 0.0444
680 – 689 685 0 0
690 – 699 695 7 0.1556
700 – 709 705 9 0.2
710 – 719 715 9 0.2
720 – 729 725 11 0.2444
730 – 739 735 7 0.1556
0
2
4
6
8
10
12
665 675 685 695 705 715 725 735
Fre
cu
en
cia
Tiempo entre erupciones
Tiempo (segundos)
Polígono de Frecuencia
© 2010 Pearson Prentice Hall. All rights reserved 2-9
En Excel, entramos los datos, resaltamos las columnas y elegimos
insertar bajo Chart un Scatterplot.
0
0.05
0.1
0.15
0.2
0.25
0.3
665 675 685 695 705 715 725 735
Fre
cu
en
ca r
ela
tiva
Tiempo entre erupciones
Tiempo (segundos)
© 2010 Pearson Prentice Hall. All rights reserved 2-10
Polígono de Frecuencia (frecuencia relativa)
Una distribución de frecuencias acumuladas muestra la
frecuencia acumulada en cada categoría.
• datos discretos: muestra el número total de
observaciones que son menor o igual a la categoría
• datos contínuos: muestra el número total de
observaciones que son menor o igual al límite
superior de la clase.
Una distribución de frecuencias relativas acumuladas
muestra la proporción acumulada (porciento acumulado) de
observaciones menores o iguales a la categoría. 2-11
Distribución de frecuencias acumuladas
La frecuencia total de todos los valores menores o iguales
al límite superior de una clase se conoce como la
frecuencia acumulada .
© 2010 Pearson Prentice Hall. All rights reserved 2-12
Datos de Old Faithful
• La ojiva es una gráfica que representa la
frecuencia acumulada o la frecuencia relativa
acumulada para cada clase.
• La ojiva se construye localizando, para cada
clase, el par ordenado compuesto por
(límite superior de la clase, frecuencia acumulada)
• Luego, se unen los puntos consecutivos con
segmentos de recta.
• Un segmento de línea adicional se dibuja
conectando el límite superior de la clase que
precedería a la primera clase (si existiera).
© 2010 Pearson Prentice Hall. All rights reserved 2-13
© 2010 Pearson Prentice Hall. All rights reserved 2-14
Datos de Old Faithful
689
699
709
719
729
739
679
La Ojiva
2-15
0
0.2
0.4
0.6
0.8
1
1.2
669 679 689 699 709 719 729 739
Fre
cu
en
cia
ac
um
ula
da
Tiempo (segundos)
Tiempo entre erupciones
En Excel, entramos los datos, resaltamos las columnas y elegimos
insertar bajo Chart un Scatterplot.
No olvide
añadir un
par
ordenado
adicional a
su tabla.
Ojiva – frecuencia relativa
© 2010 Pearson Prentice Hall. All rights reserved 2-16
0
0.2
0.4
0.6
0.8
1
1.2
669 679 689 699 709 719 729 739
Fre
cu
en
cia
re
lati
va
Tiempo (segundos)
Tiempo entre erupciones
Gráficas engañosas
© 2010 Pearson Prentice Hall. All rights reserved 2-17
• Las gráficas bien diseñadas son herramientas
muy potentes para la visualización de grandes
cantidades de datos complejos.
• Ayudan a convertir la magnitud de información
que hay disponible en la actualidad en
conocimiento.
• Presentamos errores comunes que se deben
evitar para no producir estadísticas
engañosas.
Gráficas engañosas
© 2010 Pearson Prentice Hall. All rights reserved 2-18
Escalas y manipulación de los ejes
• El mensaje de una gráfica puede ser alterada
cambiando la escala de la gráfica.
• Por ejemplo, los datos en las dos gráficas a
continuación son idénticas, pero la escala del
eje-y cambia la impresión de la magnitud de
las diferencias.
Gráficas engañosas
© 2010 Pearson Prentice Hall. All rights reserved 2-19
Escalas y manipulación de los ejes
La escala del eje-y en la segunda gráfica cambia
hace que se vea una mayor diferencia entre las
barras.
EJEMPLO Errores al representar la data
Los datos de la tabla a la derecha
representan las expectativas de vida
(en años) de residentes de los
Estados Unidos.
Observe las dos gráficas de los
datos. ¿Cuál es una gráfica
engañosa? ¿Por qué?
Year, x Life Expectancy, y
1950 68.2
1960 69.7
1970 70.8
1980 73.7
1990 75.4
2000 77.0
Source: National Center for Health Statistics
(a) (b)
© 2010 Pearson Prentice Hall. All rights reserved
2-20
Gráficas engañosas
2-21
Efectos Tridimensionales
• Esta gráfica de barras en 3D no tiene una escala en el eje
vertical
• Debido a la perspectiva, parece como si las ventas de
1995 fueran mucho mayores que los de cualquier otro año.
• En realidad, las ventas de1995 fueron iguales a los de
1997.
Source: http://faculty.atu.edu/mfinan/2043/section31.pdf
Gráficas engañosas
2-22
Efectos Tridimensionales
Sería mucho mejor dibujar una gráfica de barras en 2D,
como el que se muestra, con las etiquetas adecuadas en
cada eje.
Source: http://faculty.atu.edu/mfinan/2043/section31.pdf
EJEMPLO Errores al representar la data
Una encuesta que pidió a
los estudiantes de primer
año en varias
universidades de artes
liberales cuánto tiempo
semanal pasan en
preparación para sus clase.
Los resultados de la
encuesta de 2007 se
resumen a la derecha.
Hours Relative Frequency
0 0
1 – 5 0.13
6 – 10 0.25
11 – 15 0.23
16 – 20 0.18
21 – 25 0.10
26 – 30 0.06
31 – 35 0.05
Source:
http://nsse.iub.edu/NSSE_2007_Annual_Report/d
ocs/withhold/NSSE_2007_Annual_Report.pdf
© 2010 Pearson Prentice Hall. All rights reserved 2-23
(a) ¿Engañosa o no?
© 2010 Pearson Prentice Hall. All rights reserved 2-24
(b) ¿Engañosa o no?
© 2010 Pearson Prentice Hall. All rights reserved 2-25
Gráficas engañosas
2-26
Gráficas pictóricas
En primer lugar, note que
este pictograma no provee
una categoría para aquellas
personas que no poseen
una mascota.
Al ser las imágenes de
diferentes tamaños, parece
que más personas poseen
un caballo que cualquier otro
animal.
Gráficas engañosas
2-27
Gráficas pictóricas
¿Por qué se considera engañosa la gráfica de arriba?
Gráficas engañosas
2-28
Gráficas pictóricas
¿Por qué se considera engañosa la gráfica de arriba?
Guía para la construcción de gráficas no-engañosas
• Título de la gráfica y etiquetas en los ejes de gráficos
•Incluya las unidades de medida y una fuente de datos cuando sea
apropiado.
•Evite la distorsión.
•Minimizar la cantidad de espacio en blanco en el gráfico.
•Si las escalas son truncados, asegúrese de indicar claramente
esto al lector.
• Evite el desorden, como las líneas de división excesivos y fondos
innecesarios o imágenes. No distraiga al lector.
•Evite tres dimensiones. Los gráficos tridimensionales pueden
parecer agradables, pero distraer al lector ya menudo conducen a
una mala interpretación de la gráfica.
•No utilice más de un diseño en el mismo gráfico. A veces los
gráficos utilizan un diseño diferente en una porción de la gráfica
para llamar la atención a esa área.
•Evitar gráficos relativos que están desprovistos de datos o
escalas.
© 2010 Pearson Prentice Hall. All rights reserved 2-29