estadÃstica a - organizaciÓn y presentacion de datos.pdf
TRANSCRIPT
M. Sc. Eder C. Vicuña Galindo 1
ORGANIZACIÓN Y PRESENTACIÓN
GRÁFICA DE DATOS
Objetivos:
• Confeccionar tablas de frecuencias para la organización de datos cualitativos y cuantitativos.
• Representar los datos bajo estudio en gráficos adecuados.
Organización y Representación de
Datos Cualitativos o Categóricos
• Ejemplo
A: Problemas de inestabilidad (no arranca, se cuelga,
etc,)
B: Problemas de incompatibilidad (tanto del hardware
como software)
C: Problemas de intermitencia (baja rendimiento, se
hace lento, etc,)
D: Problemas por falta de requerimientos (inadecuado
sistema operativo, reducida memoria RAM, etc,)
Continuación
A, A, C, D , B , A, C, A, B, D, C, A, A, B, B,
C, C, A, A, A, B, C, C, D, A, A, D, A, C, B,
Para un valor xi, i = 1 … n, donde n es el
número de datos, definimos las siguientes
frecuencias:
Frecuencia, fi,
Frecuencia relativa, fri
Frecuencia acumulada, Fi
Frecuencia acumulada relativa, Fri
Continuación …
Categoría de tipos de
fallas Frecuencia, f i
A 12
B 6
C 8
D 4
Total 30
Continuación …Gráfico de barras o
rectángulos
0 2 4 6 8 10 12 14
A
B
C
D
Tip
os d
e f
all
a
frecuencia
Continuación …Gráfico de barras o
rectángulos
Categoría de
tipos de fallas
T123 SV41
Frecuencia, f i Frecuencia, f i
A 12 9
B 6 5
C 8 9
D 4 7
Total 30 30
0 2 4 6 8 10 12 14
A
B
C
D
Tip
os d
e f
all
a
frecuencia
Marca T123 Marca SV41
Continuación …Gráfico de barras o
rectángulos
Continuación …Gráfico de barras o
rectángulos
Categoría
de tipos
de fallas
T123 SV41 C1Q2
f i fri f i fri f i fr i
A 12 0,40 9 0,30 7 0,39
B 6 0,20 5 0,17 3 0,17
C 8 0,27 9 0,30 6 0,33
D 4 0,13 7 0,23 2 0,11
Total 30 1 30 1 18 1
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
A B C D
tipos de falla
Fre
cu
en
cia
rela
tiva
Marca T123
Marca SV41
Marca C1Q2
Continuación …Gráfico de barras o
rectángulos
Gráficos Circulares
Categoría de
tipos de fallas
Frecuencia,
f i
Frecuencia
relativa, fri:
Ángulo del
sector, i
A 12 0.40 144°
B 6 0.20 72°
C 8 0.27 96°
D 4 0.13 48°
Total 30 1 360°
Gráficos Circulares …
12
6
8
4
A
B
C
D
Organización y Representación de Datos
Cuantitativos Discretos
• Los resultados obtenidos, como parte de una evaluación que
tenía un máximo de 5 en valores enteros, fueron: 2, 5, 1, 2, 0,
2, 1, 5, 1, 4, 3, 0, 5, 4, 4, 3, 3, 2, 4, 5.
Puntaje Frecuencia, f i Frecuencia relativa, fri
0 2 0,10
1 3 0,15
2 4 0,20
3 3 0,15
4 4 0,20
5 4 0,20
Total 20 1
Gráfico de Bastones
Otro ejemplo
• La demanda diaria, en unidades de un
producto, durante 30 días de trabajo es:
38 35 72 58 48 59
67 63 33 69 53 51
28 25 36 32 61 57
33 61 48 42 72 72
47 66 58 44 44 56
Otro ejemplo …
Demanda diaria,
unidades/día Frecuencia, f i
Demanda diaria,
unidades/día Frecuencia, f i
25 1 53 1
28 1 56 1
32 1 57 1
33 2 58 2
35 1 59 1
36 1 61 2
38 1 63 1
42 1 66 1
44 2 67 1
47 1 69 3
48 2 72 1
51 1
Otro ejemplo …
0
1
2
3
4
20 25 30 35 40 45 50 55 60 65 70 75
número de pedidos por día
fre
cu
en
cia
Clases o Intervalos
Clase: es la subdivisión de la escala de mediciones, de modo que cada observación esté contenida en exactamente una clase o intervalo de clase, A. Número de clases se representa por la letra m.
nm )log(3,31 nm
minmax, xxRm
aRA
Continuando ejemplo …
= 5,477225575
Decidimos que m = 6
= 5,874500141
xmin = 25
R = xmax - xmin = 72 – 25 = 47
xmax = 72
a A
0 7,83
1 8
30m
)30log(3,31m
xmin, nuevo = xmin – a/2 = 28 – 1/2 = 27,5 28
xmax, nuevo = xmax + a/2 = 72 + 1/2 = 73,5 73
Continuando ejemplo …
Clase xj xj+1 xi f i
1 25 32 29 5
2 33 40 37 3
3 41 48 45 6
4 49 56 53 4
5 57 64 61 6
6 65 73 69 6
30
Continuando ejemplo …
0
1
2
3
4
5
6
7
20 25 30 35 40 45 50 55 60 65 70 75
frec
uen
cia
Número representativo de los pedidos por día
Organización y Representación de Datos
Cuantitativos Continuos
Ejemplo: Los siguientes datos son mediciones de la
resistencia a la ruptura (en onzas) de hilos de cáñamo:
n = 60
32,5 15,2 35,4 21,3 28,4 26,9 34,6 29,3 24,5 31,0 21,2 29,4
27,1 25,0 32,7 29,5 30,2 23,9 23,0 26,4 27,3 33,7 33,5 31,3
29,3 17,3 29,0 36,8 29,2 23,5 20,6 29,5 21,8 37,5 38,4 28,3
26,8 28,7 34,8 18,6 25,4 34,1 27,5 29,6 22,2 22,7 21,9 29,6
37,0 28,3 36,9 24,6 28,9 24,8 28,1 25,4 34,5 23,6 33,2 24,0
Organización y Representación de Datos
Cuantitativos Continuos
= 7,745966692 m = 7
= 6,867899126 m = 8
30m
)30log(3,31m
xmin = 15,2
R = xmax - xmin = 38,4 – 15,2 = 23,2
xmax = 38,4
m 7 8
a = 0,6 0,8
A = 3,4 3
xmin, nuevo = 14,9 14,8
xmax, nuevo = 38,7 38,8
Organización de Datos Cuantitativos
Continuos
m = 7
clase LIi LSi xi fi Fi 1 [14,8 18,3> 16,6 2 2
2 [18,3 21,7> 20,0 4 6
3 [21,7 25,1> 23,4 13 19
4 [25,1 28,5> 26,8 12 31
5 [28,5 31,9> 30,2 14 45
6 [31,9 35,3> 33,6 9 54
7 [35,3 38,7] 37,0 6 60
Organización de Datos Cuantitativos
Continuos
m = 8
clase LIi LSi xi fi Fi Fri 1 [14,8 17,8> 16,3 2 2 3,33
2 [17,8 20,8> 19,3 2 4 6,67
3 [20,8 23,8> 22,3 9 13 21,67
4 [23,8 26,8> 25,3 9 22 36,67
5 [26,8 29,8> 28,3 20 42 70,00
6 [29,8 32,8> 31,3 5 47 78,33
7 [32,8 35,8> 34,3 8 55 91,67
8 [35,8 38,8] 37,3 5 60 100,00
Histograma m = 7
0
2
4
6
8
10
12
14
16
14 18 22 26 30 34 38 42
resistencia a la ruptura, onzas
Fre
cu
en
cia
Histograma …
m = 8
0
5
10
15
20
14 18 22 26 30 34 38 42
resistencia a la ruptura, onzas
Fre
cu
en
cia
Polígono de Frecuencias
0
5
10
15
20
14 18 22 26 30 34 38 42
resistencia a la ruptura, onzas
Fre
cu
en
cia
Ojiva
Opcional: plotear con frecuencia 0
clase LIi LSi xi fi Fi 1 [14,8 17,8> 16,3 2 2
2 [17,8 20,8> 19,3 2 4
3 [20,8 23,8> 22,3 9 13
4 [23,8 26,8> 25,3 9 22
5 [26,8 29,8> 28,3 20 42
6 [29,8 32,8> 31,3 5 47
7 [32,8 35,8> 34,3 8 55
8 [35,8 38,8] 37,3 5 60
Ojiva …
0
10
20
30
40
50
60
12 17 22 27 32 37 42
resistencia a la ruptura, onzas
Fre
cu
en
cia
ac
um
ula
da
Ojiva …
clase LIi LSi xi fi Fri 1 [14,8 17,8> 16,3 2 3,33
2 [17,8 20,8> 19,3 2 6,67
3 [20,8 23,8> 22,3 9 21,67
4 [23,8 26,8> 25,3 9 36,67
5 [26,8 29,8> 28,3 20 70,00
6 [29,8 32,8> 31,3 5 78,33
7 [32,8 35,8> 34,3 8 91,67
8 [35,8 38,8] 37,3 5 100,00
Ojiva …
0
20
40
60
80
100
12 17 22 27 32 37 42
resistencia a la ruptura, onzas
Fre
cu
en
cia
ac
um
ula
da
, %
Ejemplo: En una fábrica la producción de “A” y “B” se comportó durante el
primer semestre del año como muestra la tabla:
Estadística Descriptiva
Representaciones gráficas de resultados :
a) Gráfico de líneas:
El correspondiente gráfico de líneas sería:
Mes “A”, ton “B”, ton
Enero 185 105
Febrero 195 95
Marzo 205 90
Abril 200 100
Mayo 210 95
Junio 195 105
0
50
100
150
200
250
“A”, ton
“B”, ton
A continuación se muestran dos opciones de gráficos de barras para la misma data:
Estadística Descriptiva
0
50
100
150
200
250
Enero Febrero Marzo Abril Mayo Junio
“A”, ton
“B”, ton
Representaciones gráficas de resultados :
b) Gráfico de barras:
La opción de la derecha es menos aconsejable, ya que no permite visualizar
fácilmente las variaciones que experimenta “B” ni sus variaciones relativas
respecto a “A”, lo que sí hace la primera opción.
0
50
100
150
200
250
300
350
Enero Febrero Marzo Abril Mayo Junio
“B”, ton
“A”, ton
Los gráficos de barras también pueden ser horizontales, como se muestra a
continuación para la misma data:
Estadística Descriptiva
Representaciones gráficas de resultados :
b) Gráfico de barras:
0 50 100 150 200 250
Enero
Febrero
Marzo
Abril
Mayo
Junio
“B”, ton
“A”, ton
Diagrama de Puntos
• Un investigador sintetiza un reactivo creyendo que es
completamente nuevo. Lo estudia utilizando un
método espectrométrico y obtiene un valor promedio
de 104 (en unidades adecuadas). En los libros de
referencia encuentra que todos los compuestos
estudiados con el "mismo" método tienen un valor
inferior a 100. ? Descubrió el investigador un nuevo
compuesto? La respuesta depende del grado de
confianza que se pueda asignar al valor promedio
104. Si los valores obtenidos (valores muestrales)
fueron 98,100, 102, 104, 107, 108 y 109.
Diagrama de Puntos
el 100 es un valor tan razonable como el 104; se
deberían realizar más mediciones. Si en cambio fueron
103,3 103,5 103,9 104,1 104,3 104,5 104,7.
Diagrama de Puntos pensamos que el químico puede haber descubierto un nuevo
compuesto ... o que ha cometido alguna equivocación que lo
conduce a medir de más.
¿Qué significan precisión y exactitud? El valor verdadero
(desconocido) es 101, los puntos representan los datos
obtenidos. Los datos representados en (a) son precisos e
inexactos, en (b) imprecisos e inexactos, en (c) precisos y
exactos y en (d) imprecisos y exactos.
Diagrama de Puntos
Diagrama de Tallo y Hojas
En un diagrama tallo-hoja podemos ver:
• Cuán aproximadamente simétricos son los datos.
• Cuán dispersos están los valores.
• La aparición de valores inesperadamente más
frecuentes.
• Si algunos valores están alejados del resto.
• Si hay concentraciones de valores.
• Si hay grupos separados.
• La distribución de los datos dentro de cada intervalo
como patrones dentro de los datos.
Diagrama de Tallo y Hojas
En un diagrama tallo-hoja podemos ver:
• Cuán aproximadamente simétricos son los datos.
• Cuán dispersos están los valores.
• La aparición de valores inesperadamente más
frecuentes.
• Si algunos valores están alejados del resto.
• Si hay concentraciones de valores.
• Si hay grupos separados.
• La distribución de los datos dentro de cada intervalo
como patrones dentro de los datos.
Diagrama de Tallo y Hojas Ejemplo. Los siguientes datos representan la evaluación
de los latidos cardíacos de un grupo de 30 personas
después de cierta actividad física
82 95 92 62 85 92
82 95 70 85 84 95
91 82 94 76 88 91
87 80 68 58 76 85
110 60 75 88 64 74
Diagrama de Tallo y Hojas Es muy poca la información que arroja este conjunto de
datos cuando se encuentran sin un tratamiento. A
continuación estos datos son presentados como una
combinación ordenada en forma ascendente (de menor a
mayor):
58 70 80 85 88 94
60 74 82 85 91 95
62 75 82 85 91 95
64 76 82 87 92 95
68 76 84 88 92 110
Diagrama de Tallo y Hojas
A partir de esta lista ordenada se pueden concluir varias
cosas:
• La más alta evaluación de latidos es 110.
• La más baja evaluación de latidos es 58
• La mitad de la combinación se encuentra entre 82 y 85
• Hay una predominancia en los latidos entre 80 y 95
• Hay un "vacío" entre el valor 95 y el valor 110.
• Hay una evaluación atípica dentro del grupo de 30 personas, el
que registra el valor 110. ES posible que esta persona tenga
perturbaciones cardíacas. Sin embargo, es necesario ampliar la
información antes de lanzar un juicio apresurado.
Se puede observar que éstos tienen un rango desde los
cincuentas hasta los ciento diez. Ellos se pueden
presentar como un arreglo de tallo y hojas en una
columna de números del 5 al 11 y trazando una línea
vertical a su derecha. Estos números representarán el
tallo. En la columna de las hojas, se enlistan las
unidades (de manera ordenada) de cada uno de los datos
registrados y correspondientes con su respectiva decena.
Diagrama de Tallo y Hojas
Diagrama de Tallo y Hojas
Tallo Hojas
5 8
6 0 2 4 8
7 0 4 5 6 6
8 0 2 2 2 4 5 5 5 7 8 8
9 1 1 2 2 4 5 5 5
10
11 0