des arrollo
DESCRIPTION
desarrolloTRANSCRIPT
COMPENDIO SEIS
JENNIFER XIMENA SANCHEZ BARRIOSWALVIN JHOVANNY CAICEDO GARCIA
LIC. JORGE OBANDO
UNIVERSIDAD COOPERATIVA DE COLOMBIAVILLAVICENCIO – METACONTADURIA PÚBLICA
ESTADISTICA DESCRIPTIVAGRUPO 502
2015-1
DESVIACION MEDIA PARA DATOS NO AGRUPADOS
EJEMPLO:
Los siguientes datos fueron tomados en el laboratorio de física:
X = Espacio recorrido
t = tiempo
X Espacio (cm.) 10 20 30 40
Tiempo (seg.) 0.3 0.4 0.45 0.5
Calculemos el tiempo promedio
X=
0 .3+0. 4+0 .45+0 . 54 = 0,413
Miremos como los datos representados en segundos se acercan o se alejan de
este valor promedio.
Dm=∑i=1
n
|Xi−X|
n =
|0 . 3−0. 413|+|0 . 4−0 . 413|+|0 . 45−0. 413|+|0 .5−0 .413|4 = 0.0625
0.063 es el error promedio que se comete al remplazar los segundos de cada
medida de cada uno de los datos por 0.413 segundos.
Esta distancia corta habla también de la homogeneidad de los datos y de la
confianza que se le debe tomar a esta media aritmética
DESVIACION MEDIA PARA DATOS AGRUPADOS
Xi = Marca de clase del intervalo de referencia
X = Media Aritmética
f = frecuencia absoluta
n = número de datos
EJEMPLO:
La siguiente tabla representa los salarios (Medidos en miles de pesos diarios) de
50 trabajadores entre los que se cuentan, celadoras, aseadoras, secretarias de un
núcleo educativo. Determine la desviación media de estos datos.
Salarios F Xi f*Xi |Xi−X| |Xi−X|*f100 _ 200
200 _ 300
300 _ 400
400 _ 500
500 _ 600
600 _ 700
10
15
5
10
5
5
150
250
350
450
550
650
1500
3750
1750
4500
2750
3250
200
100
0
100
200
300
2000
1500
0
1000
1000
1500
Total 50 17500 7000
X=1750050 = $350.000
Dm=∑i=1
n
|Xi−X|∗f
n =
700050 = 140
Dm=∑i=1
n
|Xi−X|∗f
n
VARIANZA PARA DATOS NO AGRUPADOS
EJEMPLO:
En una universidad de la región se nota que el promedio de los hombres en las
notas del primer periodo corresponde a 3.2 y la suma de los cuadrados de todas
las notas tiene un valor 900; y la media de las mujeres es de 3 con una suma de
cuadrados de 900; determine cuál de los dos grupos es mas variable en su
rendimiento sabiendo que son 30 hombres y 20 mujeres.
S2h =
∑i=1
n
Xi2
n - X2 =
90030
−(3 . 2)2 = 30 – 10.24 = 19,76
S2m =
∑i=1
n
Xi2
n - X2 =
90020
−(3 )2 = 45 – 9 = 36
Como la varianza es más pequeña en la de los hombres, podemos decir que el
grupo de las mujeres es mas variable en su rendimiento, entendiéndose por la
variabilidad en el hecho de que pueden existir estudiantes mujeres con notas más
bajas que altas.
S2=∑i=1
n
(Xi−X )2
n
2. A la rectoría del colegio han llegado 15 cajas con libros de diferentes
editoriales para ser revisados y evaluados por los docentes. El
encargado de abrir las cajas es el rector del colegio. El deberá
seleccionar los libros por áreas para entregarlos a los respectivos
profesores. En el transporte de los libros desde la editorial hasta la
rectoría sufrieron algunos daños. Los siguientes datos representan las
cajas y la cantidad de libros que se han dañado por caja.
C1=1 C2=2 C3=0 C4=5 C5=2
C6=3 C7=1 C8= 4 C9=3 C10=1
C11=0 C12=3 C13=1 C14=0 C15=5
3 Cajas cada una con 0 libros dañados Total Libros =
0
4 cajas cada una con 1 libro dañado Total Libros =
4
2 Cajas cada una con 2 libros dañados Total Libros =
4
3 Cajas cada una con 3 libros dañados Total Libros =
9
1 Cajas cada una con 4 libros dañados Total Libros =
4
2 Cajas cada una con 5 libros dañados Total libros =
10
Total de cajas 15; total de libros dañados 31
Promedio de Libros dañados por Caja: = 3115 = 2.06
S2 = (0−2. 06 )2∗3+(1−2. 06 )2∗4+(2−2. 06 )2∗2+(3−2. 06 )2∗3+( 4−2. 06 )2+(5−2 .06 )2∗215
=2 .72
Este valor pequeño de desviación indica que el promedio de libros
dañados por caja es confiable, se puede afirmar con seguridad dicho
valor.
VARIANZA PARA DATOS AGRUPADOS
EJEMPLO:
Se desea determinar la desviación Standard de la situación económica de 50
familias clasificadas en diferentes estratos y que pertenecen a la comunidad
educativa de un colegio. Los datos expuestos en la siguiente tabla representan los
salarios que devengan dichas familias medidos en miles de pesos.
Salarios f
100 _ 200 1
200 _ 300 14300 _ 400 25400 _ 500 7
500 _ 600 350
Para encontrar el valor de la varianza se elabora la siguiente tabla la que permitirá
calcular primero la media y con la formula llegar al resultado esperado.
Salarios f Xi f*Xi (Xi-X )2 (Xi-X )2*f100 _ 200 1 150 150 40000 40000
S2=∑i=1
n
(Xi−X )2∗f
n
200 _ 300300 _ 400400 _ 500500 _ 600
142573
250350450550
3500875031501950
100000
1000090000
1400000
70000270000
17500 520.00
X=1750050
= $350.000 Salario promedio
S2 =
520 . 00050 =10.400
DESVIACION STANDART
Ejemplo de Aplicación
Consideremos la distribución de datos dado por los siguientes números los que
representan el comportamiento de las valoraciones alcanzadas por tres
estudiantes en las asignaturas de: Química, Física, español, trigonometría y
filosofía para efecto de graficación se ha hecho la siguiente semejanza.
D = 1; I = 2; A = 3; S = 4; E= 5.
Nombres Química Física Español Trigo Filosofía
Juan Carlos Sánchez
David Alejandro Morales
Laura Natalia Céspedes
I
A
S
A
S
A
A
S
I
D
I
A
A
A
S
Si reemplazamos la tabla de las valoraciones con su respectiva denominación
obtenemos la tabla.
Nombres Química Física Español Trigo Filosofía
S=√∑i=1
n
(Xi−X )2∗f
n
Juan Carlos Sánchez
David Alejandro Morales
Laura Natalia Céspedes
2
3
4
3
4
3
3
4
2
1
2
3
3
3
4
Aunque a simple vista podemos determinar cuál es el estudiante con mejor
desempeño en las cinco asignaturas dejemos que el resultado de la desviación
Standard calculada en Excel sea quien determine el estudiante con mayor
variabilidad.
Juan Carlos es el que presenta mayor variabilidad de su promedio, indica que
tiene valoraciones bajas y eso perjudica su promedio. David y Laura tienen la
misma desviación Standard y aunque no tienen los mismos las mismas
valoraciones a los dos se les pueden clasificar en el mismo rango de rendimiento
académico.
COEFICIENTE DE VARIACION MEDIA:
Por ejemplo, para una colección de datos que representan la edad de 15
estudiantes.
10 8 7 6 9
5 7 8 10 6
7 8 9 10 9
Calculemos la edad promedio
X =
5+6∗2+7∗3+8∗3+9∗3+10∗315 = 7,9 años
Ahora la desviación Standard
S =
(5−7 .9 )2+(12−7 . 9)2+(21−7 .9 )2+(27−7 .9 )2+(30−7 .9)2
15 = 1,6 años
Cv =
1. 6mts7 .9mts = 0,20
EJERCICIOS DE APLICACIÓN
1. El ICFES decidió establecer un nuevo currículo para las materias de ciencias y
matemáticas en las escuelas intermedias públicas del país. Para probarlo
selecciono 9 escuelas según la disponibilidad de los maestros de esas escuelas y
la recomendación de las secretarias de Educación. Luego de implantados los
cambios, decidieron demostrar que esas escuelas son representativas del total de
escuelas intermedias públicas del país. Utilizaron como criterio de
representatividad el ingreso promedio (en miles de pesos) de los padres de
estudiantes que asisten a esas escuelas. Los resultados se resumen en la
siguiente gráfica.
Los resultados indican que en las nueve escuelas cerca del 72.5% de los
estudiantes estaban bajo el nivel de pobreza, mientras que en la población de
escuelas ese porcentaje es del 79.75%. La desviación estándar poblacional es de
7.8 puntos porcentuales. Su conclusión es que como el 72.5% se encuentra a
menos de una desviación estándar de la media poblacional de 79.75%, entonces
no hay diferencia significativa.
La conclusión del centro es errónea PORQUE Las escuelas de la muestra tienen
un nivel de pobreza promedio menor que los de la población
2. Los siguientes datos representan las edades de los pacientes admitidos al
hospital departamental de Villavicencio durante el mes de agosto de este año:
37 62 47 54 54 8 63 7
81 1 16 3 64 2 24 10
11 39 16 4 34 22 24 6
80 4 35 58 71 84 8 10.
Durante el mes de agosto de 2002, la edad media de los pacientes admitidos al
hospital de la comunidad era de 8 años. ¿Hay suficiente evidencia para concluir
que la edad media de los pacientes admitidos durante el mes de agosto de este
año es mayor que la edad mediana de los admitidos en el 2002?
I. se debe calcular la media y realizar una diferencia para establecer la evidencia
de la afirmación
II. Se debe calcular la varianza para establecer la veracidad de la afirmación
COMANDOS EN R RESULTADO
>Datos=c(37,62,47,54,54,8,63,7,81,1,16,3,64,2,
24,10,11,39,16,4,34,22,24,6,80,4,35,58,71,84,8,10)
>Rang=max(Datos)–min(Datos)
>Rang
83
>m=1+3.3*log10(32)
>m
5,95
Se redondea por exceso 6
>C =Rang/m
>C
13,83
Se redondea por exceso a 14
>NRang = C * m
>NRang
84
NRang-Rang= 84 – 83 = 1
Xmin - 0.5 = 0.5
Xmax + 0.5 = 84.5
Con los resultados de la tabla ya se puede hacer:
Media. Variación
Media=∑i=1
n
( f∗Xi )
n
X =
105232
=32.8125 = 33
S2=∑i=1
n
(Xi−X )2∗f
n
S2=20947 . 5432 =654.61
La edad promedio de los pacientes en este año es de: 33 años.
La edad promedio de los pacientes en el 2002 es de: 8 años.
Mediactual-Media2002= 33-8= 25
3. Una compañía recoge información sobre los precios de libros de texto de
matemáticas. En el 2000, el precio promedio para todos los textos de matemáticas
Edades F xi f* xi (Xi-X )2 (Xi-X )2*f0.5 _ 14.5
14.5 _ 28.5
28.5 _ 42.5
42.5 _ 56.5
56.5 _ 70.5
70.5 _ 84.5
12
5
4
3
4
4
7.5
21.5
35.5
49.5
63.5
77.5
90
107.5
142
148.5
254
310
640.72
127.97
7.22
278.47
941.72
1996.97
7688.64
639.85
28.88
835.41
3766.88
7987.88
32 1052 20947.54
era de $45.400, con una desviación típica de $100. Los precios de 32 libros de
matemáticas seleccionados al azar durante este año son:
50 40 41 48 48 42 49 50
48 45 56 41 57 42 45 46
45 66 45 45 55 66 42 50
46 46 55 48 45 58 47 35
El precio promedio de los libros para este año es mayor que el precio de los libros
en el año 2000 POR QUE, el coeficiente de variación es también mayor.
COMANDOS EN R RESULTADO
>Datos=c(50,40,41,48,48,42,49,50,48,45,56,
41,57,42,45,46,45,66,45,45,55,66,42,50,46,
46,55,48,45,58,47,35)
>Media=mean(Datos)
>49
MediaVariación
Coeficiente de
variación
Media=∑i=1
n
( f∗Xi )
n
X =
152432
=
48.1875= 49
S2=∑i=1
n
(Xi−X )2∗f
n
>X=c(35,40,41,42,45,46,47,48,49,50,55,56,57,58,66)> D2=sum(Media-X)^2> D2[1] 148.5352> Var=D2/n> Var[1] 4.641724
>
Cv=(sqrt(Var)/Media)*1
00
> Cv
[1] 4.471006
> Cvx=45.4/100
> Cvx
[1] 0.454
>
El precio promedio actual de los libros: $48.187
El precio promedio de los libros en el año 2000: $45.400
4. Multiplicando por 4 cada uno de los valores de la variable, X: 3, 2, 0,
5, se obtiene la serie Y: 12, 8, 0, 20, Para comprobar que las series
tienen el mismo coeficiente de variación se debe
Calcular las medias de ambas series
Calcular la Varianza de ambas series
Medias Varianza
Desviación
estándar
coeficiente d
variación
×=3+2+0+54
= 2.5
×=12+8+0+204
=
10
S=√S2
CV=1.802.5
∗100
=72%
CV=7.2110
∗100=
72%
5. En una universidad de la capital, se ha Encontrado que los promedios en los 4
primeros semestres de las notas de Matemáticas corresponden a: 3.2, 3.4, 3.0,
3.8, si la cantidad de alumnos matriculados fue de 30, 35, 40, 22 respectivamente,
S2=
(3−2. 5)2+(2−2. 5)2+(0−2.5 )2+(5−2 .5 )2
4=3 .25
S2=(12−10 )2+(8−10 )2+(0−10 )2+(20−10 )2
4=52
S=√3 . 25=
1.80
S=√52 =
7.21
S2=∑i=1
n
(Xi−X )2
n
y sabiendo que existe un 4 de Varianza, entonces el coeficiente de variación del
promedio total de las notas de los cuatro semestres corresponde a:
A. 60.6 % B. 70.6% C. 75.6% D. 65.6%
E. 55.6%
1semestre 2semestre 3 semestre 4semestre
Notas 3.2 3.4 3.0 3.8
matriculados 30 35 40 22
Media Variación
Desviación
estándar
Coeficiente de
variación
Notas=c (3.2, 3.4, 3.0, 3.8)
Matriculados=c(30,35,40,22)
nMatriculados=sum (Matriculados)
Media=sum
(Matriculados*Notas)/nMatriculados
Media
[1] 3.296063
S2=∑i=1
n
(Xi−X )2∗f
n
S2==4
S=√S2
S=√4
= 2
CV= 23,296963
∗100
=60%
Nota F
3,2 30
3,4 35
3,0 40
3,8 22
127
6. En una distribución de datos correspondientes a salarios de 50 educadores de
un colegio, Se encontró que el salario promedio es de $600.000, con una varianza
de $625, se puede concluir que:
1. La varianza en el ejemplo representa una buena medida para establecer la
veracidad del dato promedio.
2. $600.000 de acuerdo a la desviación Standard no es una medida suficiente
representativa.
3. La media de $600.000 es suficientemente representativa ya que la desviación
estándar es pequeña.
4. La media no está acorde con la realidad lo dice el enorme tamaño de la
Varianza.
Media Varianza Desviación
estándar
Coeficiente de
variación
600 S2=∑i=1
n
(Xi−X )2∗f
n
S2=625
S=√S2
S=√625 = 25
Cv= SX
Cv=25600
Cv=4,16%
7. Mediante una curva normal y utilizando las desigualdades de TChebycheff se
diseño un modelo para cualificar el desempeño académico de los estudiantes de
la U.C.C en el programa de Sistemas.
D = deficiente
R = Regular
B=bueno
S=Sobresaliente
E=Excelente
O=Optimo
.
Si en total existen 180 estudiantes con un promedio total de 3,4 y un coeficiente
de variación del 2.5%, entonces ¿cuántos estudiantes sobresalientes tiene la
facultad?
n Media
Coeficiente
de variación Porcentajes
Estudiantes
sobresaliente
s
180 3,4 2,5%
D = 2%
R = 10%
B=55%
S=25%
E=5%
O=3%
180 100%
X 25%
=45
A. 100
B. 96
C. 45
D. 99
E. 9
8. La Varianza de todo el grupo corresponde a:
A. 0.085
B. 0.025
C. 7.2
D. 0.085
E. 0.0072
Coeficiente de variación Varianza
Desviación
estándar
CV=0,0853,4
∗100 =2,5%
S2=∑i=1
n
(Xi−X )2∗f
n
S2=0 ,0072
S=√S2
S=√0 ,0072 =
0,085
9. Una cantidad que se toma en cuenta para evaluar proyectos azarosos es la
desviación estándar. Ésta mide la dispersión de los resultados del proyecto
azaroso. Es decir, si hay dos proyectos: A y B. Y si la desviación estándar del
rendimiento del proyecto A es mayor que la del B. El proyecto A es más
arriesgado, el B es más Estable. Si ambos tienen valor esperado parecido el A
tiene posibilidades de rendir mucho más que el B pero, también el A tiene
posibilidad de generar mayores pérdidas que el B.
La Afirmación anterior es verdadera porque:
A. La desviación Standard mide la variabilidad de dos grupos A y B cualquiera.
C. La desviación Standard permite comparar a dos grupos y decidir la estabilidad
del uno con respecto al otro.
D. La desviación Standard mide el margen de error de un grupo con respecto a
otro.
E. La desviación Standard mide la distancia entre los datos y la media aritmética
F. La desviación Standard mide el margen de error cometido al usar la media en
una distribución
10. La resistencia de 100 baldosas de la fabrica “De las casas “se referencia en la
siguiente tabla.
SI el
promedio de salario en la fábrica de “Las casas” es de
$541.000 y la desviación Standard es $1.791
Concluimos que:
A. Es mucho más dispersa la información correspondiente a la resistencia de las
baldosas.
B. Es mucho más dispersa la información correspondiente al salario de los
empleados.
C. Ambas informaciones presentan la misma dispersión y por tanto no se puede
tomar una decisión.
D. La Varianza en los salarios es diferente en la resistencia de las baldosas eso
hace que el análisis entre las dos informaciones sea indiferente
11. Se consulto en 30 almacenes de la capital el precio de monitores para
computador y se obtuvo los siguientes resultados en miles de pesos.
100 101 120 115 130 150 112 145 138 121
126 115 140 137 143 118 147 149 150 115
100 127 135 149 146 137 122 118 135 129
Kg./Cm2 F
100_ 200
200_ 300
300_ 400
400_ 500
500_ 600
600_ 700
700_ 800
4
10
21
33
18
9
5
100
xi f* xi (Xi-X )2 (Xi-X )2*f150
250
350
450
550
650
750
600
2500
7350
14850
9900
5850
3750
88804
39204
9604
4
10404
40804
91204
355216
392040
201684
132
187272
367236
456020
44.800 1.959.600
Elabore una distribución de frecuencias, para datos agrupados, indicando los
valores de los límites reales. Y calcule: Cuartil 2, Coeficiente de variación,
Interpretación con respecto al Cv.
COMANDOS EN R RESULTADO
>Datos=c(100,100,101,112,115,115,115,
118,118,120,121,122,126,127,129,
130,135,135,137,137,138,140,143,
145,146,147,149,149,150,150)
>Rang=max(Datos)–min(Datos)
>Rang
50
>m=1+3.3 log10(30)
>m
5,851
Se redondea por exceso a 6
>C =Rang/m
>C
8,33
Se redondea por exceso a 9.
>NRang = C * m
>NRang=9*6
>NRang
54
NRang-Rang= 54 – 50= 4
Xmin - 2 = 98
Xmax + 2= 152
Con los resultados de la tabla ya se puede hacer:
Cálculo de la media
variación
Desviación
estándar
Coeficiente de
variación segundo Cuartil
Media=∑i=1
n
( f∗Xi )
n
X =
387630
=
129.2= 130
S2=∑i=1
n
(Xi−X )2∗f
n
S2=6720 ,330 = 224,01
S=√S2
S=√224 ,01= 14.9669
CV=14,9669129,2
∗100
= 11%
2(30)4
= 15
sabemos que las operaciones se harán en el cuarto intervalo ya que en las
frecuencias acumuladas el valor de 15 queda perfectamente contenido en 16.
Por tanto:
Li = 125 Fa = 12 C=9
2n4 =15 fo=4
Q2 =
Li+( 2∗n4
−Fa
fo )∗c
Precios f F xi f* xi (Xi-X )2 (Xi-X )2*f98 _ 107
107 _ 116
116 _ 125
125 _ 134
134 _ 143
143 _ 152
3
4
5
4
7
7
3
7
12
16
23
30
102,5
111,5
120,5
129,5
138,5
147,5
307,5
446
602,5
518
969,5
1032,5
712,89
313,29
75,69
0,09
86,49
334,89
2138,67
1253,16
378,45
0,36
605,43
2344,23
30 3876 6720,3
Q2 =
Li+( 2n4
−Fa
fo )∗C. = 125 +
(15−124 )
*9 = 131,75
Lo que indica que el 50 % de los precios de los monitores corresponden
a $131.450
SEGUNDO CUARTIL
COMANDOS EN R RESULTADO
>precios=c(100,100,101,112,115,115,
115,118,118,120,121,122,126,127,
129,130,135,135,137,137,138,140,
143,145,146,147,149,149,150,150)
>quantile(precios,prob=seq(0,1,length=5),type=6)
0% 25% 50% 75% 100%
100.00 117.25 129.50 143.50 150.00
13. En los siguientes enunciados uno es verdadero.
A. La media en una muestra de datos agrupados la divide en dos partes iguales.
B. Una distribución de datos permite calcular todas las medidas de tendencia
central
C. La moda es un dato que permite analizar un resultado esperado.
D. Una medida de dispersión esta libre del cálculo de la media
14. Cuando la media aritmética de un determinado número de datos es
$270.50 y la desviación típica es de $33.99, el coeficiente de variación
(CV) es igual a:
A. 6.2%
B. 795.82%
C. 2.6%
D. 5.4%
E. 1.8%