cálculo de medidas de posición o centralización para datos a granel montoya.-
TRANSCRIPT
Cálculo de medidas de posición o centralización para datos a granel
Montoya.-
4.510
6.474.62.68.43.56.47.65.35.4
X
n
dsXX
4.536.536.00.510
6.3
Medidas de centralización Para datos a granel: Considere una muestra de notas de un alumno en la asignatura de matemática :
Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6
Calculo de la media aritmética:
También se puede calcular suponiendo una media y calculando los desvíos respecto de los datos:Ejemplo: supongamos que la media es Xs= 50
Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6
Xi-Xs -0.5 -1.5 1.7 -0.4 0.3 -0.2 1.2 1.4 2.0 -0.4
Suma de desvíos = 3.6
=5.0+
10 6.47.4.62.68.43.56.47.65.35.4 xxxxxxxxx
51.0
6.4
1
7
1
4.6
1
2.6
1
8.4
1
3.5
1
6.4
1
7.6
1
5.3
1
5.4
11
Media geométrica
Para el ejemplo::G=
Media armónica:Para el ejemplo: H=
=5.3
Para el ejemplo: RMS= 3.176.474.62.68.43.56.47.65.35,4 2222222222
La moda para datos a granel (Mo): Es el dato que más se repite, puede haber más de una moda o ninguna, siempre es un dato de la muestra.Para el ejemplo:
Para el ejemplo:
Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6
Mo= 4,6
La mediana para datos a granel (Md): Corresponde al valor central de los datos previamente ordenada (n: impar), o al promedio de los dos datos centrales (n: par).No siempre es un dato de la muestra:Para el ejemplo
Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6
Ordenando los datos:
Notas 3.5 4.5 4.6 4.6 4.8 5.3 6.2 6.4 6.7 7
1.52
3.58.4
Medidas de dispersión para
datos a granel:
n
xxi
4.5X
desvíos
7.110
17
El más elemental es el rango de variación:Rg= mayor valor observado o medido- menor valor observado o medidoPara el ejemplo: Rg= 7-3.5= 3.5
Desviación media: DM=
Para el ejemplo
Notas
4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6
Con:
Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6
desvíos -0.9 -1.9
1.3 -0.8
-0.1
-0.6
0.8 1.0 1.6 -0.8 =0
0.9 1.9 1.3 0.8 0.1 0.6 0.8 1.0 1.6 0.8 =17
DM=
1
2
n
xxS
2
15.1110
96.11
n
xxS
2
09.110
96.11
Desviación estándar:
para la muestraPara el ejemplo:
S=
Desviación estándar para la población: (es solo un estimativo)
Para el ejemplo: S=
Nota: existen otras medidas de dispersión que se estudiaran con datos intervalares.
Ejercicio tipo con datos intervalares.
Cálculo de medidas de centralización para datos cuantitativos intervalares
clases Xi f fr. F% Fa Fa%
485.55 – 535.50 510.53 4 4/40 10.00 4 10.00
535.51 – 585.46 560.49 9 9/40 22.50 13 32.50
585.47 – 635.42 611.45 10 10/40 25.00 23 57.50
635.43 – 685.38 660.41 7 7/40 17.50 30 75.00
685.39 – 735.34 710.37 8 8/40 20.00 38 95.00
735.35 – 785.30 760.33 2 2/40 5.00 40 100.00
40 1 100.00
Se ordenan los datos de la siguiente forma :
clases Xi f Xi*f
485.55 – 535.50 510.53 4 2042.12
535.51 – 585.46 560.49 9 5044.41
585.47 – 635.42 611.45 10 6114.50
635.43 – 685.38 660.41 7 4622.87
685.39 – 735.34 710.37 8 5682.96
735.35 – 785.30 760.33 2 1520.66
40 25027.52
69.62540
52.25027X
Para el ejemplo:Supongamos como media supuesta la marca de clase de la segunda clase, esto es: 560.49, la tabla con los cálculos correspondientes, se puede ordenar en forma simplificada como se indica:
XiDesviación :Xi - Xs f (Xi-Xs)*f
510.53 510.53-560.49=-49.96 4 -199.84
560.49 560.49-560.49=0 9 0
611.45 611.45-560.49=50.96 10 509.60
660.41 660.41-560.49=99.92 7 699.44
710.37 710.37-560.49=149.88 8 1199.04
760.33 760.33-560.49=199.84 2 399.68
=2607.92
69.62540
92.260749.560 X
Valor que coincide con el calculado anteriormente.
clases Xi f fr. F% Fa Fa%
485.55 – 535.50 510.53 4 4/40 10.00 4 10.00
535.51 – 585.46 560.49 9 9/40 22.50 13 32.50
585.47 – 635.42 611.45 10 10/40 25.00 23 57.50
635.43 – 685.38 660.41 7 7/40 17.50 30 75.00
685.39 – 735.34 710.37 8 8/40 20.00 38 95.00
735.35 – 785.30 760.33 2 2/40 5.00 40 100.00
40 1 100.00
Luego la abscisa que deja la mitad de la superficie total a cada lado es: 586.465+34.965=621.43
CRITERIO TABULAR O INTERVALAR:
clasesXi f fr. F% Fa Fa%
485.55 – 535.50 510.53 4 4/40 10.00 4 10.00
535.51 – 585.46 560.49 9 9/40 22.50 13 32.50
585.47 – 635.42 611.45 10 10/40 25.00 23 57.50
635.43 – 685.38 660.41 7 7/40 17.50 30 75.00
685.39 – 735.34 710.37 8 8/40 20.00 38 95.00
735.35 – 785.30 760.33 2 2/40 5.00 40 100.00
40 1 100.00
Md= 587.465+33.922=621.39
EN GENRAL:
clases Xi f fr. F% Fa Fa%
485.55 – 535.50 510.53 4 4/40 10.00 4 10.00
535.51 – 585.46 560.49 9 9/40 22.50 13 32.50
587.47 – 635.42 611.45 10 10/40 25.00 23 57.50
635.43 – 685.38 660.41 7 7/40 17.50 30 75.00
685.39 – 735.34 710.37 8 8/40 20.00 38 95.00
735.35 – 785.30 760.33 2 2/40 5.00 40 100.00
40 1 100.00
Medidas de dispersión para datos cuantitativos organizados tabularmente
n
fxxi
69.62540
52.25027X
Desviación media: DM=
Para el ejemplo:Se sabe que la media es:
Desviación estándar:
1
2
n
fxxS
para la muestra
S= 78.70140
30.195394
n
xxS
2
89.6940
30.195394
Desviación estándar: para la población.Para el ejemplo:
Rango intercuartílico: Datos que se ubican entre el 25% y el 75% Para el ejemplo:
El 25% de los datos: 25% de 40 = 10
De acuerdo a la tabla:
Corresponderían a los 4 datos de la primera clase más los 6 que faltan de la segunda clase:Datos del primer cuartil:
535,505+ 81.5683.33505,535505.535455.5859
6
Datos del tercer cuartil:75% de los datos: 75% de 40 = 30Habrá que tomar los 4 de la primera clase, los 9 de la segunda, los 10 de la tercera y exactamente los 7 de la cuarta clase (suman 30) .En este caso se toma el límite inmediatamente superior de la cuarta clase, esto es: 685.38.
Es decir el rango intercuartílico corresponde a todos los puntajes que se encuentran entre 568,81 y 685,38 (este criterio permite eliminar los outlier)
Nota: el segundo intercuartílico corresponde a la mediana: En efecto: el 50% de los dados es 50% de 40 = 20Habrá que tomar entonces: los 4 datos de la primera clase, los 9 de la segunda y los 7 restante de los 10 de la tercera clase, esto es: 587.465+
03.621565.33465.587)465.587415.635(10
7
(que corresponde al valor calculado anteriormente)
Nota: cualquier otro intercuartílico se calcula de la misma manera:
Ejemplo: cual es el rango de puntaje entre el tercer decil y el sexto decil?
)505.535455.585(9
8
56.642)425.635375.685(7
1
Tercer decil: 30% de 40 = 12
535.505+=579.905
Sexto decil: 60% de 40 = 24
635.425+
El rango es entonces: 579.91 y 642.56
También se puede calcular parámetros como porcentajes de alumnos que se ubican en determinado rango de puntajes
Ejemplo ¿Qué % de alumnos se ubica entre los 548.34 puntos y los 694.15 puntos?
Se procede como se indica
(585.46-548.34)+10+7+=6.69+10+7+1.40=25.09=25 alumnos .Que corresponde al 62.5% del total .Es decir el
62.5% de la muestra se ubica en ese rango de notas.
95.49
9)39.68515.694(
95.49
8(585.46-548.34)+10+7+ =6.69+10+7+1.40=25.09=25 alumnos .
decir el Que corresponde al 62.5% del total .Es 62.5% de la muestra se ubica en ese rango de notas.
Muchas gracias … Montoya.-