estadÍstica (grupo 12personal.us.es/aggonzalez/docencia/tema_5.pdfrelación con las medidas de...
Post on 16-May-2018
219 Views
Preview:
TRANSCRIPT
CAPÍTULO II.- ANÁLISIS DE UNA CARACTERÍSTICA (DISTRIBUCIONES
UNIDIMENSIONALES)
ESTADÍSTICA (GRUPO 12)
TEMA 5.- MEDIDAS DE DISPERSIÓNDE LA DISTRIBUCIÓN
DIPLOMATURA EN CIENCIAS EMPRESARIALES
UNIVERSIDAD DE SEVILLA
2© Antonio Pajares Ruiz
1. CONCEPTO DE DISPERSIÓN.
Definición
Grado de variabilidad existente en torno a los distintos valores de la distribución de frecuencias.
Relación con las medidas de posición de tendencia central
Interesan aquellas medidas que se expresen en relación a una determinada medida de posición central:
A mayor distancia entre dicha medida y el conjunto de valores, mayor será la dispersión existente en la distribución.Cuanto menor sea dicha separación, menor será tal dispersión.
Cuanto menor sea la dispersión respecto de una determinada de posición, mayor será la representatividad de dicha medida.
3© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
Concepto
Son aquellas que vienen expresadas en la misma unidad de medida que la variable.
Estas medidas no sirven para establecer comparaciones sobre la dispersión existente en distintas distribuciones.
Medidas elementales
Recorrido: R = xmáx- xmín
Recorrido intercuartílico: RIC = C3- C1
Recorrido interpercentílico: RIP = P99- P1
4© Antonio Pajares Ruiz
máx mínR x x= −
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
Ej.: Analizar la dispersión existente en la distribución de la variable “Número de hijos”, definida sobre un colectivo de 15 personas, a través del cálculo de las medidas elementales correspondientes.
15
14
11
5
Ni
1
3
6
5
ni
4
2
1
0
xiRecorrido: R 4 0 4 hijos= − =
315 11,25
4⋅ =
Recorrido intercuartílico:
115 3,75
4⋅ =
3C 2=
1C 0=
IC 3 1R C C= −
ICR 2 0 2 hijos= − =
9915 14,85
100⋅ =
Recorrido interpercentílico:
99P 4= 1P 0=115 0,15
100⋅ =
IP 99 1R P P= − IPR 4 0 4 hijos= − =
5© Antonio Pajares Ruiz
( )k
i ii 1
P
x P nDM
N=
− ⋅=∑
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.DESVIACIONES MEDIAS RESPECTO
DE UNA MEDIDA DE POSICIÓN P
Desviación mediarespecto de P:
k
i ii 1
P
x P nDAM
N=
− ⋅=∑
Desviación absoluta media respecto de P:
( )k
2
i ii 1
P
x P nDCM
N=
− ⋅=∑
Desviación cuadrática media respecto de P: Medidas de dispersión óptimas
Son aquellas que, para una determinada medida de posición P, determinan valores mínimos para tales desviaciones.
6© Antonio Pajares Ruiz
( )k
i ii 1
P
x P nDM
N=
− ⋅=∑
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.DESVIACIONES MEDIAS RESPECTO DE UNA MEDIDA DE
POSICIÓN P: MEDIDAS DE DISPERSIÓN ÓPTIMASDesviación media respecto de P
( )k
i ii 1
x
x x nDM 0
N=
− ⋅= =∑
P x=
( )k
2
i ii 1
P
x P nDCM
N=
− ⋅=∑
Desviación cuadrática media respecto de P
La desviación cuadrática media de los diversos valores de la variable respecto de la media aritmética se denomina varianza.
( )k
2
i i2i 1
x x
x x nDCM s
N=
− ⋅= =∑
P x=
7© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.DESVIACIONES MEDIAS RESPECTO DE UNA MEDIDA DE
POSICIÓN P: MEDIDAS DE DISPERSIÓN ÓPTIMAS
k
i ii 1
P
x P nDAM
N=
− ⋅=∑
Desviación absoluta media respecto de Pk
i ii 1
Me
x Me nDAM
N=
− ⋅=∑
P Me=
k
i ii 1
P0
x P nDAIM
Nlímε
=
ε→
− ⋅=
∑
Desviación absoluta infinitesimal media respecto de P
k
i ii 1
Mo0
x Mo nDAIM
Nlimε
=
ε→
− ⋅=
∑
P Mo=
j jMo
N n nDAIM 1
N N−
= = −
8© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
113305
|xi-Me|·ni
1514115Ni
151365ni
4TOTAL
210xi
Ej.: Determinar para la distribución de la variable “Número de hijos”, definida sobre un colectivo de 15 personas las correspondientes medidas de dispersión absolutas óptimas respecto de mediana, moda y media aritmética.
DESVIACIONES MEDIAS RESPECTO DE UNA MEDIDA DE POSICIÓN P: MEDIDAS DE DISPERSIÓN ÓPTIMAS
Desviación absoluta media respecto de la mediana
Me 1 hijo=
N 157,5
2 2= = k
i ii 1
Me
x Me nDAM
N=
− ⋅=∑
Me
0 1 5 ... 4 1 1DAM
15− ⋅ + + − ⋅
= Me
11DAM 0,7333 hijos
15= =
9© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
1514115Ni
151365ni
4TOTAL
210xi
Ej.: Determinar para la distribución de la variable “Número de hijos”, definida sobre un colectivo de 15 personas las correspondientes medidas de dispersión absolutas óptimas respecto de mediana, moda y media aritmética.
DESVIACIONES MEDIAS RESPECTO DE UNA MEDIDA DE POSICIÓN P: MEDIDAS DE DISPERSIÓN ÓPTIMAS
Desviación absoluta infinitesimal media respecto de la moda
Mo 1 hijo=
jMo
nDAIM 1
N= −
Mo
6DAIM 1 0,6
15= − =
10© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
16,93338,60442,61330,02675,6889
(xi-Media X)2·ni
151365ni
4TOTAL
210xi
Ej.: Determinar para la distribución de la variable “Número de hijos”, definida sobre un colectivo de 15 personas las correspondientes medidas de dispersión absolutas óptimas respecto de mediana, moda y media aritmética.
DESVIACIONES MEDIAS RESPECTO DE UNA MEDIDA DE POSICIÓN P: MEDIDAS DE DISPERSIÓN ÓPTIMAS
Desviación cuadrática media respecto de la media aritmética
x 1,0667 hijos=
( )k
2
i i2 i 1x
x x ns
N=
− ⋅=∑
( ) ( )2 2
2 2x
0 1,0667 5 ... 4 1,0667 1s 1,1289 hijos
15− ⋅ + + − ⋅
= =
11© Antonio Pajares Ruiz
50153192,5190-195116,666715TOTAL
12104Ni
18,33335
43,3333|xi-Me|·ni
2185180-1906175170-1804165160-170nixiALTURA
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
Ej.: Determinar para la distribución de la variable “Altura en cm.”, definida sobre 15 personas, las correspondientes medidas de dispersión absolutas óptimas respecto de mediana, moda y media aritmética.
DESVIACIONES MEDIAS RESPECTO DE UNA MEDIDA DE POSICIÓN P: MEDIDAS DE DISPERSIÓN ÓPTIMAS
Desviación absoluta media respecto de la mediana (175,83)
Me
116,67DAM 7,78 cm.
15= =
k
i ii 1
Me
x Me nDAM
N=
− ⋅=∑
Me
165 175,83 4 ...DAM
15192,5 175,83 3
15
− ⋅ + +=
+ − ⋅
12© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
Ej.: Determinar para la distribución de la variable “Altura en cm.”, definida sobre 15 personas, las correspondientes medidas de dispersión absolutas óptimas respecto de mediana, moda y media aritmética.
DESVIACIONES MEDIAS RESPECTO DE UNA MEDIDA DE POSICIÓN P: MEDIDAS DE DISPERSIÓN ÓPTIMAS
Desviación absoluta infinitesimal media respecto de la moda
jMo k
ii 1
dDAIM 1
d=
= −
∑
Mo
0,6DAIM 1 0,6667
1,8= − =
1,815-Total
0,635190-195
0,20,60,4di
210180-190610170-180410160-170niaiALTURA
Consideraremos los valores aproximados calculados según el primer criterio: 173,33 y 190.
13© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
Ej.: Determinar para la distribución de la variable “Altura en cm.”, definida sobre 15 personas, las correspondientes medidas de dispersión absolutas óptimas respecto de mediana, moda y media aritmética.
DESVIACIONES MEDIAS RESPECTO DE UNA MEDIDA DE POSICIÓN P: MEDIDAS DE DISPERSIÓN ÓPTIMAS
Desviación cuadrática media respecto de la media aritmética
( )
( )
2
2x
2
165 177,17 4 ...s
15
192,5 177,17 315
− ⋅ + +=
+ − ⋅2 2x
1448,33s 96,56 cm.
15= =
Dado un valor de 177,17 para la media.
705,33577,53192,5190-1951448,332657,515TOTAL
3701050660xi·ni
122,722185180-19028,176175170-180592,114165160-170
(xi-Media)2·ninixiALTURA ( )k
2
i i2 i 1x
x x ns
N=
− ⋅=∑
14© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
VARIANZA
Concepto
Es la desviación cuadrática media de los diversos valores de la variable respecto de la media aritmética
Es la medida de dispersión absoluta óptima respecto de la media aritmética.
Viene expresada en las mismas unidades de medida de la variable,pero al cuadrado.
( )k
2
i i2 i 1x
x x ns
N=
− ⋅=∑
k2i i
2 2i 1x
x ns x
N=
⋅= −∑
15© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
VARIANZA
Propiedades
1. La varianza siempre es un valor mayor o igual que cero, siendo únicamente nula cuando la variable toma un solo valor.
2xs 0≥
i iy x a= +
2. Dada una determinada distribución de frecuencias para la variable X, si a todos los valores de la misma les sumamos una constante a cualquiera (cambio de origen en la variable), la varianza de la variable transformada no varía respecto de la correspondiente a la variable primitiva.
2 2y xs s=
16© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.VARIANZA
Propiedades
( )i iy b x ; b 0= ⋅ ≠
3. Dada una determinada distribución de frecuencias para la variable X, si a todos los valores de la misma los multiplicamos por una constante b cualquiera, distinta de cero, (cambio de escala en la variable), la varianza de la variable transformada será igual a dicha constante elevada al cuadrado por la varianza de la primitiva.
2 2 2y xs b s= ⋅
( )i iy a b x ; b 0= + ⋅ ≠
4. Dada una determinada distribución de frecuencias para la variable X, si a todos los valores de la misma les multiplicamos por una constante b cualquiera, distinta de cero, y a su resultado, les sumamos una constante a cualquiera, la varianza de la variable transformada será igual a la primera constante elevada al cuadrado por la varianza de la variable primitiva.
2 2 2y xs b s= ⋅
17© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.VARIANZA
Propiedades
'i i i
i i
n k n ; x
y x
= ⋅ ∀
=
5. Dada una determinada distribución de frecuencias para la variable X, si a las frecuencias de todas los valores de la misma les multiplicamos por una constante k cualquiera, distinta de cero, la varianza de la variable transformada no variará respecto de la varianza de la variable primitiva.
2 2y xs s=
6. Dada una determinada distribución de frecuencias para la variable X referida a una población, que se puede dividir en dos o subpoblaciones disjuntas entre si, la varianza de la variable se puede definir a partir de las varianzas y medias de esa variable para cada una de las subpoblaciones.
18© Antonio Pajares Ruiz
6. Descomposición de la varianza en una población desde las distribuciones de dos ó más subpoblaciones:
nhxh
Frec. Abs.Vals. X
NTOTALnkxk
n2x2
......nh+1xh+1
......
n1x12 2
2 1 1 2 2x
2 21 1 2 2
N s N ss
N NN (x x N (x x) )
N N
⋅ ⋅= + +
⋅ − ⋅ −+ +
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.VARIANZA
Propiedades
N1 observ.
Media: 1x
Varianza:21s
N2 observ.
Media: 2x
Varianza:22s
19© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
DESVIACIÓN TÍPICA O ESTÁNDAR
Concepto
Es la raíz cuadrada con signo positivo de la varianza.
Es la media cuadrática de las desviaciones de los diversos valores de la variable respecto de la media aritmética.
Viene expresada en las mismas unidades de medida de la variable.
2x xs s= +
k2i i
2 2i 1x
x ns x
N=
⋅= + −
∑( )k
2
i ii 1
x
x x ns
N=
− ⋅= +
∑
20© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
DESVIACIÓN TÍPICA O ESTÁNDAR
Algunas propiedades (Recapitulación)
x x1. s 0 y s 0 si X toma un solo valor≥ =
i i2. y x a= + y xs s=
( )i i3. y b x ; b 0= ⋅ ≠ y xs b s= ⋅
( )i i4. y a b x ; b 0= + ⋅ ≠ y xs b s= ⋅
21© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
151365ni
4TOTAL
210xi
Ej.: Determinar la desviación típica de la variable “Número de hijos”, definida sobre un colectivo de 15 personas.
DESVIACIÓN TÍPICA O ESTÁNDAR
xs 1,1289 1,0625 hijos= + =
2 2xs 1,1289 hijos=
A partir del valor de la varianza, anteriormente calculado, concretamos el valor de la desviación típica.
Ej.: Determinar la desviación típica de la variable “Altura en cm.”, definida sobre un colectivo de 15 personas.
xs 96,5556 9,8263 cm.= + =
2 2xs 96,5556 cm.=
A partir del valor de la varianza, anteriormente calculado, concretamos el valor de la desviación típica.
3190-19515TOTAL
2180-1906170-1804160-170niALTURA
22© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.VARIANZA Y DESVIACIÓN TÍPICA
Ej.: Después de analizar la distribución de la variable “Altura en cm.” de 15 personas, se comprobó que en todas las observaciones se habíamedido 0,1 cm. de más, por error del instrumento utilizado. Queremos conocer de qué forma afectaría ello a la varianza y desviación típica de la variable “Altura en metros”.
xs 9,8263 cm.=
2 2xs 96,5556 cm.=
X: Altura en centímetros(medición original)
Y: Altura en metros (medición corregida)
0,1 1Y X
100 100= − + ⋅
X 0,1Y
100−
=
y
1s 9,8263
100= ⋅
22y
1s 96,5556
100⎛ ⎞= ⋅⎜ ⎟⎝ ⎠
ys 0,0983m.=2 2ys 0,0097m.=
23© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.CUASIVARIANZA
Concepto
Es igual a la suma de las desviaciones cuadráticas de los diversos valores de la variable respecto de la media aritmética dividida entre el total de observaciones menos uno.
Cuando el número de observaciones es suficientemente grande, losvalores de cuasivarianza y varianza prácticamente coinciden.
Se utiliza, en lugar de la varianza, para la estimación en el ámbito de la inferencia estadística, por sus mejores propiedades.
( )k
2
i i2 i 1cx
x x ns
N 1=
− ⋅=
−
∑ 2 2cx x
Ns s
N 1= ⋅
−( )
k2
i i2 i 1cx
x x nN
sN N 1
=
− ⋅= ⋅
−
∑
n → ∞ 2 2cx xs s→
24© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
CUASIDESVIACIÓN TÍPICA
Concepto
Es igual a la raíz cuadrada con signo positivo de la cuasivarianza.
Suele determinarse en las calculadores y en distintos programas informáticos bajo la notación de σn-1, en tanto que la desviación típica se calcula bajo la notación de σn.
2cx cxs s= + 2
cx x
Ns s
N 1= + ⋅
− cx x
Ns s
N 1= ⋅
−
25© Antonio Pajares Ruiz
2. MEDIDAS DE DISPERSIÓN ABSOLUTAS.
151365ni
4TOTAL
210xi
Ej.: Determinar los valores de la cuasivarianza y de la cuasidesviacióntípica de la variable “Número de hijos”, definida sobre 15 personas.
CUASIVARIANZA Y CUASIDESVIACIÓN TÍPICA
2 2cx
15s 1,1289 1,2095 hijos
14= ⋅ =2 2
xs 1,1289 hijos=
A partir del valor de la varianza, anteriormente calculado, concretamos el valor de la cuasivarianza, y desde éste, él de la cuasidesviación típica.
Ej.: Determinar los valores de la cuasivarianza y de la cuasidesviacióntípica de la variable “Altura en cm.”, definida sobre 15 personas.
cxs 10,1712 cm.=3190-19515TOTAL
2180-1906170-1804160-170niALTURA
cxs 1,0998 hijos=cxs 1,2095= +
Operando de igual forma que en el ejemplo anterior:
2 2cx
15s 96,5556 103,4524 cm.
14= ⋅ =2 2
xs 96,5556 cm.=
cxs 103,4524= +
26© Antonio Pajares Ruiz
3. MEDIDAS DE DISPERSIÓN RELATIVAS.
Concepto
Son aquellas medidas que cuantifican el grado de variabilidad existente entre los valores de la distribución y que no vienen expresadas en unidad de medida alguna (adimensionales).
A través de las mismas, es posible comparar la dispersión existente en distintas distribuciones.
Sería deseable que la medida de dispersión, aparte de ser adimensional, hiciera referencia a una determinada medida de posición, para valorar así su representatividad.
27© Antonio Pajares Ruiz
3. MEDIDAS DE DISPERSIÓN RELATIVAS.
máxx
mín
xA
x=
COEFICIENTE DE APERTURA O DE DISPARIDAD
Inconvenientes
Si el valor mínimo es nulo, no sería posible determinarlo.Si alguno de los valores es negativo, su resultado no es representativo directamente.
Ej.: ¿Cuál sería el coeficiente de apertura para la distribución del “Nº hijos” de 15 personas?
151365ni
4TOTAL
210xi
x
4A
0=
Ej.: ¿Cuál sería el coeficiente de apertura para la distribución de la “Altura en cm.” de 15 personas?
x
195A 1,2188
160= =
3190-19515TOTAL
2180-1906170-1804160-170niALTURA
28© Antonio Pajares Ruiz
3. MEDIDAS DE DISPERSIÓN RELATIVAS.
Coeficiente de variación respecto de la medida de posición P:COEFICIENTE DE VARIACIÓN
PP
DOV
P=
k
i ii 1
Me
x Me n
NVMe
=
− ⋅
=
∑
DOP: Medida de dispersión absoluta óptima respecto de la medida de posición P.
Coeficiente de variación respecto de la mediana:
MeMe
DAMV
Me=
j
Mo
n1
NVMo
−=
Coeficiente de variación respecto de la moda:
MoMo
DAIMV
Mo=
29© Antonio Pajares Ruiz
3. MEDIDAS DE DISPERSIÓN RELATIVAS.
Coeficiente de variación respecto de la media aritmética:
COEFICIENTE DE VARIACIÓN
( )k
2
i ii 1
x
x x n
NVx
=
− ⋅
=
∑x
x
sV
x=
Sus características
Representa cuántas veces la desviación típica contiene a la media.
No es una medida adecuada cuando el valor de la media es próximoa cero.
Se conoce como coeficiente de variación de Pearson, coeficiente de variación respecto de la media o, simplemente, coeficiente de variación.
30© Antonio Pajares Ruiz
3. MEDIDAS DE DISPERSIÓN RELATIVAS.
COEFICIENTE DE VARIACIÓN DE PEARSON
Propiedades
1. El coeficiente de variación nunca puede ser negativo, siendo únicamente nulo cuando la variable presenta un solo valor.
xv 0≥
i iy x a= +
2. Dada una determinada distribución de frecuencias para la variable X, si a todos los valores de la misma les sumamos una constante a cualquiera, distinta de cero (cambio de origen en la variable), el coeficiente de variación de la variable transformada varía respecto del de la variable primitiva.
y x
y x as s= +=
y xy
s sv
y x a= =
+ y xv v≠
31© Antonio Pajares Ruiz
3. MEDIDAS DE DISPERSIÓN RELATIVAS.COEFICIENTE DE VARIACIÓN DE PEARSON
i iy b x= ⋅
3. Dada una determinada distribución de frecuencias para la variable X, si a todos los valores de la misma les multiplicamos por una constante b cualquiera, distinta de cero (cambio de escala en lavariable), el coeficiente de variación de la variable transformada no varía respecto del de la variable primitiva.
y x
y b x
s b s
= ⋅
= ⋅y x x
y
s b s sv
y b x x⋅
= = =⋅ y xv v=
i iy a b x= + ⋅
4. Si en la distribución de una variable X, a todos sus valores lesmultiplicamos por una constante b cualquiera, distinta de cero y, a su resultado, le sumamos una constante a cualquiera, distinta de cero, el coeficiente de variación de la variable transformada varía respecto del de la variable primitiva.
y x
y a b x
s b s
= + ⋅
= ⋅y x
y
s b sv
y a b x⋅
= =+ ⋅ y xv v≠
32© Antonio Pajares Ruiz
3. MEDIDAS DE DISPERSIÓN RELATIVAS.
COEFICIENTE DE VARIACIÓN DE PEARSON
Interpretación de sus valores
Si V<0,3:Existe poca dispersión respecto de la media.La media es muy representativa para la distribución.
Si V>0,7:Existe una dispersión muy elevada respecto de la media.La media es poca representatividad para la distribución.
33© Antonio Pajares Ruiz
3. MEDIDAS DE DISPERSIÓN RELATIVAS.COEFICIENTE DE VARIACIÓN DE PEARSON
Ej.: A partir de la distribución conocida del “Nº hijos” de 15 personas, determine el coeficiente de variación e interprételo.
15
1
3
6
5
ni
4
TOTAL
2
1
0
xi
xs 1,0625 h.=
Recordamos los valores previamente calculados de desviación típica y media:
xx
s 1,0625v
x 1,0667= =
Conclusiones:Dispersión alta.
Media poco representativa.
x 1,0667 h.=
xv 0,9961=
34© Antonio Pajares Ruiz
3. MEDIDAS DE DISPERSIÓN RELATIVAS.COEFICIENTE DE VARIACIÓN DE PEARSON
Recordamos los valores previamente calculados de desviación típica y media:
Conclusiones:Dispersión baja.
Media muy representativa.
Ej.: A partir de la distribución conocida de la “Altura en cm.” de 15 personas, determine el coeficiente de variación e interprételo.
3190-195
15N
2180-190
6170-180
4160-170
niALTURA
xs 9,8263 cm.= x 177,1667 cm.=
xx
s 9,8263v
x 177,1667= =
xv 0,0555=
35© Antonio Pajares Ruiz
4. TIPIFICACIÓN DE VARIABLES.Concepto de variable tipificada de una dada
Es aquella que se concreta restando a todos los valores de la primitiva su media y, a su resultado, dividiéndolo por su desviación típica.
Propiedades
1. La media de cualquier variable tipificada es 0:
Xx
X xZ
s−
= Xx x
x 1Z X
s s= − + ⋅
Variable tipificada de la variable X
2. La varianza de cualquier variable tipificada es igual a uno:
xx x
x 1z x 0
s s= − + ⋅ =
X
2 2Z x2
x
1s s 1
s= ⋅ =
36© Antonio Pajares Ruiz
5. TEOREMA DE TCHEBYCHEV.
Dada una determinada distribución de frecuencias para la variable X, sabemos que, como máximo, el porcentaje de las observaciones quequedaría fuera del intervalo comprendido entre el valor medio de la variable menos k veces la desviación típica y tal valor medio más k veces esta desviación, sería igual al inverso de la cifra de k al cuadrado por 100.
i xx x k s 2
1f
k− > ⋅ <
Dada una determinada distribución de frecuencias para la variable X, sabemos que, como mínimo, el porcentaje de las observaciones quequedaría fuera del intervalo comprendido entre el valor medio de la variable menos k veces la desviación típica y tal valor medio más k veces esta desviación, sería igual uno menos el inverso de la cifra de k al cuadrado por 100:
i xx x k s 2
1f 1
k− ≤ ⋅ ≥ −
Enunciado
37© Antonio Pajares Ruiz
5. TEOREMA DE TCHEBYCHEV.
1
3
6
5
ni
4
2
1
0
xi
Ej.: A partir de la distribución conocida del “Nº hijos” de 15 personas, queremos saber qué porcentaje como máximo de las observaciones quedaría fuera del intervalo comprendido entre el nº medio de hijos menos dos veces la desviación típica y tal nº medio más dos veces esta desviación, sin utilizar ni la media ni la desviación típica.
Se quiere conocer el porcentaje de observaciones que queda fuera del intervalo:
( )x xx 2 s , x 2 s− ⋅ + ⋅
Aplicando este teorema, podemos saber que porcentaje como mucho puede quedar fuera del intervalo:
i xx x 2 s 2
1f 0,25
2− > ⋅ < =
Consecuentemente, el porcentaje de observaciones que como máximose situaría fuera de tal intervalo sería del 25%.
38© Antonio Pajares Ruiz
5. TEOREMA DE TCHEBYCHEV.
1365ni
1514115Ni
4210xi
Ej.: A partir de la distribución conocida del “Nº hijos” de 15 personas, queremos saber qué porcentaje exacto de los individuos quedaría fuera del intervalo comprendido entre el nº medio de hijos menos dos veces la desviación típica y tal nº medio más dos veces esta desviación, sin utilizar ni la media ni la desviación típica.
Recordando los valores de media y varianza, ya determinados anteriormente, podemos concretar los extremos del intervalo:
x 1,0667=
Se pide determinar el porcentaje de individuos que queda fuera del intervalo. Como quiera que no hay ningún individuo con menos de-1,06 hijos, bastará con averiguar qué porcentaje de individuos tiene más de 3,19 hijos. Ello se determinará concretando el orden delpercentil que igual a dicho valor.
xs 1,0625=
( )1,0667 2 1,0625;1,0667 2 1,0625− ⋅ + ⋅
( )1,0583; 3,1917−
39© Antonio Pajares Ruiz
5. TEOREMA DE TCHEBYCHEV.
1365ni
1514115Ni
4210xi
Ej.: A partir de la distribución conocida del “Nº hijos” de 15 personas, queremos saber qué porcentaje exacto de los individuos quedaría fuera del intervalo comprendido entre el nº medio de hijos menos dos veces la desviación típica y tal nº medio más dos veces esta desviación, sin utilizar ni la media ni la desviación típica.
Porcentaje de individuos con número de hijos fuera del intervalo:
rP 3,1917=
Consecuentemente, el porcentaje de observaciones por encima de dicho valor sería del 6,67%.
14r 100 93,33
15= ⋅ =
100 93,33 6,67− =
( )1,0583; 3,1917−
Orden del percentil que es igual a 3,1917:
40© Antonio Pajares Ruiz
5. TEOREMA DE TCHEBYCHEV.Ej.: A partir de la distribución conocida de la “Altura (en cm.)” de 15 personas, queremos saber qué porcentaje como mínimo de las 15 personas tienen alturas con un desfase respecto de la media de a lo sumo 1,5 veces su desviación típica.
Se quiere conocer el porcentaje de observaciones que queda dentro del intervalo:
( )x xx 1,5 s , x 1,5 s− ⋅ + ⋅
Aplicando el teorema, podemos saber que porcentaje mínimo de observaciones estaría en el intervalo:
i xx x 1.5 s 2
1f 1 0,5556
1,5− ≤ ⋅ ≥ − =
Consecuentemente, como mínimo, dentro del intervalo, estaría el 55,56% de las observaciones.
3
2
6
4
ni
190-195
180-190
170-180
160-170
ALTURA
41© Antonio Pajares Ruiz
5. TEOREMA DE TCHEBYCHEV.
Recordando los valores de media y varianza, ya determinados anteriormente, podemos concretar los extremos del intervalo:
x 177,1667=
Se quiere determinar el porcentaje de individuos que está dentro del intervalo. Para ello, bastará con averiguar qué porcentaje de individuos miden menos de 191,91 cm. y restar al mismo el porcentaje de individuos que miden menos de 162,43 cm. Para ello, procedemos a concretar el orden de los percentiles que son iguales a tales valores.
xs 9,8263=
( )177,1667 1,5 9,8263;177,1667 1,5 9,8263− ⋅ + ⋅
( )162,4273;191,9061
Ej.: A partir de la distribución conocida de la “Altura (en cm.)” de 15 personas, queremos saber qué porcentaje exacto de las 15 personas tienen alturas con un desfase respecto de la media de a lo sumo 1,5 veces su desviación típica.
3
2
6
4
ni
190-195
180-190
170-180
160-170
ALTURA
42© Antonio Pajares Ruiz
5. TEOREMA DE TCHEBYCHEV.
Porcentaje de individuos con alturas pertenecientes al intervalo:
rP 191,9061=
15r 12100191,9061 190 5
3
⋅ −= + ⋅
( )162,4273;191,9061Orden del percentil que es igual a 191,9061:
Ej.: A partir de la distribución conocida de la “Altura (en cm.)” de 15 personas, queremos saber qué porcentaje exacto de las 15 personas tienen alturas con un desfase respecto de la media de a lo sumo 1,5 veces su desviación típica.
3
2
6
4
ni
15
12
10
4
Ni
190-195
180-190
170-180
160-170
ALTURA
rP 191,9061 (190, 195]= ∈
r 87,62=
Consecuentemente, un 87,62% de los individuos miden menos de 191,9061 cm.
43© Antonio Pajares Ruiz
5. TEOREMA DE TCHEBYCHEV.
Porcentaje de individuos con alturas pertenecientes al intervalo: ( )162,4273;191,9061
Ej.: A partir de la distribución conocida de la “Altura (en cm.)” de 15 personas, queremos saber qué porcentaje exacto de las 15 personas tienen alturas con un desfase respecto de la media de a lo sumo 1,5 veces su desviación típica.
3
2
6
4
ni
15
12
10
4
Ni
190-195
180-190
170-180
160-170
ALTURA
rP 162,4273=
15r 0100162,4273 160 10
4
⋅ −= + ⋅
Orden del percentil que es igual a 162,4273:
rP 162,4273 (160, 170]= ∈
r 6,47=
Así, dado que un 6,47% de los individuos miden menos de 162,4273cm., el porcentaje de individuos que miden entre ambas alturas sería:
87,62 6,47 81,15%− =
top related