universidad de sonora - departamento de matemáticasftapia/documentos de clase/clases del dia...
Post on 30-Oct-2019
0 Views
Preview:
TRANSCRIPT
Materia: Estadística I
Maestro: Dr. Francisco Javier Tapia Moreno
Semestre: 2015-2
Universidad de SonoraDepartamento de Matemáticas
Área Económico Administrativa
Hermosillo, Sonora, a 21 de septiembre de 2015.
Introducción
Las medidas de forma evalúan la forma que adopta la
distribución de frecuencias respecto al grado de distorsión
(inclinación) que registra respecto a valor promedio tomado
como centro de gravedad, el grado de apuntamiento
(elevamiento) de la distribución de frecuencias.
A mayor elevamiento de la distribución de frecuencia
significará mayor concentración de los datos en torno al
promedio, por tanto, una menor dispersión de los datos.
Las medidas que estimaremos en esta ocasión son:
1. La asimetría , 2. el sesgo y 3. La curtosis.
3
Simetría. Se dice que la distribución es simétrica cuando los datos de una población se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la media aritmética.
A. Si la distribución de frecuencias es unimodal, entonces Mediana = Moda = Media.
B. Si la distribución de frecuencia es simétrica, entonces Mediana = Moda = Media (el recíproco no siempre es cierto)
C. Para distribuciones bimodales y rectangulares sólo la media y la mediana son idénticas:
La simetría determina que la población es homogénea en relación a la variable de estudio.
4
Medidas de forma Asimetría. Se clasifica como asimétrica toda distribución
donde los datos menores que la media aritmética son
más frecuentes que los datos mayores que la media, o
viceversa. En este caso, se dice que la población es
heterogénea para la variable en estudio.
1.Distribución asimétrica a la derecha: los datos mayores
que la media aritmética son menos frecuentes que los
datos menores que la media.
La media tiene el valor más
grande de las tres medidas de
tendencia central en una
distribución asimétrica positiva.
5
Medidas de forma
2.Distribución asimétrica a la izquierda: los datos por debajo
de la media aritmética son menos frecuentes que los mayores.
La media tiene el valor más
pequeño de las tres medidas de
tendencia central en una
distribución asimétrica negativa.
6
Coeficiente de asimetría de Pearson.
Resultados posibles:
a) Si Sk < 0 entonces la distribución es asimétrica a la izquierda.
b) Si Sk = 0 entonces la distribución es simétrica.
c)Si Sk > 0 entonces la distribución es asimétrica a la derecha.
estándar Desviación
Mediana)(Media*3Sk
a) b) c)
Coeficiente de Asimetría de Fisher.
Donde Af representa el coeficiente de asimetría de Fisher, Xi cada
uno de los valores de la población, (µ) la media de la población, σ
la desviación estándar de la población, y (fi) la frecuencia de cada
valor.
Donde Af representa el coeficiente de asimetría de Fisher, Xi cada
uno de los valores en la muestra, 𝑋 la media de la muestra, S la
desviación estándar de la muestra, y (fi) la frecuencia de cada
valor.
3
1
3)(
N
fX
Ai
k
i
i
f
3
1
3)(
Sn
fXX
Ai
k
i
i
f
Los resultados posibles son:
a) Si Af < 0 entonces la distribución está sesgada a la izquierda.
b) Si Af = 0 entonces la distribución no está sesgada.
c)Si Af > 0 entonces la distribución está sesgada a la derecha.
a) b) c)
Interpretación del coeficiente de asimetría de Fisher Af .
Af < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha).
Af = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media).
Af > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda).
El Coeficiente de Curtosis de Fisher analiza el
grado de concentración que presentan los valores alrededor
de la zona central de la distribución.
Se definen 3 tipos de distribuciones según su grado de
curtosis:
El Coeficiente de Curtosis para la población se calcula usando
Donde (Cf) representa el coeficiente de curtosis de Fisher, (Xi)
cada uno de los valores, (µ) la media de la población, σ la
desviación estándar de la población, y (fi) la frecuencia de cada
valor.
Para la muestra se usa la fórmula
Donde (Cf) representa el coeficiente de curtosis de Fisher, (Xi)
cada uno de los valores de la muestra, (𝑋 ) la media de la
muestra, S la desviación estándar de la muestra, y (fi) la
frecuencia de cada valor.
3
)(
4
1
4
N
fX
Ci
k
i
i
f
3
)(
4
1
4
Sn
fXX
Ci
k
i
i
f
a) Si Af < 0 La distribución es platicúrtica y presenta un reducido
grado de concentración alrededor de los valores centrales de la
variable.
b) Si Af = 0 la distribución es mesocúrtica y presenta un grado de
concentración promedio alrededor de los valores centrales de la
variable (el mismo que presenta una distribución normal).
c) Af > 0 la distribución es leptocúrtica y presenta un elevado
grado de concentración alrededor de los valores centrales de la
variable.
a) b) c)
Ejemplo 1: Una granja ganadera regional, registró durante el
mes de febrero 2015 el nacimiento de 14 terneros
respectivamente, cuyos pesos al nacer (en kilogramos) fueron
los siguientes: 22, 31, 32, 44, 35, 36, 37, 38, 44, 49, 40, 50,
41.
Resolución. Para calcular el coeficiente de asimetría de
Pearson se requiere obtener los valores de la media, la
mediana y la desviación estándar que ya fueron obtenidas en
clases anteriores. La media es 38.5 kg, la mediana es 39 kg y la
desviación estándar es 7.36676529 kg. Así que
𝑨𝑷 =𝟑 ∗ (𝟑𝟖. 𝟓 − 𝟑𝟗)
𝟕. 𝟑𝟔𝟔𝟕𝟔𝟓𝟐𝟗= −𝟎. 𝟐𝟎𝟑𝟔𝟏𝟕𝟏𝟖
Se concluye que la distribución de los pesos de los corderos es
asimétrica negativa. Es decir, hay más corderos que pesan
menos del promedio.
Para calcular los coeficientes de asimetría y curtosis de Fisher,
elaboramos una tabla como la de la diapositiva siguiente.
Tabla para calcular los coeficientes de asimetría y
curtosis de Fisher
Ternero X 𝑿 − 𝑿 𝑿− 𝑿 𝟐 𝑿 − 𝑿 𝟑 𝑿 − 𝑿 𝟒
1 22 22 − 38.5 = −16.5 272.25 -4492.125 74120.0625
2 31 31 − 38.5 = −7.5 56.25 -421.875 3164.0625
3 32 32 − 38.5 = −6.5 42.25 -274.625 1785.0625
4 44 44 − 38.5 = 5.5 30.25 166.375 915.0625
5 35 35 − 38.5 = −3.5 12.25 -42.875 150.0625
6 36 36 − 38.5 = −2.5 6.25 -15.625 39.0625
7 37 37 − 38.5 = −1.5 2.25 -3.375 5.0625
8 38 38 − 38.5 = −0.5 0.25 -0.125 0.0625
9 44 44 − 38.5 = 5.5 30.25 166.375 915.0625
10 49 49 − 38.5 = 10.5 110.25 1157.625 12155.0625
11 40 40 − 38.5 = 1.5 2.25 3.375 5.0625
12 40 40 − 38.5 = 1.5 2.25 3.375 5.0625
13 50 50 − 38.5 = 11.5 132.25 1520.875 17490.0625
14 41 41 − 38.5 = 2.5 6.25 15.625 39.0625
Totales 539 0 705.5 -2217 110787.875
Aplicamos las relaciones dadas anteriormente para calcular los
coeficientes de asimetría y curtosis de Fisher. Esto es,
𝑨𝒇 =−𝟐𝟐𝟏𝟕
𝟏𝟒 ∗ (𝟕. 𝟑𝟔𝟔𝟕𝟔𝟓𝟐𝟗)𝟑= −𝟎. 𝟑𝟗𝟔𝟏𝟎𝟐𝟏𝟏
Se concluye que la distribución de los pesos de los corderos
está sesgada a la izquierda. Es decir, existe mayor
concentración de valores a la izquierda de la media que a su
derecha).
Similarmente calculamos el coeficiente de curtosis.
𝑪𝒇 =𝟏𝟏𝟎𝟕𝟖𝟕. 𝟖𝟕𝟓
𝟏𝟒 ∗ (𝟕. 𝟑𝟔𝟔𝟕𝟔𝟓𝟐𝟗)𝟒− 𝟑 = 𝟎. 𝟑𝟏𝟑𝟎𝟔𝟔𝟖𝟑
Se concluye que la distribución es leptocúrtica y presenta un
elevado grado de concentración alrededor de los valores
centrales de la variable.
Ejemplo 2. Se ha tomado una muestra de 48 personas y se les ha
preguntado el número de revistas que leen al mes. Los resultados
son los siguientes:
Número de
revistas
Número de
personas
1 1
2 20
3 12
4 10
5 3
6 2
Total 48
Calcular e interpretar las
medidas de forma siguientes:
a) Coeficiente de asimetría
de Pearson.
a) Coeficiente de asimetría
de Fisher
b) Coeficiente de curtosis de
Fisher
Ejemplo con datos resumidos.
Resolución. Para calcular el coeficiente de asimetría de Pearson
se requiere obtener los valores de la media, la mediana y la
desviación estándar que ya fueron obtenidas en clases anteriores.
La media es 3 revistas, la mediana es 3 revistas y la desviación
estándar es 1.16691993 revistas. Así que
𝑨𝑷 =𝟑 ∗ (𝟑 − 𝟑)
𝟏. 𝟏𝟔𝟔𝟗𝟏𝟗𝟗𝟑= 𝟎.
Se concluye que la distribución de la lectura de las revistas es
simétrica. Es decir, existe la misma concentración de valores a la
derecha y a la izquierda de la media).
Para calcular los coeficientes de asimetría y curtosis de Fisher,
elaboramos una tabla como la de la diapositiva siguiente.
Ejemplo con datos resumidos.
No. de
Revistas
𝑿𝒊
No. de
Personas.
𝒇𝒊
𝒇𝒊 ∗ 𝑿𝒊 𝒇𝒊*(𝑿𝒊 − 𝑿 ) 𝒇𝒊* 𝑿𝒊 − 𝑿 𝟐 𝒇𝒊* 𝑿𝒊 − 𝑿 𝟑 𝒇𝒊* 𝑿𝒊 − 𝑿 𝟒
1 1 1
1*(1-3)= -2 1 ∗ (1 − 3)2 = 4 1 ∗ (1 − 3)3 = -8 1 ∗ (1 − 3)4 = 16
2 20 40
20*(2-3)= -20 20∗ 2 − 3 2 = 20 20∗ 2 − 3 3 = −20 20∗ 2 − 3 4 = 20
3 12 36
12*(3-3)= 0 12 ∗ (3 − 3)2= 0 12 ∗ (3 − 3)3= 0 12 ∗ (3 − 3)4= 0
4 10 40
10*(4-3)= 10 10 ∗ (4 − 3)2=10 10 ∗ (4 − 3)3=10 10 ∗ (4 − 3)4=10
5 3 15
3*(5-3)= 6 3 ∗ (5 − 3)2=12 3 ∗ (5 − 3)3= 24 3 ∗ (5 − 3)4= 48
6 2 12
2*(6-3)= 6 2 ∗ (6 − 3)2=18 2 ∗ (6 − 3)3= 54 2 ∗ (6 − 3)2= 162
Totales 48 144 0 64 60 256
Aplicamos las relaciones dadas anteriormente para calcular los
coeficientes de asimetría y curtosis de Fisher. Esto es,
𝑨𝒇 =𝟔𝟎
𝟔 ∗ (𝟏. 𝟏𝟔𝟔𝟗𝟏𝟗𝟗𝟑)𝟑= 𝟔. 𝟐𝟗𝟑𝟐𝟕𝟔𝟔𝟖
Se concluye que la distribución de la lectura de revistas está
sesgada a la derecha. Es decir, existe mayor concentración de
valores a la derecha de la media que a su izquierda).
Similarmente calculamos el coeficiente de curtosis.
𝑪𝒇 =𝟐𝟓𝟔
𝟔 ∗ (𝟏. 𝟏𝟔𝟔𝟗𝟏𝟗𝟗𝟑)𝟒− 𝟑 = 𝟐𝟎. 𝟎𝟏𝟎𝟒𝟏𝟔𝟕
Se concluye que la distribución es leptocúrtica y presenta un
elevado grado de concentración alrededor de los valores
centrales de la variable.
top related