estadistica y probabilidad
DESCRIPTION
Estadistica inferencialTRANSCRIPT
ESTADÍSTICA DESCRIPTIVA
Describe el comportamiento de un conjunto de datos por medio de:
• Tablas de distribución de frecuencias
• Gráficas
• Calcula medidas de tendencia central
• Calcula medidas de dispersión
• Calcula medidas de posición (cuartiles y percentiles)
• Calcula medidas de forma (distribución)
COMPETENCIA:
Analizar conjuntos de datos por medio de métodos de estadística
descriptiva para conocer características de muestras o poblaciones
de origen biológico.
Se seleccionaron aleatoriamente a 40 estudiantes de una Facultad y se les determinó
el peso corporal. Se desea realizar la estadística descriptiva para estos datos:
Peso de los 40 estudiantes:
138 164 150 132 144 125 149 157
146 158 140 147 136 148 152 144
168 126 138 176 163 119 154 165 n = 40
146 173 142 147 135 153 140 135
161 145 135 142 150 156 145 128
Para realizar la Tabla de Distribución de Frecuencias: Se ordenan los datos ascendentemente
119 135 138 144 146 150 156 164
125 135 140 144 147 150 157 165
126 135 140 145 147 152 158 168
128 136 142 145 148 153 161 173
132 138 142 146 149 154 163 176
Rango = Xmax – Xmin = 176-119 = 57
El número de intervalos k = 1+3.32 ( log 40 ) = 6.32 consideremos 6 clases
El ancho del intervalo C = R / k = 57 / 6 = C = 9.5
Intervalos Frec.
Absolutas
Marca de
Clase
Frecuencias
Acumulativas
f Xi f a
119 – 128.5
128.5 – 138
138 – 147.5
147.5 – 157
157 – 166.5
166.5 – 176
C = 9.5
Frecuencias
Relativas
Frecuencia
Relativa
(%)
4
7
12
9
5
3
f = 40
123.75
133.25
142.75
152.25
161.75
171.25
4/40=0.100
7/40=0.175
12/40=0.30
9/40=0.225
5/40=0.125
3/40=0.075
10
17.5
30
22.5
12.5
7.5
4
11
23
32
37
40
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS
119 135 138 144 146 150 156 164
125 135 140 144 147 150 157 165
126 135 140 145 147 152 158 168
128 136 142 145 148 153 161 173
132 138 142 146 149 154 163 176
Datos ordenados ascendentemente:
HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
4
7
12
9
5
3
0
2
4
6
8
10
12
14
119.0-128.5 128.5-138.0 138.0-147.5 147.5-157.0 157.0-166.5 166.5-176.0
Fre
cue
nci
as a
bso
luta
s
Límites reales de clase
Histograma
0
2
4
6
8
10
12
14
114.25 123.75 133.25 142.75 152.25 161.75 171.25 180.75
Fre
cu
encia
s ab
solu
tas
Marcas de clase
Poligono de frecuencias
0
10
20
30
40
50
114.25 123.75 133.25 142.75 152.25 161.75 171.25
Fre
cue
nci
as a
cum
ula
tiva
s
Marcas de clase
Ojiva
MEDIDAS DE TENDENCIA CENTRAL
Moda = 135.0
Moda el dato que presenta la mayor frecuencia
Mediana el dato que parte a la mitad el conjunto
Mediana = 146.0
Media Aritmética
8.14640
176...125119Xi321
nn
XXXXX n
Sean X1, X2, X3, …. , Xn Las estaturas de n estudiantes medidas en metros
XX X X X
n
X
n
X
n
N j
1 2 3
El promedio o media aritmética estará dado por:
Qué es esto (Xm – X ) ?
En Matemáticas En Estadística
Diferencia o Resta Desviación o Variación
Qué es esto (Xm – X )2 ? Diferencia cuadrática Desviación cuadrática
Qué es esto Σ(Xi – X )2
------------ ?
n
Promedio de Promedio de
Diferencias cuadráticas Desviaciones cuadráticas
n
XXis
2
2)(
Es la varianza: promedio de desviaciones cuadráticas
Pero tenemos un problema: la varianza tiene unidades cuadráticas
y no se puede relacionar con media ni con los datos originales. Qué hacer?
2( )jX Xs
n
Esto es la Desviación Estándar. Mide el grado de variabilidad
de los datos respecto a su media
MEDIDAS DE DISPERSIÓN
RANGO = dato mayor – dato menor= 176-119 = 57
COEFICIENTE DE VARIACIÓN = C.V. = (12.89/146.8)*100 = 0.087*100 = 8.7%
1n
)XXi(s
2
2
VARIANZA = = 165.89
DESVIACIÓN ESTÁNDAR = S = √S² = √165.89 = 12.89
ERROR ESTÁNDAR = ES = S/√n = 12.89/√40 = 2.038
Donde: i (=1, 2, 3, …, 99) es el número del percentil y n el tamaño de muestra
MEDIDAS DE POSISCIÓN
10(40+1)
P10= ------------ = 4, el percentil 10 se encuentra en la posición 4 128.
100
90(40+1)
P90 = --------------- = 36.9, por lo tanto el P90 corresponde al promedio de los datos
100 en la posición 36 y 37; (164+165)/2 164.5
Percentiles
Cuartiles
Los cuartiles dividen a la distribución de los datos (ordenados ascendentemente) en
cuatro (4) partes iguales en frecuencia. El primer cuartil Q1 se encuentra en la posición
de n / 4, el Q2 corresponde con la mediana y el Q3 en 3n / 4.
Q1 = 138.0 Q2 = 146.0 Q3 = 154.0
SESGO
El sesgo es el grado de asimetría, o falta de simetría, de una distribución.
Si la curva de frecuencias (polígono de frecuencias suavizado) de una distribución
tiene una <cola> más larga a la derecha del máximo central que a la izquierda, se
dice de la distribución que está sesgada a la derecha o que tiene sesgo positivo. Si es
al contrario, se dice que está sesgada a la izquierda o que tiene sesgo negativo.
3( ) 3( )Media Mediana X MdSesgo
desviacion tipica s
Sesgo = 3(146.8-146)/12.89 = 0.18
Su interpretación es:
a) Si el sesgo = 0, la distribución es simétrica ( X = Md)
b) Si el sesgo > 0, la distribución es asimétrica a la derecha ( X > Md).
c) Si el sesgo < 0, la distribución e asimétrica a la izquierda ( X < Md).
En nuestro ejemplo el sesgo positivo de 0.18 indica que la distribución
es ligeramente asimétrica a la derecha.
MEDIDAS DE FORMA
Es el grado de apuntamiento de una distribución, normalmente se toma en relación a
la distribución normal. Una distribución que presenta un apuntamiento relativo alto,
se llama leptocúrtica, mientras que la curva más achatada, se llama platicúrtica. La
distribución, que ni es apuntada ni achatada, se llama mesocúrtica (normal).
CURTOSIS
KQ
P P
90 10
donde Q = ½(Q3 - Q1) es el rango semintercuartílico. Se conoce como
coeficiente de curtosis percentílico. Para la distribución normal es 0,263.
Para los pesos de los estudiantes curtosis = K = ½(155-138)/(164.5-128) = 0.233
Su interpretación es como sigue:
Si la curtosis = 0.263, la distribución es mesocúrtica ( normal).
Si la curtosis es > 0.263, la distribución es leptocúrtica (más apuntada que la normal).
Si la curtosis es < 0.263, entonces la distribución es platicúrtica (más plana que la normal).
En nuestro ejemplo el valor de la curtosis = 0.233 (menor que 0.263) indica que la
distribución es ligeramente platicúrtica.