2. estad°stica descriptiva
Post on 14-Apr-2015
53 Views
Preview:
TRANSCRIPT
1
UNIVERSIDAD DE LOS ANDES
Facultad de Ingeniería
Departamento de Ingeniería Industrial
Probabilidad y Estadística I
Sesión # 2
Estadística Descriptiva y
Representación Gráfica de Datos Estadísticos
Mario Castillo (Coordinador General Curso)
2
CONTENIDO
1. CONTEXTO GENERAL
- Escalas de Medición
- Población
- Variables Aleatorias
- Muestras
2. DISTRIBUCIÓN DE FRECUENCIAS DE UNA VARIABLE ALEATORIA
- Variables discretas
- Variables continuas
- Variables categóricas
3. ESTADÍSTICAS BÁSICAS
Medidas de Tendencia
- Media Muestral
- Mediana Muestral
- Percentiles y Cuartiles
Medidas de Variabilidad
- Varianza Muestral
- Desviación Muestral
4. CASOS DE APLICACIÓN
3
Escalas de Medición
1. Contexto General
1. RAZÓN: Variables numéricas que representan magnitudes. Cuentan con un orden
lógico, permite medir distancias y cuentan con un cero absoluto (altura, peso,
distancia).
2. INTERVALO: Variables numéricas que representan magnitudes. Cuentan con un
orden lógico y permite medir distancias. Carecen de un cero absoluto
(temperatura: Distancia entre 10 y 12 grados es igual a la distancia entre 15 y 17
grados. No se puede establecer que una temperatura de 10 grados equivale a la
mitad de una temperatura de 20 grados. Una temperatura de 0 grados no significa
que hay ausencia de temperatura).
3. ORDINAL: Variables numéricas que representan una categoría o identifican un
grupo de pertenencia. Cuentan con un orden lógico (Pregrado = 0, Postgrado = 1).
4. NOMINAL: Variables numéricas que representan una categoría o identifican un
grupo de pertenencia. No cuentan con un orden lógico (Mujer = 0, Hombre = 1).
4
Escalas de Medición
1. Contexto General
Escala Descripción Ejemplos
Estadísticas
Descriptivas
Permitidas
Razón
1. Para dos valores x1 y x2 el
cociente x1/x2 es una
cantidad con un significado
práctico. El 0 corresponde a
la ausencia del atributo.
2. Para dos valores x1 y x2 la
distancia (x1- x2) es una
cantidad con un significado
práctico
3. Hay un orden natural
(ascendente o descendente)
de los valores a través de la
escala.
• Longitud
• Peso
• Estatura
• Dinero
La media geométrica,
la media armónica, la
media, el rango y la
desviación estándar
Intervalo
Satisface las propiedades 2 y 3
de la escala de Razón, pero no
la 1.
• Temperatura
(Celsius o
Fahrenheit)
• Años Calendario.
• Talla de zapatos.
El rango, la media y la
desviación estándar.
5
Escalas de Medición
1. Contexto General
Escala Descripción Ejemplos
Estadísticas
Descriptivas
Permitidas
Ordinal
Satisface únicamente la
tercera propiedad de la escala
de Razón.
• Clasificación de
los equipos en un
torneo
• Estratos
•Calificaciones A,
B, C
Los percentiles.
Nominal
•No satisface ninguna de las
propiedades de la escala de
Razón.
•Comprende variables que
identifican atributos o
cualidades.
•Color de los ojos
• Género
•Número de
teléfono
El porcentaje y la
moda.
6
POBLACIÓN
Conjunto (personas, cosas u objetos abstractos) del cual se quiere estudiar ciertas propiedades características de los elementos que lo conforman. Dichas propiedades se expresan a través de variables que denotaremos por X, Y y Z, por ejemplo.
MUESTRA ALEATORIA
Conceptualmente: una muestra aleatoria de tamaño n de una población es un subconjunto de n elementos de la población seleccionados de acuerdo con un procedimiento aleatorio que garantice su representatividad.
Formalmente: Una MA de una población X, consiste en un conjunto X1, X2, ..., Xn de n Variables Aleatorias independientes que tienen la misma distribución que la VA X.
1. Contexto General
7
Distribución de Frecuencias de una Variable Aleatoria Variables Discretas
Intensidad del tráfico
0
2
4
6
8
10
12
14
16
Intensidad del tráfico 3 11 10 15 9
1 2 3 4 5
Facilidad de parqueo
0
5
10
15
20
25
Facilidad de parqueo 4 6 7 9 22
1 2 3 4 5
Visibilidad y facilidad de acceso al punto
0
2
4
6
8
10
12
14
16
Visibilidad y facilidad de
acceso al punto
4 14 7 13 10
1 2 3 4 5
8
Promedio Transacciones 3 Últimos Meses
0
2
4
6
8
10
12
14
400 o
menos
401-
600
601-
800
801-
1000
1001-
1200
1201-
1400
1401-
1600
1601-
1800
1801-
2000
2001-
2200
2201-
2400
2400 o
más
Transacciones
Mensuales
Fre
cuencia
2. Distribución de Frecuencias de una Variable Aleatoria
Variables Continuas
Histograma Variable Ingresos Cajero
0
2
4
6
8
10
12
6000
00
8000
00
1000
000
1200
000
1400
000
1600
000
1800
000
2000
000
2200
000
2400
000
2600
0000
2800
0000
y m
ayor
...
Clase
Fre
cu
en
cia
9
2. Distribución de Frecuencias de una Variable Aleatoria
Variables Categóricas
Estrato
0
2
4
6
8
10
12
14
16
2 3 4 5 6
Estrato
10
Consideremos una Muestra Aleatoria x1, x2, …, xn de una población dada.
• La Media Muestral se define por:
• La Mediana Muestral
Corresponde al valor medio de las n observaciones.
Para calcularlo, se ordenan las n observaciones (incluyendo las que tienen
valores repetidos)
Si n es impar: mediana = [(n +1)/2] ésimo valor de la muestra.
Si n es par: mediana =
promedio entre el [n /2] ésimo y el [(n/2) + 1] ésimo
valores de la muestra.
3. Estadísticas Básicas - Medidas de Tendencia
nXn
ii /)(
1
X
11
Mediana Muestral - Ejemplo
= (10.2 + 10.9)/2
Si n es impar:
mediana = [(n +1)/2]
ésimo valor de la muestra.
Si n es par: mediana =
promedio entre el [n /2] ésimo
y el [(n/2) + 1] ésimo
valores de la muestra.
12
Considere los siguientes datos sobre la concentración de globulina receptora, para una muestra
de mujeres con pruebas de laboratorio de evidente anemia por deficiencia de hierro:
x1 = 15.2 x2 = 9.3 x3 = 7.6 x4 = 11.9 x5 = 10.4 x6 = 9.7
x7 = 20.4 x8 = 9.4 x9 = 11.5 x10 = 16.2 x11 = 9.4 x12 = 8.3
Determine la mediana muestral de las observaciones.
a. 11.61
b. 9.7
c. 9.4
d. 10.05
13
Si n es impar: mediana = [(n +1)/2] ésimo valor de la muestra.
Si n es par: mediana =
promedio entre el [n /2] ésimo
y el [(n/2) + 1] ésimo
valores de la muestra.
1 15.2 7.6
2 9.3 8.3
3 7.6 9.3
4 11.9 9.4
5 10.4 9.4
6 9.7 9.7
7 20.4 10.4
8 9.4 11.5
9 11.5 11.9
10 16.2 15.2
11 9.4 16.2
12 8.3 20.4
Media Muestral 11.61
Mediana 10.05
Ejercicio Mediana Muestral – Respuesta
= (9.7 + 10.4)/2
14
Relación Medidas de Tendencia
15
16
n
ii xx
nS
1
22
1
1
Estadísticas Básicas - Medidas de Variabilidad
Varianza Muestral
Desviación Estándar Muestral
s =
2S
17
Varianza Muestral - Ejemplo
n
ii xx
nS
1
22
1
1
18
Considere los siguientes datos sobre la concentración de globulina receptora, para una
muestra de mujeres con pruebas de laboratorio de evidente anemia por deficiencia de
hierro:
x1 = 15.2 x2 = 9.3 x3 = 7.6 x4 = 11.9 x5 = 10.4 x6 = 9.7
x7 = 20.4 x8 = 9.4 x9 = 11.5 x10 = 16.2 x11 = 9.4 x12 = 8.3
Determine la varianza muestral de las observaciones.
a. 3.79
b. 3.63
c. 14.41
d. 13.21
19
Ejercicio Varianza Muestral – Solución
xi
15,2 12,9000694
9,3 5,32840278
7,6 16,0667361
11,9 0,08506944
10,4 1,46006944
9,7 3,64173611
20,4 77,2934028
9,4 4,87673611
11,5 0,01173611
16,2 21,0834028
9,4 4,87673611
8,3 10,9450694
Σxi = 139,3 158,569167
11,6083333 s2 = 14,4153788x
2)( xx
i
2
)( xxi
n
ii xx
nS
1
22
1
1
20
Estadísticas Básicas y
Cuartiles y Percentiles
Estadísticos
salary
474
0
34419,57
28875,00
17075,66
3E+008
15750,00
135000,00
21000,00
22950,00
24000,00
24825,00
26700,00
28875,00
30750,00
34500,00
37162,50
41100,00
59700,00
Válidos
Perdidos
N
Media
Mediana
Desv. típ.
Varianza
Mínimo
Máximo
10
20
25
30
40
50
60
70
75
80
90
Percentiles
21
ANÁLISIS DEL PUNTAJE UNIANDES CON BASE EN EL
RENDIMIENTO DE LOS ESTUDIANTES DE PRIMER
SEMESTRE DE 2000-II
Realizado por: Carlos Castellanos
Dirigido por: Mario Castillo
22
OBJETIVOS
• Analizar la población de los estudiantes que cursaron primer semestre en el segundo periodo del 2000 respecto a su desempeño académico y su relación con el puntaje Uniandes.
• Analizar la capacidad de predicción del puntaje Uniandes.
• Formular las conclusiones y recomendaciones.
23
METODOLOGÍA
• Análisis descriptivo
• General
• Por programa
• Por colegio
• Análisis estadístico avanzado
• Factorial
• Discriminante
24
¿Qué es un estudiante exitoso?
Se define como exitoso al estudiante que logre un promedio
acumulado superior a 3.25; sin embargo, el punto de corte se
maneja como un parámetro. Se toma como otro punto de
referencia un promedio acumulado de 3.5
25
Promedio de los estudiantes de segundo semestre del 2000
4.884.63
4.384.13
3.883.63
3.383.13
2.882.63
2.382.13
1.881.63
Histogram
Fre
qu
en
cy70
60
50
40
30
20
10
0
Std. Dev = .50
Mean = 3.66
N = 575.00
HISTOGRAMA DEL PROMEDIO ACUMULADO
26
Puntaje uniandes total
775.0
725.0
675.0
625.0
575.0
525.0
475.0
425.0
375.0
325.0
275.0
225.0
HistogramF
req
ue
ncy
50
40
30
20
10
0
Std. Dev = 139.74
Mean = 458.4
N = 575.00
HISTOGRAMA DEL PUNTAJE TOTAL UNIANDES
27
1 2 3 4 5
Variables 20% inferior Entre el 20 y el 40% Entre el 40 y el 60% Entre el 60 y el 80% 20% superior
Quintiles
Promedio acumulado
Puntaje uniandes total <320
<3.28
321-406 407-494.6 494.7-596 >596
3.29-3.53 3.54-3.8 3.81-4.08 >4.08
DISTRIBUCIÓN POR QUINTILES
28
Quintiles N Medias Std. Deviation
Promedios del quintil 20 % inferior del puntaje uniandes 116 3.39 0.42
Promedios entre el 20% y 40% del puntaje uniandes 115 3.53 0.43
Promedios entre el 40% y el 60% del puntaje uniandes 114 3.58 0.50
Promedios entre el 60% y el 80% del puntaje uniandes 117 3.78 0.39
Promedios del 20% superior del puntaje uniandes 113 4.01 0.49
MEDIAS DE LOS PROMEDIOS ACUMULADOS POR QUINTILES
29
44 31 21 14 6 116
27 35 19 23 11 115
26 25 27 20 16 114
14 16 30 31 26 117
8 8 15 30 52 113
119 115 112 118 111 575
20.00
40.00
60.00
80.00
100.00
Quint iles
del
puntaje
uniandes
Total
20.00 40.00 60.00 80.00 100.00
Quint iles del promedio acumulado
Total
Quintiles del puntaje uniandes * Quintiles del promedio acumulado
Tabulación Cruzada
30
ANÁLISIS DE LOS COLEGIOS DE MÁS APORTE
Código Colegio Ciudad N TOT_PROM %Prom inf. a 3.25 %Prom inf. a 3.5
19489 BOGOTA D.C. 8 4.23 0.00 12.50
19472 BOGOTA D.C. 33 4.07 3.03 12.12
24299 BOGOTA D.C. 18 4.01 5.56 5.56
24281 BOGOTA D.C. 13 3.92 15.38 23.08
55988 BOGOTA D.C. 14 3.91 7.14 7.14
19513 BOGOTA D.C. 18 3.82 0.00 11.11
19331 BOGOTA D.C. 13 3.81 15.38 15.38
19422 BOGOTA D.C. 8 3.81 25.00 25.00
19349 BOGOTA D.C. 23 3.79 8.70 17.39
36723 BOGOTA D.C. 13 3.79 7.69 15.38
19364 BOGOTA D.C. 31 3.66 12.90 19.35
16741 CALI, VALLE 9 3.66 22.22 44.44
19505 BOGOTA D.C. 16 3.62 12.50 43.75
19497 BOGOTA D.C. 7 3.6 14.29 57.14
62497 BOGOTA D.C. 12 3.59 0.00 41.67
19448 BOGOTA D.C. 29 3.55 24.14 27.59
46490 BOGOTA D.C. 14 3.54 14.29 42.86
16774 CALI, VALLE 5 3.51 20.00 60.00
62208 BOGOTA D.C. 7 3.5 14.29 57.14
4234 CARTAGENA, BOLIVAR 7 3.49 28.57 42.86
21899 BOGOTA D.C. 12 3.43 33.33 58.33
25395 BOGOTA D.C. 11 3.38 36.36 63.64
34306 BOGOTA D.C. 7 3.28 42.86 85.71
19430 BOGOTA D.C. 9 3.27 55.56 66.67
22574 BOGOTA D.C. 5 3.16 40.00 80.00
31
CROSSTABS
32
QUINTILES IDENTIFICADOS
Quintiles
PROMEDIO EN
MATEMÁTICAS
PROMEDIO
EN FÍSICA
PUNTAJE
UNIANDES FISICA
MATE-
MATICAS QUIMICA
20 2,80 2,67 361 50 45 52
40 3,11 3,00 444 54 48 55
60 3,39 3,33 518 57 52 59
80 3,72 3,67 608 61 56 63
33
QUINTILES ICFES EN MATEMÁTICAS VS.
PROMEDIO EN MATEMÁTICAS
Tabla de contingencia Quintiles Matemáticas ICFES * Quintiles cursos Matemáticas
94 99 90 54 38 375
25,1% 26,4% 24,0% 14,4% 10,1% 100,0%
83 67 66 48 42 306
27,1% 21,9% 21,6% 15,7% 13,7% 100,0%
113 104 106 104 77 504
22,4% 20,6% 21,0% 20,6% 15,3% 100,0%
75 90 95 94 85 439
17,1% 20,5% 21,6% 21,4% 19,4% 100,0%
44 56 84 97 152 433
10,2% 12,9% 19,4% 22,4% 35,1% 100,0%
409 416 441 397 394 2057
19,9% 20,2% 21,4% 19,3% 19,2% 100,0%
Recuento
% de Quintiles
Matemáticas ICFES
Recuento
% de Quintiles
Matemáticas ICFES
Recuento
% de Quintiles
Matemáticas ICFES
Recuento
% de Quintiles
Matemáticas ICFES
Recuento
% de Quintiles
Matemáticas ICFES
Recuento
% de Quintiles
Matemáticas ICFES
1
2
3
4
5
Quint iles
Matemáticas
ICFES
Total
1 2 3 4 5
Quint iles cursos Matemáticas
Total
34
QUINTILES ICFES EN QUÍMICA VS.
PROMEDIO EN MATEMÁTICAS
Tabla de contingencia Quintiles Química ICFES * Quinti les cursos Matemáticas
122 85 68 37 16 328
37,2% 25,9% 20,7% 11,3% 4,9% 100,0%
107 108 71 69 46 401
26,7% 26,9% 17,7% 17,2% 11,5% 100,0%
102 93 111 91 56 453
22,5% 20,5% 24,5% 20,1% 12,4% 100,0%
55 82 108 93 81 419
13,1% 19,6% 25,8% 22,2% 19,3% 100,0%
23 48 83 107 195 456
5,0% 10,5% 18,2% 23,5% 42,8% 100,0%
409 416 441 397 394 2057
19,9% 20,2% 21,4% 19,3% 19,2% 100,0%
Recuento
% de Quintiles
Química ICFES
Recuento
% de Quintiles
Química ICFES
Recuento
% de Quintiles
Química ICFES
Recuento
% de Quintiles
Química ICFES
Recuento
% de Quintiles
Química ICFES
Recuento
% de Quintiles
Química ICFES
1
2
3
4
5
Quint iles
Química
ICFES
Total
1 2 3 4 5
Quint iles cursos Matemáticas
Total
35
Tabla de contingencia Quintiles Puntaje Uniandes * Quintiles cursos Matemáticas
146 110 82 43 20 401
36,4% 27,4% 20,4% 10,7% 5,0% 100,0%
104 99 93 80 33 409
25,4% 24,2% 22,7% 19,6% 8,1% 100,0%
91 84 97 83 58 413
22,0% 20,3% 23,5% 20,1% 14,0% 100,0%
54 83 99 90 89 415
13,0% 20,0% 23,9% 21,7% 21,4% 100,0%
14 40 70 101 194 419
3,3% 9,5% 16,7% 24,1% 46,3% 100,0%
409 416 441 397 394 2057
19,9% 20,2% 21,4% 19,3% 19,2% 100,0%
Recuento
% de Quintiles
Puntaje Uniandes
Recuento
% de Quintiles
Puntaje Uniandes
Recuento
% de Quintiles
Puntaje Uniandes
Recuento
% de Quintiles
Puntaje Uniandes
Recuento
% de Quintiles
Puntaje Uniandes
Recuento
% de Quintiles
Puntaje Uniandes
1
2
3
4
5
Quint iles
Puntaje
Uniandes
Total
1 2 3 4 5
Quint iles cursos Matemáticas
Total
QUINTILES EN PUNTAJE UNIANDES VS.
PROMEDIO EN MATEMÁTICAS
top related