sem 2-sesion 1 organizacionde datos
DESCRIPTION
estadisticaTRANSCRIPT
1
Estadística
ORGANIZACIÓN DE DATOS
2
OBJETIVOS
Organizar datos originales en una distribución de frecuencias.
Presentar datos utilizando representaciones gráficas como: gráfico de barras, y sectores circulares
Representar frecuencias en un Histograma Representar la distribución de frecuencias de dos o más
grupos de datos en un polígono de frecuencias
Al concluir este capitulo, el participante podrá:
3
ORGANIZACIÓN DE DATOSDatos
Datos Cualitativos Datos Cuantitativos
Método Tabular Método Gráfico Método Tabular Método Gráfico
• Tabla de resumen • Grafico de barras• Grafica Circular
• Tabla de distribución de frecuencias
• Histogramas• Ojivas• Diagrama de tallo y
hojas• Diagrama de
Dispersión.
4
Ejercicio 1:A través de una encuesta realizada a una muestra de 800 personas, se ha obtenido el tipo de seguro de salud al cual están afiliadas cada una de estas personas
ORGANIZACIÓN DE DATOS: Variables Cualitativas
Nº Tipo de Seguro Nº Tipo de Seguro Nº Tipo de Seguro1 Seguro integral de Salud 11 Seguro integral de Salud 21 Seguro de FF.AA./POLICIALES …2 ESSALUD 12 ESSALUD 22 ESSALUD …3 Seguro integral de Salud 13 No esta afiliado 23 No esta afiliado …4 Seguro integral de Salud 14 Seguro Privado de Salud 24 Seguro integral de Salud …5 ESSALUD 15 Seguro Privado de Salud 25 Seguro de FF.AA./POLICIALES …6 Seguro de FF.AA./POLICIALES 16 Seguro integral de Salud 26 ESSALUD …7 Seguro de FF.AA./POLICIALES 17 Seguro integral de Salud 27 Seguro integral de Salud …8 ESSALUD 18 No esta afiliado 28 ESSALUD …9 No esta afiliado 19 Seguro Privado de Salud 29 No esta afiliado …
10 Seguro integral de Salud 20 Seguro de FF.AA./POLICIALES 30 Seguro Privado de Salud …
5
ORGANIZACIÓN DE DATOS: Variables Cualitativas
f nNii
Frecuencia Absoluta
Frecuencia Relativa
Frecuencia Relativa
Procentualn i f i % f i
Categoria 1 n1 f1 % f1Categoria 2 n2 f2 % f2Categoria 3 n3 f3 % f3
…. … … …N 1 100
(Categorías)
ni : Frecuencia Absoluta Simple (Numero de casos para cada categoría)
fi : Frecuencia relativa
% fi : Frecuencia relativa porcentual
100*% fifi
6
ORGANIZACIÓN DE DATOS: Variables Cualitativas
30.0800240
1
11
f
Nnf
20.0800160
2
22
f
Nnf
%30100*30.0%100*%
1
11
fff
%20100*20.0%100*%
1
11
fff
Tipo de seguro Frec. Frec. Relativa % Frec. Relativa
ESSALUD 240.00 0.30 30.00Seguro Privado de Salud 160.00 0.20 20.00Seguro de FF.AA./POLICIALES 40.00 0.05 5.00Seguro integral de Salud 320.00 0.40 40.00No esta afiliado 40.00 0.05 5.00Total 800.00 1.00 100.00
7
POBLACIÓN POR TIPO DE SEGURO DE SALUD
30%
20%
5%
40%
5%ESSALUD
Seguro Privado de Salud
Seguro deFF.AA./POLICIALES
Seguro integral de Salud
No esta afiliado
Gráfico Circular
Gráfico de Barras
240.00
160.00
40.00
320.00
40.00
0
50
100
150
200
250
300
350
Nº P
ERSO
NA
S
ESSALUD SeguroPrivado
Seguro deFF.AA./PP
SIS No estaafiliado
TIPO DE SEGURO
POBLACIÓN POR TIPO DE SEGURO DE SALUD
8
ORGANIZACIÓN DE DATOS: Variables Cuantitativas
Datos Numéricos
Distribución de FrecuenciaY
Distribución Acumulada
Histograma OjivaPolígono de Frecuencias
Método Tabular
Método Gráfico
9
Ejercicio 2:En un centro poblado rural, se desea analizar las condiciones de vida. Para ello una de las variables del análisis, es el número de hijos de cada uno de los 1509 jefes de hogar del CC.PP.
ORGANIZACIÓN DE DATOS: Variables Cuantitativas Discretas
Nº de Hijos 2 2 8 7 8 7 2 2 7 1 1 4 2 2 8 9 4 46 4 7 6 1 3 5 1 0 1 1 7 5 3 7 2 0 41 4 8 5 6 8 7 2 7 1 3 0 1 4 4 4 6 56 10 9 1 3 3 5 3 5 3 2 3 7 9 10 1 2 7
… … … … … … … … … … … … … … … … … …3 8 5 9 3 9 1 7 2 9 3 2 1 2 8 6 6 8
10
Número de hijos
419 27,8 27,8255 16,9 44,7375 24,9 69,5215 14,2 83,8127 8,4 92,254 3,6 95,824 1,6 97,323 1,5 98,917 1,1 100,0
1509 100,0
01234567Ocho+Total
Frec.Frecuencia.Porcentual
Frec. Porcent.
acum.
ORGANIZACIÓN DE DATOS: Variables Cuant. Discre.Ejemplo
¿Cuántos Jefes de hogar tienen menos de 2 hijos? frec. indiv. sin hijos
+ frec. indiv. con 1 hijo = 419 + 255= 674 individuos
¿Qué porcentaje de jefes de hogar tiene 6 hijos o menos? 97,3%
¿Qué cantidad de hijos es tal que al menos el 50% de los jefes de hogar tiene una cantidad inferior o igual? 2 hijos
≥50%
11
ORGANIZACIÓN DE DATOS: Variables Cuantitativas Discretas
100*nxi
ixFrec
nxi
Frec Relativa
Frec Relativa
Porcentual
Para cada claseClase Frecuencia Frec
Relativa
FrecRelativa
Acumulada0 Hijos 419 0.278 0.2781 Hijo 255 0.169 0.4472 Hijos 375 0.249 0.6953 Hijos 215 0.142 0.8384 Hijos 127 0.084 0.9225 Hijos 54 0.036 0.9586 Hijos 24 0.016 0.9737 Hijos 23 0.015 0.989
8 Hijos y + 17 0.011 1.0001509 1.000
12
Clase Frecuencia FrecRelativa
FrecRelativa
Acumulada0 Hijos 419 0.278 0.2781 Hijo 255 0.169 0.4472 Hijos 375 0.249 0.6953 Hijos 215 0.142 0.8384 Hijos 127 0.084 0.9225 Hijos 54 0.036 0.9586 Hijos 24 0.016 0.9737 Hijos 23 0.015 0.989
8 Hijos y + 17 0.011 1.0001509 1.000
ORGANIZACIÓN DE DATOS: Variables Cuantitativas (Gráfico de Barras)
Gráfico de Barras: Nº de Hijos
255
375
215
127
5424 23 17
419
0
50
100
150
200
250
300
350
400
450
0 Hijos 1 Hijo 2 Hijos 3 Hijos 4 Hijos 5 Hijos 6 Hijos 7 Hijos > 8Hijos
Número de Hijos
Núm
ero
de In
divi
duos
13
Clase Frecuencia FrecRelativa
FrecRelativa
Acumulada0 Hijos 419 0.278 0.2781 Hijo 255 0.169 0.4472 Hijos 375 0.249 0.6953 Hijos 215 0.142 0.8384 Hijos 127 0.084 0.9225 Hijos 54 0.036 0.9586 Hijos 24 0.016 0.9737 Hijos 23 0.015 0.989
8 Hijos y + 17 0.011 1.0001509 1.000
ORGANIZACIÓN DE DATOS: Variables Cuantitativas (Gráfico Circular)
Gráfico Circula: Nº de Hijos
1.5%1.6%
3.6%
8.4%
1.1%
27.8%
16.9%24.9%
14.2%
0 Hijos
1 Hijo
2 Hijos
3 Hijos
4 Hijos
5 Hijos
6 Hijos
7 Hijos
8 Hijos y +
14
ORGANIZACIÓN DE DATOS: Variables Cuantitativas Continuas.
Histograma.un Histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase
Se utiliza para variables cuantitativas.
15
Ejemplo 2.
En la redacción de un diario, el tiempo requerido para formar la primera página completa fue registrado durante 50 días. Los datos recolectados a la décima de minuto más cercana se dan a continuación.
ORGANIZACIÓN DE DATOS: Variables Cuantitativas Continuas
20.8 22.8 21.9 22.0 20.7 20.9 25.0 22.2 22.8 20.1 25.3 20.7 22.5 21.2 23.8 23.3 20.9 22.9 23.5 19.5 23.7 20.3 23.6 19.0 25.1 25.0 19.5 24.1 24.2 21.8 21.3 21.5 23.1 19.9 24.2 24.1 19.8 23.9 22.8 23.9 19.7 24.2 23.8 20.7 23.8 24.3 21.1 20.9 21.6 22.7
16
Para obtener la tabla de distribución de frecuencia se procede de la siguiente manera:
1. Cancelar el rango: r = Xmax – Xmin r = 25.3 – 19 r = 6.3
2. Calcular el Nº de clases (Regla de Sturges) k = 1 + 3.3 Log nk = 1 + 3.3 Log 50 k = 6.60660101 => K=7 (redondeo)
3. Calcular el IC (Tamaño del Intervalo de Clase)
Cuadro de FrecuenciasKrTIC KrTIC KrTIC
KrIC
73.6
IC 9.0IC
17
Cuadro de Frecuencias4.Cuadro de frecuencias
Frecuenciani
Frecuencia Relativa
fi
Frecuencia Relativa
Porcentualfi %
Frecuencia Acumulada
Ni
Frecuencia Acumulada
RelativaFi
Frecuencia Acumulada Porcentual
Fi %[19.0 19.9> 5 0.10 10.00 5 0.10 10.0[19.9 20.8> 6 0.12 12.00 11 0.22 22.0[20.8 21.7> 9 0.18 18.00 20 0.40 40.0[21.7 22.6> 5 0.10 10.00 25 0.50 50.0[22.6 23.5> 7 0.14 14.00 32 0.64 64.0[23.5 24.4> 14 0.28 28.00 46 0.92 92.0[24.4 25.3[ 4 0.08 8.00 50 1.00 100.0
50 1 100.0
Intervalos de Clase
18
Histograma5. Elaboración del Histograma de frecuencia
25.324.423.522.621.720.819.919.0
14
12
10
8
6
4
2
0
Tiempo
Frec
uenc
ia
4
14
7
5
9
65
Histograma
19
ORGANIZACIÓN DE DATOS: Variables Cuantitativas
Polígono de FrecuenciasEl polígono de frecuencias es una representación gráfica de la distribución de frecuencias que resulta esencialmente equivalente al histograma y se obtiene uniendo mediante segmentos los centros de las bases superiores de los rectángulos del histograma (es decir, los puntos de las marcas de clase.este tipo de gráficos es adecuado para realizar comparaciones del comportamiento de una variable, mediante dos muestras o dos investigaciones similares.
20
Polígono de Frecuencias
21
Polígono de Frecuencias
Poligono de Frecuencias
0
2
4
6
8
10
12
14
16
(19 - 19.9) (19.9 - 20.8) (20.8 - 21.7) (21.7 - 22.6) (22.6 - 23.5) (23.5 - 24.4) (24.4 - 25.3)
Marcas de clase
Frec
uenc
ia
22
Polígono de FrecuenciasDistribución de tiempo requerido para formar la primera pagina (2 muestras)
Poligono de Frecuencias
0
2
4
6
8
10
12
14
16
18
20
(19 - 19.9) (19.9 - 20.8) (20.8 - 21.7) (21.7 - 22.6) (22.6 - 23.5) (23.5 - 24.4) (24.4 - 25.3)
Marcas de clase
Frec
uenc
ia
Serie1 Serie2