sem 2-sesion 1 organizacionde datos

22
1 Estadística ORGANIZACIÓN DE DATOS

Upload: pippo-huaman-cornelio

Post on 06-Apr-2016

225 views

Category:

Documents


6 download

DESCRIPTION

estadistica

TRANSCRIPT

Page 1: SEM 2-SESION 1 Organizacionde Datos

1

Estadística

ORGANIZACIÓN DE DATOS

Page 2: SEM 2-SESION 1 Organizacionde Datos

2

OBJETIVOS

Organizar datos originales en una distribución de frecuencias.

Presentar datos utilizando representaciones gráficas como: gráfico de barras, y sectores circulares

Representar frecuencias en un Histograma Representar la distribución de frecuencias de dos o más

grupos de datos en un polígono de frecuencias

Al concluir este capitulo, el participante podrá:

Page 3: SEM 2-SESION 1 Organizacionde Datos

3

ORGANIZACIÓN DE DATOSDatos

Datos Cualitativos Datos Cuantitativos

Método Tabular Método Gráfico Método Tabular Método Gráfico

• Tabla de resumen • Grafico de barras• Grafica Circular

• Tabla de distribución de frecuencias

• Histogramas• Ojivas• Diagrama de tallo y

hojas• Diagrama de

Dispersión.

Page 4: SEM 2-SESION 1 Organizacionde Datos

4

Ejercicio 1:A través de una encuesta realizada a una muestra de 800 personas, se ha obtenido el tipo de seguro de salud al cual están afiliadas cada una de estas personas

ORGANIZACIÓN DE DATOS: Variables Cualitativas

Nº Tipo de Seguro Nº Tipo de Seguro Nº Tipo de Seguro1 Seguro integral de Salud 11 Seguro integral de Salud 21 Seguro de FF.AA./POLICIALES …2 ESSALUD 12 ESSALUD 22 ESSALUD …3 Seguro integral de Salud 13 No esta afiliado 23 No esta afiliado …4 Seguro integral de Salud 14 Seguro Privado de Salud 24 Seguro integral de Salud …5 ESSALUD 15 Seguro Privado de Salud 25 Seguro de FF.AA./POLICIALES …6 Seguro de FF.AA./POLICIALES 16 Seguro integral de Salud 26 ESSALUD …7 Seguro de FF.AA./POLICIALES 17 Seguro integral de Salud 27 Seguro integral de Salud …8 ESSALUD 18 No esta afiliado 28 ESSALUD …9 No esta afiliado 19 Seguro Privado de Salud 29 No esta afiliado …

10 Seguro integral de Salud 20 Seguro de FF.AA./POLICIALES 30 Seguro Privado de Salud …

Page 5: SEM 2-SESION 1 Organizacionde Datos

5

ORGANIZACIÓN DE DATOS: Variables Cualitativas

f nNii

Frecuencia Absoluta

Frecuencia Relativa

Frecuencia Relativa

Procentualn i f i % f i

Categoria 1 n1 f1 % f1Categoria 2 n2 f2 % f2Categoria 3 n3 f3 % f3

…. … … …N 1 100

(Categorías)

ni : Frecuencia Absoluta Simple (Numero de casos para cada categoría)

fi : Frecuencia relativa

% fi : Frecuencia relativa porcentual

100*% fifi

Page 6: SEM 2-SESION 1 Organizacionde Datos

6

ORGANIZACIÓN DE DATOS: Variables Cualitativas

30.0800240

1

11

f

Nnf

20.0800160

2

22

f

Nnf

%30100*30.0%100*%

1

11

fff

%20100*20.0%100*%

1

11

fff

Tipo de seguro Frec. Frec. Relativa % Frec. Relativa

ESSALUD 240.00 0.30 30.00Seguro Privado de Salud 160.00 0.20 20.00Seguro de FF.AA./POLICIALES 40.00 0.05 5.00Seguro integral de Salud 320.00 0.40 40.00No esta afiliado 40.00 0.05 5.00Total 800.00 1.00 100.00

Page 7: SEM 2-SESION 1 Organizacionde Datos

7

POBLACIÓN POR TIPO DE SEGURO DE SALUD

30%

20%

5%

40%

5%ESSALUD

Seguro Privado de Salud

Seguro deFF.AA./POLICIALES

Seguro integral de Salud

No esta afiliado

Gráfico Circular

Gráfico de Barras

240.00

160.00

40.00

320.00

40.00

0

50

100

150

200

250

300

350

Nº P

ERSO

NA

S

ESSALUD SeguroPrivado

Seguro deFF.AA./PP

SIS No estaafiliado

TIPO DE SEGURO

POBLACIÓN POR TIPO DE SEGURO DE SALUD

Page 8: SEM 2-SESION 1 Organizacionde Datos

8

ORGANIZACIÓN DE DATOS: Variables Cuantitativas

Datos Numéricos

Distribución de FrecuenciaY

Distribución Acumulada

Histograma OjivaPolígono de Frecuencias

Método Tabular

Método Gráfico

Page 9: SEM 2-SESION 1 Organizacionde Datos

9

Ejercicio 2:En un centro poblado rural, se desea analizar las condiciones de vida. Para ello una de las variables del análisis, es el número de hijos de cada uno de los 1509 jefes de hogar del CC.PP.

ORGANIZACIÓN DE DATOS: Variables Cuantitativas Discretas

Nº de Hijos 2 2 8 7 8 7 2 2 7 1 1 4 2 2 8 9 4 46 4 7 6 1 3 5 1 0 1 1 7 5 3 7 2 0 41 4 8 5 6 8 7 2 7 1 3 0 1 4 4 4 6 56 10 9 1 3 3 5 3 5 3 2 3 7 9 10 1 2 7

… … … … … … … … … … … … … … … … … …3 8 5 9 3 9 1 7 2 9 3 2 1 2 8 6 6 8

Page 10: SEM 2-SESION 1 Organizacionde Datos

10

Número de hijos

419 27,8 27,8255 16,9 44,7375 24,9 69,5215 14,2 83,8127 8,4 92,254 3,6 95,824 1,6 97,323 1,5 98,917 1,1 100,0

1509 100,0

01234567Ocho+Total

Frec.Frecuencia.Porcentual

Frec. Porcent.

acum.

ORGANIZACIÓN DE DATOS: Variables Cuant. Discre.Ejemplo

¿Cuántos Jefes de hogar tienen menos de 2 hijos? frec. indiv. sin hijos

+ frec. indiv. con 1 hijo = 419 + 255= 674 individuos

¿Qué porcentaje de jefes de hogar tiene 6 hijos o menos? 97,3%

¿Qué cantidad de hijos es tal que al menos el 50% de los jefes de hogar tiene una cantidad inferior o igual? 2 hijos

≥50%

Page 11: SEM 2-SESION 1 Organizacionde Datos

11

ORGANIZACIÓN DE DATOS: Variables Cuantitativas Discretas

100*nxi

ixFrec

nxi

Frec Relativa

Frec Relativa

Porcentual

Para cada claseClase Frecuencia Frec

Relativa

FrecRelativa

Acumulada0 Hijos 419 0.278 0.2781 Hijo 255 0.169 0.4472 Hijos 375 0.249 0.6953 Hijos 215 0.142 0.8384 Hijos 127 0.084 0.9225 Hijos 54 0.036 0.9586 Hijos 24 0.016 0.9737 Hijos 23 0.015 0.989

8 Hijos y + 17 0.011 1.0001509 1.000

Page 12: SEM 2-SESION 1 Organizacionde Datos

12

Clase Frecuencia FrecRelativa

FrecRelativa

Acumulada0 Hijos 419 0.278 0.2781 Hijo 255 0.169 0.4472 Hijos 375 0.249 0.6953 Hijos 215 0.142 0.8384 Hijos 127 0.084 0.9225 Hijos 54 0.036 0.9586 Hijos 24 0.016 0.9737 Hijos 23 0.015 0.989

8 Hijos y + 17 0.011 1.0001509 1.000

ORGANIZACIÓN DE DATOS: Variables Cuantitativas (Gráfico de Barras)

Gráfico de Barras: Nº de Hijos

255

375

215

127

5424 23 17

419

0

50

100

150

200

250

300

350

400

450

0 Hijos 1 Hijo 2 Hijos 3 Hijos 4 Hijos 5 Hijos 6 Hijos 7 Hijos > 8Hijos

Número de Hijos

Núm

ero

de In

divi

duos

Page 13: SEM 2-SESION 1 Organizacionde Datos

13

Clase Frecuencia FrecRelativa

FrecRelativa

Acumulada0 Hijos 419 0.278 0.2781 Hijo 255 0.169 0.4472 Hijos 375 0.249 0.6953 Hijos 215 0.142 0.8384 Hijos 127 0.084 0.9225 Hijos 54 0.036 0.9586 Hijos 24 0.016 0.9737 Hijos 23 0.015 0.989

8 Hijos y + 17 0.011 1.0001509 1.000

ORGANIZACIÓN DE DATOS: Variables Cuantitativas (Gráfico Circular)

Gráfico Circula: Nº de Hijos

1.5%1.6%

3.6%

8.4%

1.1%

27.8%

16.9%24.9%

14.2%

0 Hijos

1 Hijo

2 Hijos

3 Hijos

4 Hijos

5 Hijos

6 Hijos

7 Hijos

8 Hijos y +

Page 14: SEM 2-SESION 1 Organizacionde Datos

14

ORGANIZACIÓN DE DATOS: Variables Cuantitativas Continuas.

Histograma.un Histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase

Se utiliza para variables cuantitativas.

Page 15: SEM 2-SESION 1 Organizacionde Datos

15

Ejemplo 2.

En la redacción de un diario, el tiempo requerido para formar la primera página completa fue registrado durante 50 días. Los datos recolectados a la décima de minuto más cercana se dan a continuación.

ORGANIZACIÓN DE DATOS: Variables Cuantitativas Continuas

20.8 22.8 21.9 22.0 20.7 20.9 25.0 22.2 22.8 20.1 25.3 20.7 22.5 21.2 23.8 23.3 20.9 22.9 23.5 19.5 23.7 20.3 23.6 19.0 25.1 25.0 19.5 24.1 24.2 21.8 21.3 21.5 23.1 19.9 24.2 24.1 19.8 23.9 22.8 23.9 19.7 24.2 23.8 20.7 23.8 24.3 21.1 20.9 21.6 22.7

Page 16: SEM 2-SESION 1 Organizacionde Datos

16

Para obtener la tabla de distribución de frecuencia se procede de la siguiente manera:

1. Cancelar el rango: r = Xmax – Xmin r = 25.3 – 19 r = 6.3

2. Calcular el Nº de clases (Regla de Sturges) k = 1 + 3.3 Log nk = 1 + 3.3 Log 50 k = 6.60660101 => K=7 (redondeo)

3. Calcular el IC (Tamaño del Intervalo de Clase)

Cuadro de FrecuenciasKrTIC KrTIC KrTIC

KrIC

73.6

IC 9.0IC

Page 17: SEM 2-SESION 1 Organizacionde Datos

17

Cuadro de Frecuencias4.Cuadro de frecuencias

Frecuenciani

Frecuencia Relativa

fi

Frecuencia Relativa

Porcentualfi %

Frecuencia Acumulada

Ni

Frecuencia Acumulada

RelativaFi

Frecuencia Acumulada Porcentual

Fi %[19.0 19.9> 5 0.10 10.00 5 0.10 10.0[19.9 20.8> 6 0.12 12.00 11 0.22 22.0[20.8 21.7> 9 0.18 18.00 20 0.40 40.0[21.7 22.6> 5 0.10 10.00 25 0.50 50.0[22.6 23.5> 7 0.14 14.00 32 0.64 64.0[23.5 24.4> 14 0.28 28.00 46 0.92 92.0[24.4 25.3[ 4 0.08 8.00 50 1.00 100.0

50 1 100.0

Intervalos de Clase

Page 18: SEM 2-SESION 1 Organizacionde Datos

18

Histograma5. Elaboración del Histograma de frecuencia

25.324.423.522.621.720.819.919.0

14

12

10

8

6

4

2

0

Tiempo

Frec

uenc

ia

4

14

7

5

9

65

Histograma

Page 19: SEM 2-SESION 1 Organizacionde Datos

19

ORGANIZACIÓN DE DATOS: Variables Cuantitativas

Polígono de FrecuenciasEl polígono de frecuencias es una representación gráfica de la distribución de frecuencias que resulta esencialmente equivalente al histograma y se obtiene uniendo mediante segmentos los centros de las bases superiores de los rectángulos del histograma (es decir, los puntos de las marcas de clase.este tipo de gráficos es adecuado para realizar comparaciones del comportamiento de una variable, mediante dos muestras o dos investigaciones similares.

Page 20: SEM 2-SESION 1 Organizacionde Datos

20

Polígono de Frecuencias

Page 21: SEM 2-SESION 1 Organizacionde Datos

21

Polígono de Frecuencias

Poligono de Frecuencias

0

2

4

6

8

10

12

14

16

(19 - 19.9) (19.9 - 20.8) (20.8 - 21.7) (21.7 - 22.6) (22.6 - 23.5) (23.5 - 24.4) (24.4 - 25.3)

Marcas de clase

Frec

uenc

ia

Page 22: SEM 2-SESION 1 Organizacionde Datos

22

Polígono de FrecuenciasDistribución de tiempo requerido para formar la primera pagina (2 muestras)

Poligono de Frecuencias

0

2

4

6

8

10

12

14

16

18

20

(19 - 19.9) (19.9 - 20.8) (20.8 - 21.7) (21.7 - 22.6) (22.6 - 23.5) (23.5 - 24.4) (24.4 - 25.3)

Marcas de clase

Frec

uenc

ia

Serie1 Serie2