2 presentacion de datos

540
ESTADISTICA 2 PRESENTACION DE DATOS

Upload: jorge-franco-gamarra-paredes

Post on 05-Feb-2016

216 views

Category:

Documents


1 download

DESCRIPTION

Presentación de Datos estadistica

TRANSCRIPT

Page 1: 2 Presentacion de Datos

ESTADISTICA

2 PRESENTACION DE DATOS

Page 2: 2 Presentacion de Datos

1 INTRODUCCIÓN

Se hace cada vez más evidente que la interpretación de muchas de las investigaciones en las diversas áreas científicas, dependen en gran parte de los métodos estadísticos.

Por esta razón para poder entender estos métodos, primeramente se definen algunos términos estadísticos importantes, así como los tipos de variables, la captación y elaboración de los datos.

Page 3: 2 Presentacion de Datos

01/01/2015 2

Page 4: 2 Presentacion de Datos

1.1 DEFINICIÓN DE ALGUNOS TÉRMINOS.

Estadística.- En términos generales, la Estadística se define como “el conjunto de métodos y procedimientos para captar, elaborar, analizar e interpretar datos numéricos y con ella basar decisiones y predecir fenómenos que puedan expresarse cuantitativamente.

De acuerdo a esta definición la estadística se divide en dos grandes ramas:

01/01/2015 3

Page 5: 2 Presentacion de Datos

Estadística descriptiva.- Cuyo objetivo principal es

la recolección y elaboración de datos, es decir: clasificación, presentación de la información y el cálculo de medidas de tendencia central y dispersión.

Estadística inferencial.- Permite tomar decisiones

y/o predecir fenómenos con respecto a las características de la población en base a la información de la muestra extraída de la población en estudio.

Page 6: 2 Presentacion de Datos

01/01/2015 4

Page 7: 2 Presentacion de Datos

Unidad de análisis.- Llamada también elemento de la población; es la unidad de la cual se obtiene el dato estadístico; también se le denomina como la unidad indivisible es el objeto de estudio- Ejemplo: puede ser una persona, vivienda, animal, etc.

Población.- Es el conjunto de personal, objetos o cosas con una característica o atributo especial cuantificable, en un período y en un lugar determinado. Ejemplo: estudiantes de la Facultad de ciencias Contables de la Universidad Mayor de San Marcos, primer año de 2005 (la característica a estudiar es la estatura).

Page 8: 2 Presentacion de Datos

01/01/2015 5

Page 9: 2 Presentacion de Datos

Marco de muestreo.- Permite identificar a los elementos de la población y que puede ser una lista de personas, una relación de viviendas, un archivo, un mapa de una determinada comunidad, etc. El marco debe estar completamente actualizado porque de él se seleccionará la muestra.

Muestra.- Es un subconjunto de la población que se obtiene con la finalidad de estudiar las características de la población y debe ser representativa y tener un tamaño apropiado.

Page 10: 2 Presentacion de Datos

01/01/2015 6

Page 11: 2 Presentacion de Datos

Parámetro.- Es una medida de resumen que nos

describe alguna característica de interés y cuyo valor es calculado usando los valores de los elementos o unidades de una población.

Algunos parámetros conocidos y que usaremos en este curso son:

- media poblacional denotado por μ

- varianza poblacional denotado por σ2

- proporción poblacional denotado por P

Page 12: 2 Presentacion de Datos

01/01/2015 7

Page 13: 2 Presentacion de Datos

Estadístico.- Es una medida de resumen que nos describe alguna característica de interés y cuyo valor es calculado usando sólo los valores de los elementos o unidades de una muestra.

Algunos estadísticos conocidos y que usaremos en este curso son:- media de la muestra denotado por

- varianza muestral denotado por ,- proporción muestral denotado por p

Page 14: 2 Presentacion de Datos

01/01/2015 8

Page 15: 2 Presentacion de Datos

1.2 VARIABLE CLASIFICACION

Las variables son características de las personas u objetos que pueden tomar diferentes valores. Ejemplo: peso, edad, genero, número de hijos por familia, etc.

Las variables pueden ser:

Variables cualitativas o categóricas.

Variables cuantitativas. (Discreta y continua)

Page 16: 2 Presentacion de Datos

01/01/2015 9

Page 17: 2 Presentacion de Datos

A. Variables cualitativas o categóricas.

En este tipo de variable se busca la presencia o ausencia de una cualidad o atributo. Estas variables pueden ser dicotómicas si solamente tienen dos categorías mutuamente excluyentes como:

- Sexo: masculino (m), femenino (f)

- Estado de salud: sano (s), enfermo (e)

- Estado nutricional: normal (n), desnutrido (d), etc.

Sin embargo, cuando las variables cualitativas tienen más de dos categorías se les denomina politómicas.

Ejemplo: nivel socio económico, grado de instrucción, estado civil, etc.

Page 18: 2 Presentacion de Datos

01/01/2015 10

Page 19: 2 Presentacion de Datos

B. Variables cuantitativas

Son variables que pueden expresarse numéricamente. Ejemplo:

- Número de hijos por familia.

- Número de admisiones diarias a un hospital.

- Peso.

- Ingreso personal.

- Talla, etc.

Las variables cuantitativas pueden ser :

• Discretas.

• Continuas.

Page 20: 2 Presentacion de Datos

01/01/2015 11

Page 21: 2 Presentacion de Datos

a) Variable cuantitativa discreta.-

Las que toman valores aislados y no pueden tomar un valor entre dos consecutivos. Resultan por lo general de un proceso de conteo. Ejemplo: Número de hijos por familia, número de recaídas de un paciente, cantidad de focos producidos por una máquina por día, etc.

b) Variable cuantitativa continua.-

Toman valores que pueden ser cualquier número real, es decir, entre dos valores distintos siempre encontraremos infinitos valores, resultan por lo general de un proceso de medición. Por ejemplo: peso, talla, vida útil de focos de cierta marca, etc.

Page 22: 2 Presentacion de Datos

01/01/2015 12

Page 23: 2 Presentacion de Datos

1.3 CAPTACIÓN DE DATOS

Según la definición de Estadística la primera actividad viene a ser el proceso de captación de datos.

Cuando llega el momento de obtener los datos considerados indispensables para el estudio o investigación, estos pueden obtenerce de dos fuentes:Primaria.Secundaria.

Page 24: 2 Presentacion de Datos

01/01/2015 13

Page 25: 2 Presentacion de Datos

a) Datos de origen primario.

Que los datos se obtengan directamente de las unidades de observación, se denominan datos primarios para recoger estos datos, se requiere de documentos llamados formularios. Este es un documento que contiene un arreglo de enunciados y espacios para hacer anotaciones y/o respuestas.

Page 26: 2 Presentacion de Datos

01/01/2015 14

Page 27: 2 Presentacion de Datos

Estos datos pueden obtenerse por tres procedimientos que son: - Cuestionario: en el que el sujeto en estudio observa al elemento o sujeto en estudio y registra los datos que se van produciendo.- Observación: en el que una persona observa al

elemento o sujeto en estudio y registra los datos que se van produciendo.- Entrevista: en el que el sujeto en estudio es

interrogado por otra persona y ésta se encarga además de registrar las respuestas en un documento.

Page 28: 2 Presentacion de Datos

01/01/2015 15

Page 29: 2 Presentacion de Datos

b) Datos de origen secundario.

Que los datos ya hayan sido obtenidos de las unidades de observación y que estén publicados o registrados en alguna parte, reciben el nombre de datos secundarios; se recogen de historias clínicas, registros de hechos vitales, anuarios estadísticos, censos de población y vivienda, etc.

Page 30: 2 Presentacion de Datos

01/01/2015 16

Page 31: 2 Presentacion de Datos

1.3 PRESENTACIÓN DE DATOS

Una vez que se ha captado o recopilado la información de cada uno de los elementos del conjunto en estudio, ésa tiene que ser revisada, clasificada, presentada y resumida para permitir su análisis e interpretación y a este conjunto de actividades se le denomina elaboración de datos.

Las etapas de la presentación de datos son:

Page 32: 2 Presentacion de Datos

01/01/2015 17

Page 33: 2 Presentacion de Datos

A. REVISIÓN DE DATOS

Tiene por objeto:

Determinar si se ha recibido todos los formularios o, cuando menos, en una proporción que sea suficiente para no invalidar las conclusiones que se preveían hacer

Verificar que estén todas las respuestas requeridas y

Localizar posibles incongruencias en la información proporcionada

Page 34: 2 Presentacion de Datos

01/01/2015 18

Page 35: 2 Presentacion de Datos

B. CLASIFICACIÓN DE DATOS

Consiste en agrupar las observaciones en un número determinado de categorías o clases.

El número de categorías o clases depende del tipo de variable que se estudia.

Page 36: 2 Presentacion de Datos

01/01/2015 19

Page 37: 2 Presentacion de Datos

Estamos investigando acerca de la opinión de los ciudadanos de la ciudad de Lima con relación a la aprobación de la gestión presidencial.Para obtener la información necesaria se hace uso de una encuesta.

Page 38: 2 Presentacion de Datos

01/01/2015 20

Page 39: 2 Presentacion de Datos

CENCUESTA

1.1 Edad : ………………..1.2 Sexo : 1.3 Estado Civil

M. Masculino 1. Casado.F. Femenino 2. Soltero

3. Otro ………………….

(Especifique )1.4 Grado de Instrucción

0. Ningún nivel1.5 Número de hijos : ………1. Primaria

2. Secundaria

3. Superior1.6 Trabaja ? 1.7 Cual es su ingreso por mes?

1. Si ………………………..

0. No Pasar al 1.81.8 ¿Qué opina acerca de la gestión del

presidente de la república?

1. Aprueba2. Desaprueba

3. NS/NOEntrevistador : Fecha : 6 / 04 / 2015

01/01/2015

Page 40: 2 Presentacion de Datos

i) Clasificación y presentación de los datos cualitativos:

Si la variable es cualitativa (o categórica) el número de categorías estará dado generalmente por las diversas respuestas que pudieran obtenerse.

Por ejemplo la variable sexo por su naturaleza nos sugiere dos categorías: masculino y femenino; la opinión nos sugiere tres categorías: aprueba, desaprueba y NS/NO, etc.

Page 41: 2 Presentacion de Datos

01/01/2015 22

Page 42: 2 Presentacion de Datos

n edad genero es_civ gr_ins n_hijos trabaja ingreso opinion

1 45 1 1 0 3 1 1554,0 2

Datos de la encuesta2 56 1 2 1 4 1 1283,8 2

3 53 0 3 2 1 1 1223,6 2

4 42 1 3 2 1 1 1566,6 2

5 43 1 1 1 1 1 1327,2 2

aplicada 6 43 0 2 3 1 1 1464,4 2

7 22 0 1 1 3 1 1491,0 18 47 0 3 0 3 1 1306,2 1

9 26 0 3 3 2 0 ,0 1

10 44 1 2 1 3 1 1320,2 2

11 45 1 1 0 4 1 1505,0 2

12 40 1 1 2 5 1 1699,6 2

13 54 1 2 2 3 1 1467,2 1

14 28 0 1 1 0 0 ,0 3

Las

variables

cualitativas en 1

5 25 1 1 1 3 1 1451,8 3

16 34 1 1 1 3 1 1596,0 2

codificación (valores en la 17 43 1 1 0 2 1 1185,8 118 45 1 2 1 2 1 1435,0 2

19 43 0 1 2 1 1 1288,0 1

encuesta). Ejemplo genero

20 37 0 1 2 2 1 1412,6 2

Page 43: 2 Presentacion de Datos

21 31 0 3 1 3 1 1353,8 2

1 Masculino 22 39 0 1 1 2 1 1412,5 2

23 39 1 1 1 2 1 1618,4 2

2Femenino 2

4 28 1 3 1 4 0 ,0 2

25 44 1 2 1 1 1 1411,2 2

26 31 1 1 1 4 1 1356,6 2

27 21 1 2 2 2 1 1474,2 2

28 46 1 1 1 2 1 1384,6 1

Las

variables cuantitativas 2

9 36 0 1 2 2 0 ,0 2

30 18 1 1 2 2 1 1314,6 1

con sus valores en su 31 37 1 2 1 4 1 1436,4 232 25 1 1 0 2 1 1289,4 2

33 38 1 1 1 2 1 1398,2 1

recorrido. Ejemplo 34 28 1 3 2 3 1 1465,8 235 23 0 2 1 2 1 1389,4 1

Edad 24 36 44 0 1 2 3 1 1405,9 2

37 27 0 1 1 3 1 1565,2 3

Ingreso 1467.2 38 42 1 3 1 2 1 1429,4 1

39 54 1 1 1 2 1 1368,7 1

40 30 0 1 1 4 1 1356,4 2

4 33 0 1 3 1 0 ,0 2

Page 44: 2 Presentacion de Datos

1

42 43 1 1 1 3 1 1415,4 2

43 35 0 1 1 2 1 1405,6 1

44 50 0 3 1 2 1 1292,2 2

45 35 0 1 3 1 1 1055,6 2

01/01/2015 23

Page 45: 2 Presentacion de Datos

Ejemplo: presentar los datos de la variable cualitativa opinión de la encuesta.

OPINION DE LOS LIMEÑOS SOBRE LA GESTION DEL PRESIDENTE DEL PERUCUADRO N° 1

X f h1 =CONTAR.SI($J$3:$J$47,L87) =M87/$M$102 =CONTAR.SI($J$3:$J$47,L88) =M88/$M$103 =CONTAR.SI($J$3:$J$47,L89) =M89/$M$10

=SUMA(M87:M89) =SUMA(N87:N89)

FORMULAS:m mfi = n hi = 1i=1 i=1

01/01/2015 24

Page 46: 2 Presentacion de Datos

PRESENTACION MATRICIAL Y GRAFICAOPIN ION D E LOS LIM EÑ OS SOB R E LA GEST ION

D EL PR ESID EN T E D EL PER U EN A B R ILC U A D R O N ° 1

X f hFORMULAS:

Aprueba 13 28.89%

Desaprueba 29 64.44%

= =NS/NO 3 6.67%

45 100.00%= =

FUENTE: Encuesta

GRAFICO DE LA OPINION DE LOS LIMEÑOS SOBRE LAGRAFICO DE LA OPINION DE LOS LIMEÑOS SOBRE LAGESTION DEL PRESIDENTE DEL PERU

GESTION DEL PRESIDENTE DEL PERUGRAFICO N° 1GRAFICO N° 1

70%60%50%

Aprueba 40%

Desaprueba 30%20%

NS/NO 10%0%

FUENTE: Cuadro n° 1Aprueba Desaprueba NS/NO

FUENTE: Cuadro n° 1

Page 47: 2 Presentacion de Datos

01/01/2015 25

Page 48: 2 Presentacion de Datos

ii) Clasificación de los datos cuantitativos discretos:

En este caso, las categorías o clases que se establecen es de acuerdo a los valores posibles que toma la variable, o a su recorrido.

Por ejemplo, clasificar a las familias de una comunidad según el número de hijos por familia.

Rx : 0, 1, 2, 3, 4, 5, ….

Page 49: 2 Presentacion de Datos

01/01/2015 26

Page 50: 2 Presentacion de Datos

Ejemplo: Clasificacion los datos de la variable discreta numero de hijos de la encuesta.

FORMULAS:m

m k

k

fi = n hi = 1 fi = F′k hi = H′ki=1 i=1 i=1 i=1

=

Page 51: 2 Presentacion de Datos

01/01/2015 27

Page 52: 2 Presentacion de Datos

PRESENTACION MATRICIAL Y GRAFICA

DISTRIBUCION DE FRECUENCIA DEL NUMERO DE HIJOS DE LOS LIMEÑOSCUADRO N° 2

X f h F' F'' H' H''0 1 0.02222 1 45 0.02222 100.00%1 8 0.17778 9 44 0.20000 97.78%2 17 0.37778 26 36 0.57778 80.00%3 12 0.26667 38 19 0.84444 42.22%4 6 0.13333 44 7 0.97778 15.56%5 1 0.02222 45 1 1.00000 2.22%

45 1.00000FUENTE: ENCUESTA

FORMULAS: =

= = = = .= = = =

Page 53: 2 Presentacion de Datos

01/01/2015 28

Page 54: 2 Presentacion de Datos

a) GRAFICA DE LA FERCUENCIA RELATIVA ( h ).

h

40%

35%

30%

25%

20%

15%

10%

5%

0%

Page 55: 2 Presentacion de Datos

NUMERO DE HIJOS POR CIUDADANO DE

LIMAGRAFICO N° 2

0 1 2 3 4

x

01/01/2015

Page 56: 2 Presentacion de Datos

b) GRAFICA FRECUENCIA R.ACUMULADA.( H’ y H’’ )

100%

90%

80%

70%

60%

50%

40%

30%

20%

10%

0%

Page 57: 2 Presentacion de Datos

GRAFICO: DISTRIBUCION DE FRECUENCIARELATIVA ACUMULADAS DEL N° DE HIJOS DE

60%

50%

40%

30%

20%

10%

0%0 1 2 3 4 5 0 1 2 3 4 5

Frecuencia relativa acumulada creciente H’ y decreciente H’’.

01/01/2015

30

Page 58: 2 Presentacion de Datos

Los datos que se presentan a continuación, corresponden a 30 familias.3, 0, 2, 1, 4, 5, 2, 0, 1, 3, 5, 5, 0, 1, 3, 2, 5, 3, 2, 4, 1, 2, 3, 5, 1, 2, 3, 4, 2, 3

Asignando el número de categorías o clases que le corresponde a esta variable, se tiene: 0, 1, 2, 3, 4, 5. Por consiguiente, de acuerdo a estas clases, ya podemos clasificar los datos en forma manual o computarizada: Los resultados de la clasificación se da a continuación :

Page 59: 2 Presentacion de Datos

01/01/2015 31

Page 60: 2 Presentacion de Datos

iii) Clasificación y presentación de los datos cuantitativos continuos:

Aquí se presenta una serie de dificultades para poder establecer las categorías o clases, sin embargo, se dará un procedimiento que servirá como guía u orientación para formar las clases o intervalos de la variable.

Page 61: 2 Presentacion de Datos

01/01/2015 32

Page 62: 2 Presentacion de Datos

Pasos para construir las clases o intervalo de clases de una v.continua:

A.- Encontrar la amplitud del conjunto de datos, es decir el valor máximo menos el valor mínimo, mas una unidad de medida como factor de reajuste FR.

A = R = (Vmáx – Vmín) + FRB.- Para determinar el valor de m, se sugiere utilizar la siguiente fórmula:

m = 1 + 3.322 log N.C.- Determinar la amplitud del intervalo de clase c, utilizando

la siguiente expresión: c = A / m

D.- Corrección de m o c si:

<= − = =

>

Page 63: 2 Presentacion de Datos

Si E < 0 se acepta m y cSi E = 0 o E > 0 se modifica m o c en una u.de.medida.

01/01/2015 33

Page 64: 2 Presentacion de Datos

Construcción de las clases:

CLASE

m LI i LS i

1 LI1 LS1

2 LI2 LS2

3 LI3 LS3

4 LI4 LS4… … …

m LIm LSm

= = + −

= + = +

= − + = − +

Page 65: 2 Presentacion de Datos

01/01/2015

Page 66: 2 Presentacion de Datos

Ejemplo:

Sea n = 100 X min = 1.56 X max = 1.82

Construir la tabla de la distribución de frecuencia.

R = 0.26 m = 1 + 3.322 (2) = 7.6c = 0.26/8 = 0.032 = 0.03 D = 8(0.03) – 0.26 = -0.02

NegativoHacemos lo siguiente:D = 9(0.03) – 0.26 = 0.01D = 8(0.04) – 0.26 = 0.06Se escoge el menor

Page 67: 2 Presentacion de Datos

01/01/2015 35

Page 68: 2 Presentacion de Datos

Las clases de la clasificación de datos

mCLASE CLASE

LI LS LI LS

1 1.56 - 1.58 1.56 < 1.59

2 1.59 - 1.61 1.59 < 1.62

3 1.62 - 1.64 1.62 < 1.65

4 1.65 - 1.67 1.65 < 1.68

5 1.68 - 1.7 1.68 < 1.71

6 1.71 - 1.73 1.71 < 1.74

7 1.74 - 1.76 1.74 < 1.77

8 1.77 - 1.79 1.77 < 1.80

9 1.80 - 1.82 1.80 < 1.83

01/01/2015 36

Page 69: 2 Presentacion de Datos
Page 70: 2 Presentacion de Datos

Ejemplo: Construir las clases de los datos de la variable continua edad vmin=30 vmax=71 y n=30.

A.- A = (71 – 30) + 1 = 42

Nota si Vmáx = 71.4 y Vmín = 30.2, se tiene que la amplitud será: A = (71.4 – 30.2) + 0.1 = 41.3

Esto significa que si los valores máximo y mínimo están expresados hasta décimas se incrementará un décimo (0.1); si los valores están expresados en centésimos, se agregará un centésimo (0.01) y así sucesivamente.

B.- m = 1 + 3.322 log 30 = 5.9

Este valor nos indica que el número de intervalos que podemos tomar será comprendido entre 5 y 7. En este caso hemos adoptado el valor de 6.

C.- c = 42 / 6 = 7

Page 71: 2 Presentacion de Datos

01/01/2015 37

Page 72: 2 Presentacion de Datos

D) El Vmín. es el límite inferior de la primera clase y su respectivo límite superior será Vmín, + (C-1); el límite inferior de la segunda clase es el límite superior de la primera clase mas uno y el respectivo límite superior será igual al límite inferior mas (C-1); y así sucesivamente hasta completar el número de intervalos. Con relación al ejemplo, se tiene:

CLASE Xm LI LS

1 30.0 36.0 33.0

2 37.0 43.0 40.0

3 44.0 50.0 47.0

4 51.0 57.0 54.0

5 58.0 64.0 61.0

6 65.0 71.0 68.0

Hay que cuidar que en la primera y última clase deben estar el Vmín. y Vmáx. Respectivamente.Nota: si los límites están expresados hasta décimas, entonces se tendrá que el límite superior de la primera clase es Vmín + ( C - 0.1 ); si está expresado hasta centésimas será Vmín. + ( C - 0.01 ) y así sucesivamente.

Page 73: 2 Presentacion de Datos

01/01/2015 38

Page 74: 2 Presentacion de Datos

PRESENTACION MATRICIAL .

EDAD X i f i h i % H i % F i30 – 36 33 1 3.30% 3.30% 137 – 43 40 7 23.30% 26.70% 844 – 50 47 3 10.00% 36.70% 1151 – 57 54 3 10.00% 46.70% 1458 – 64 61 8 26.70% 73.30% 22

65 – 71 68 8 26.70% 100.00% 30

30 100.00%

NOTA : Si los límites nominales de los intervalos de clase están expresados en enteros, los límites reales de cada intervalo se determina restando y sumando media unidad al límite inferior y superior respectivamente de cada intervalo. Pero si los límites están expresados de cada intervalo hasta décimos, los límites reales se encontrarán restando y sumando media décima al límite inferior y superior respectivamente de cada intervalo, y así sucesivamente.

01/01/2015 39

Page 75: 2 Presentacion de Datos
Page 76: 2 Presentacion de Datos

Donde :

fi: Frecuencia absoluta del i-ésimo intervalo (o valor Xi) nos indica número de veces que aparece repetido dicho intervalo (o valor) en el conjunto de observaciones estudiadas.

0 ≤ fi ≤ n y f1 + f2 + ... + fm = n

Donde m y n son el número de clase y el número total de datos respectivamente.

Fi: Frecuencia absoluta acumulada de la clase i nos indica la suma de las frecuencias absolutas de los iguales o inferiores a él.

Donde m es el número de clases,

0 ≤ Fi ≤ n son para todo i.

01/01/2015 40

Page 77: 2 Presentacion de Datos
Page 78: 2 Presentacion de Datos

Donde :

hi%: Frecuencia relativa de la clase i es el cociente entre la frecuencia absoluta y el número total de observaciones multiplicado por 100. h i% = fi/n *100

Se tiene que 0 ≤ hi ≤ 1 ó 0 ≤ h1% ≤ 100

Hi%: Frecuencia relativa acumulada de la clase i (o de Xi), es la frecuencia absoluta acumulada dividido por el número total de observaciones Hi% = Fi/n *100

0 ≤ Hi ≤ 1 ó 0 ≤ H1 % ≤ 100

Xi: Es la marca de clase de la clase i se determinará mediante el promedio de los límites de dicho intervalo. Xi puede ser positivo, negativo o puede tomar el valor de 0

Page 79: 2 Presentacion de Datos

01/01/2015 41

Page 80: 2 Presentacion de Datos

Ejemplo: Clasificación los datos de la variable continua ingreso de la encuesta.

a) Identificar el valor máximo y el mínimo

Vmax = 1699.6 Vmin =b) Calcular el rango R

= − +

c) Calcular el N° de clases m < < .

= .+ . ( )

d) Calcular el tamaño de clase c

=

1055.6

R = 644.1

m = 6.000 6.322

c = 107.400 107.350

X : Ingreso personal del encuestado limeño. Rx : 1055.6, 1699.6 en soles

01/01/2015 42

Page 81: 2 Presentacion de Datos

Las clases y sus marcas de clase

X : Ingreso personal del encuestado limeño.

Rx : 1055.6, 1699.6 en soles

CLASEX

m LI LS

1 1055.6 1162.9 1109.3

2 1163.0 1270.3 1216.7

3 1270.4 1377.7 1324.1

4 1377.8 1485.1 1431.5

5 1485.2 1592.5 1538.9

6 1592.6 1699.9 1646.3

Page 82: 2 Presentacion de Datos

01/01/2015 43

Page 83: 2 Presentacion de Datos

PRESENTACIÓN DE DATOS

La presentación de los datos se hace fundamentalmente utilizando dos métodos: el método tabular y el método gráfico.

Page 84: 2 Presentacion de Datos

01/01/2015 44

Page 85: 2 Presentacion de Datos

a. Método tabular

Consiste en una presentación resumida usando tablas o cuadros. Si se utilizan los cuadros o tablas debe prestarse atención a los cuatro elementos que los constituyen; el título, la matriz, el cuerpo y las notas aclaratorias.

Un buen título debe hacer énfasis en el contenido del cuadro, por tal motivo debe contestar a las siguientes preguntas: ¿qué contiene el cuadro?, ¿cómo se presenta este contenido?, ¿de dónde se presenta? y ¿cuándo se presenta? Abreviadamente se puede decir: ¿Qué? ¿Cómo? ¿Dónde? ¿Cuándo?

Page 86: 2 Presentacion de Datos

01/01/2015

45

Page 87: 2 Presentacion de Datos

Ejemplo 1: Consideramos la Cuadro N° 1 del ejemplo de la encuesta. El título que le corresponde contestando a las interrogantes sería:

Qué ? Opinión de ciudadanos.Cómo ? Gestión del presidente.Dónde ? LimaCuándo ? Abril

OPIN ION D E LOS LIM EÑ OS SOB R E LA GEST IOND EL PR ESID EN T E D EL PER U EN A B R IL

C U A D R O N ° 1

X f hAprueba 13 28.89%Desaprueba 29 64.44%NS/NO 3 6.67%

45 100.00%FUENTE: Encuesta

01/01/2015 46

Page 88: 2 Presentacion de Datos

Ejemplo 2: presentar los datos de la variable discreta numero de hijos de la encuesta.

DISTRIBUCION DE FRECUENCIA DEL NUMERO DE HIJOS DE LOS LIMEÑOSCUADRO N° 2

X f h F' F'' H' H''0 1 0.02222 1 45 0.02222 100.00%1 8 0.17778 9 44 0.20000 97.78%2 17 0.37778 26 36 0.57778 80.00%3 12 0.26667 38 19 0.84444 42.22%4 6 0.13333 44 7 0.97778 15.56%5 1 0.02222 45 1 1.00000 2.22%

45 1.00000FUENTE: ENCUESTA

FORMULAS: =

= = = = .= = = =

01/01/2015 47

Page 89: 2 Presentacion de Datos

Ejemplo 3: presentar los datos de la variable continua ingreso personal de ciudadanos limeños de la encuesta.

DISTRIBUCION DE FRECUENCIA DE LOS INGRESOS DE LOS ENCUESTADOS.

mCLASE

X f F h H' H''LI LS

1 1055.6 1162.9 1109.3 1 1 0.02500 0.02500 1.00000

2 1163.0 1270.3 1216.7 2 3 0.05000 0.07500 0.97500

3 1270.4 1377.7 1324.1 12 15 0.30000 0.37500 0.92500

4 1377.8 1485.1 1431.5 17 32 0.42500 0.80000 0.62500

5 1485.2 1592.5 1538.9 5 37 0.12500 0.92500 0.20000

6 1592.6 1699.9 1646.3 3 40 0.07500 1.00000 0.07500

40 1.00000

== = = 0.4250 = = .

== = =

01/01/2015

Page 90: 2 Presentacion de Datos

48

Page 91: 2 Presentacion de Datos

b. Método grafico.

Esencialmente un gráfico estadístico es la representación numérica de datos por medio de figuras geométricas dibujadas a escala.

El objetivo primordial de un gráfico es dar una impresión visual de conjunto para una rápida y fácil comprensión del fenómeno que se está estudiando. Por tal motivo un gráfico debe ser sencillo y autoexpliicativo.

En efecto, en un buen gráfico se pueden apreciar la tendencia de variaciones y anomalías del fenómeno representado, así como las relaciones entre dos o más series de datos superpuestos en un mismo gráfico.

Page 92: 2 Presentacion de Datos

01/01/2015 49

Page 93: 2 Presentacion de Datos

Los gráficos no deben considerarse como sustitutos de un tratamiento estadístico de los datos, sino más bien como ayuda visual para interpretar problemas estadísticos.

La elección de un gráfico depende del objetivo que persigue, es decir, que es lo que se quiere mostrar, para qué y quiénes.

Page 94: 2 Presentacion de Datos

01/01/2015 50

Page 95: 2 Presentacion de Datos

Las partes de un gráfico son:

Título, que expresa el contenido del gráfico y por lo general, es igual o parecido al titulo del cuadro que sirvió de referencia.

Escalas, se utilizan generalmente el sistema cartesiano, compuesto por dos ejes: uno horizontal llamado abscisa y otro vertical llamado ordenada, ambos se cortan en un punto llamado origen.

Cuerpo, es el gráfico en sí y constituye la representación en dibujo de los datos.

Fuente, indica el origen de los datos que se están representando en el gráfico. Número de pacientes.

Page 96: 2 Presentacion de Datos

01/01/2015 51

Page 97: 2 Presentacion de Datos

i. Gráfica de los datos según una variable cualitativa:

Si los datos son una variable cualitativa, la representación gráfica puede ser: Gráficos de Barra o Gráficos Circulares.

Gráficos de barra, representa hechos o fenómenos sin continuidad. Las categorías pueden ser colocadas en cualquier orden, pueden representar distintos aspectos, no ordenados, de una característica.

Page 98: 2 Presentacion de Datos

01/01/2015 52

Page 99: 2 Presentacion de Datos

Tomando los datos del Cuadro N° 1, podemos representar dichos resultados en el gráfico de barras N° 1.

GRAFICO DE LA OPINION DE LOS LIMEÑOS SOBRE LA GESTIONDEL PRESIDENTE DEL PERU

GRAFICO N° 1

70%

60%

50%

40%

30%

20%

10%

0%Aprueba Desaprueba NS/NO

FUENTE: Cuadro n° 1

Page 100: 2 Presentacion de Datos

01/01/2015 53

Page 101: 2 Presentacion de Datos

Gráfico circular, para su elaboración se utiliza la circunferencia, siendo necesario que los valores absolutos y/o porcentajes sean traducidos a grados. Los 360° se reparten en proporción a los respectivos porcentajes. Correspondiendo a cada sector de la circunferencia la magnitud de cada categoría de la variable.

Page 102: 2 Presentacion de Datos

01/01/2015 54

Page 103: 2 Presentacion de Datos

Tomando los datos del Cuadro N° 1, podemos representar dichos resultados en el gráfico circular N° 1.

GRAFICO DE LA OPINION DE LOS LIMEÑOS SOBRE LAGESTION DEL PRESIDENTE DEL PERU

GRAFICO N° 1

Aprueba

Desaprueba

NS/NO

FUENTE: Cuadro n° 1

Page 104: 2 Presentacion de Datos

01/01/2015 55

Page 105: 2 Presentacion de Datos

ii. Gráfica de los datos de variable cuantitativa:

A.- GRAFICO DE VARIABLE NUMERICA DISCRETA :

- Grafico de frecuencia relativa hi : Bastones

h

40%

35%

30%

25%

20%

15%

10%

5%

0%

NUMERO DE HIJOS POR CIUDADANO DE LIMAGRAFICO N° 2

0 1 2 3 4 5x

Page 106: 2 Presentacion de Datos

01/01/2015

56

Page 107: 2 Presentacion de Datos

- Grafico de frecuencia acumulada H’i H’’i :Escalera

100%

90%

80%

70%

60%

50%

40%

30%

20%

10%

0%

Page 108: 2 Presentacion de Datos

GRAFICO: DISTRIBUCION DE FRECUENCIARELATIVA ACUMULADAS DEL N° DE HIJOS DE

60%

50%

40%

30%

20%

10%

0%0 1 2 3 4 5 0 1 2 3 4 5

Frecuencia relativa acumulada creciente H’ y decreciente H’’.

01/01/2015 57

Page 109: 2 Presentacion de Datos

B.- GRAFICO DE VARIABLE NUMERICA CONTINUA :

Histograma, polígono

Si los datos son una variable cuantitativa, la representación gráfica puede ser: histograma, polígonos y ojivas.

Histograma Es un gráfico que se utiliza para representar las frecuencias absolutas o relativas simples mediante rectángulos, teniendo como base los respectivos límites reales de los intervalos de clase y la altura igual a la frecuencia respectiva. Las áreas de los rectángulos son proporcionales a la frecuencia de la clase. Cuando los intervalos de clase son de igual tamaño, las alturas de los rectángulos son también proporcionales a la frecuencia de una clase.

Page 110: 2 Presentacion de Datos

01/01/2015

58

Page 111: 2 Presentacion de Datos

Polígono:

Llamaremos polígono de frecuencia absoluta simple a la unión de los puntos medio del lado superior (el opuesto a la base) de cada rectángulo del histograma, formándose de esta manera líneas rectas. Estas líneas deben llevarse hasta el eje X en los extremos del límite inferior del primer intervalo y superior del último intervalo respectivamente. Esto permite que el área total quede incluida bajo la curva. El área total bajo el polígono equivale al área bajo el histograma.

Page 112: 2 Presentacion de Datos

01/01/2015 59

Page 113: 2 Presentacion de Datos

Ejemplo: Tomando los datos del cuadro de la distribución de frecuencia de los ingresos de los encuestados construir su histograma y polígono de f.

HISTOGRAMA DEINGRESOS DE ENCUESTADOS

45%

40%

35%

30%

25%

20%

15%

10%

5%

0%1001.9 1109.3 1216.7 1324.1 1431.5 1538.9 1646.3 1753.7

Page 114: 2 Presentacion de Datos

01/01/2015 60

Page 115: 2 Presentacion de Datos

POLIGONO DE FRECUENCIA E HISTOGRAMA DEINGRESOS DE ENCUESTADOS

45%

40%POLIGONO DE

35% FRECUENCIA

30%

25%

20%

15%

10%

5%

0%1001.9 1109.3 1216.7 1324.1 1431.5 1538.9 1646.3 1753.7

01/01/2015 61

Page 116: 2 Presentacion de Datos

POLIGONO DE FRECUENCIA DEINGRESOS DE ENCUESTADOS

45%

40%

35%

30%

25%

20%

15%

10%

5%

0%1001.9 1109.3 1216.7 1324.1 1431.5 1538.9 1646.3 1753.7

Page 117: 2 Presentacion de Datos

01/01/2015

Page 118: 2 Presentacion de Datos

Ojiva.

Una ojiva utiliza las frecuencias absolutas o relativas acumuladas y consiste en un gráfico lineal que nos permite observar la cantidad de elementos que quedan por encima o por debajo de determinados valores de los límites de los intervalos de clase.La ojiva se obtiene uniendo los puntos que le corresponden a las frecuencias acumuladas de los respectivos límites superiores de cada intervalo.

Page 119: 2 Presentacion de Datos

01/01/2015 63

Page 120: 2 Presentacion de Datos

Ejemplo: Tomando los datos del cuadro de la distribución de frecuencia de los ingresos de los encuestados construir su histo.acumulado y la ojiva.

HISTOGRAMA ACUMULADO DE OJIVA DE INGRESOS DEINGRESOS DE ENCUESTADOS ENCUESTADOS

120%120%

100%100%

80%80%

60%60%

40%40%

20%20%

0%0%1001.9 1109.3 1216.7 1324.1 1431.5 1538.9 1646.3

1055.5 1162.9 1270.3 1377.7 1485.1 1592.5 1699.9

01/01/2015 64

Page 121: 2 Presentacion de Datos

OJIVA CRECIENTE Y DECRECIENTE DEINGRESOS DE ENCUESTADOS

120%

100%

80%

60%

40%

20%

0%1055.6 1163.0 1270.4 1377.8 1485.2 1592.6 1700.0

01/01/2015 65

Page 122: 2 Presentacion de Datos

EJERCICIO: A continuación se presentan las calificaciones finales de los alumnos de la Facultad que llevaron el Curso de Estadística, durante el primer semestre del año Académico anterior.

Se pide lo siguiente:11 12 16 14 14 15 12

12 10 13 12 12 17 13

13 12 14 12 13 13 13

15 16 11 16 12 12 12

18 15 15 17 11 12 12

14 14 13 16 14 14 13

a) Construir una distribución de frecuencia que contenga 5 clases o intervalos.

b) Interprete: f2, h3 y F4 c) Obtener el punto medio o marca de clase de cada intervalo. d) Graficar el histograma de frecuencia relativa y la ojiva,

qué interpretación le merece?

Page 123: 2 Presentacion de Datos

01/01/2015 66

Page 124: 2 Presentacion de Datos

EJERCICIO: La frecuencia cardiaca en 50 pacientes fumadores fueron:

a) Construir una distribución de frecuencia que contenga 6 clases o intervalos.

b) Graficar un polígono de frecuencia absoluta.

80 79 69 80 77 69 80 76 90 72

75 76 79 74 71 78 77 80 76 79

70 73 78 72 68 70 91 66 79 75

89 88 91 86 83 81 68 79 80 85

83 82 81 80 78 73 79 84 68 66

Page 125: 2 Presentacion de Datos

01/01/2015 67

Page 126: 2 Presentacion de Datos

Ejercicios:

1. Señale 5 distribuciones de variables cuantitativas y 5 distribuciones de atributos (cualitativas).

2. Indique 5 distribuciones de variable discreta y 5 distribuciones de variable continua.

3. Dé 5 ejemplos de distribuciones unidimensionales de frecuencias y 5 ejemplos de distribuciones bidimensionales de frecuencias.

4. En una distribución simétrica de frecuencias con siete intervalos de clase, se sabe que: h1 = 5%; h3 = 20% y H5 = 95% A base de esta información, reconstruya las columnas correspondientes a las frecuencias y a las frecuencias acumuladas.

Page 127: 2 Presentacion de Datos

01/01/2015 68

Page 128: 2 Presentacion de Datos

Ejercicio:

1. En el ejemplo siguiente la variable Y representa el número de hijos por familia proveniente de una encuesta hecha entre 50 familias: A base de esta información, se pide la representación gráfica de los datos, mediante:

a) Gráfico de barras b) Gráfico de sectores circulares

yi ni

0 21 122 213 94 45 2

50

Page 129: 2 Presentacion de Datos

01/01/2015 69

Page 130: 2 Presentacion de Datos

Ejercicio:

1.- La emisión del Banco Central del Perú en millones de Nuevo Soles, ha sido la siguiente para el período 1995 – 2004:

AÑO 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

EMISIÓN 126 183 270 304 517 557 917 1290 2051 2502

Represente los datos anteriores en un gráfico y colocar las leyendas que falta.

Page 131: 2 Presentacion de Datos

01/01/2015

70