presentación de datos ing. iliana rosero estadistica i

Post on 25-Jan-2016

235 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Presentación de datos

Ing. Iliana Rosero

Estadistica I

TABLAS

Características importantes de los datos

Centro Variación Distribución Valores Extremos Tiempo

Distribuciones de Frecuencia

Concepto: Lista valores de datos junto con su frecuencia.

Ej: Edad

ActricesFrecuencia

[20-30) 28

[30-40) 30

[40-50) 12

[50-60) 2

[60-70) 2

[70-80) 2

Distribuciones de frecuencia

Limites de clase Inferior :Cifras más pequeñas que pueden pertenecer a las clases.

Limites de clase Superior :Cifras más grande que pueden pertenecer a las clases.

Ancho de clase: Diferencia entre dos límites de clases inferiores consecutivos.

Marca de Clase: Punto medio de la clase (Lim Inf + Lim sup)/2

Procedimiento para construir una distribución de frecuencias

Decidir el número de clases K=1+3,32 log(n) (entre 5 y 20)

Calcular el ancho de clase=(Valor máximo-Valor mínimo)/número de clases.

Establecer el punto de partida como límite inferior de la primera clase y sumar el ancho de clase para encontrar el límite superior.

Completar todos las clases

Tabular los datos que se encuentren en cada clase.

Ejemplo: Cierto fabricante selecciona aleatoriamente 20

días de invierno y toma la temperatura °C con los siguientes resultados :

24, 35, 17, 21, 24, 37, 26, 46, 58, 30,

32, 13, 12, 38, 41, 43, 44, 27, 53, 27 Realice la tabla de distribución de frecuencia

Distribución de frecuencias relativas

Se obtiene dividiendo cada frecuencia de clase en el total de frecuencias. Las frecuencias relativas en ocasiones se expresan como porcentaje.Frecuencia relativa= frecuencia de clase

suma de todas las frecuenciasFrecuencia relativa= frecuencia de clase suma de todas las frecuencias

Edad Actrices Frec. Relativa

[20-30) 37%

[30-40) 39%

[40-50) 16%

[50-60) 3%

[60-70) 3%

[70-80) 3%

Distribución de frecuencias acumuladas

La frecuencia acumulada de una clase es la frecuencia de esa clase y de todas las anteriores.

Edad Actrices Frec. Acumulada

[20-30) 28

[30-40) 58

[40-50) 70

[50-60) 72

[60-70) 74

[70-80) 76

Exploración de datos

Distribución Normal Gráfica de campana Al inicio las frecuencias son bajas, después se

incrementan hasta un punto máximo y luego disminuyen.

Distribución aproximadamente simétrica y las frecuencias tienden a distribuirse de manera uniforme a ambos lados

Ej. Las frecuencias:1,5,6,10,7,4,1 son aprox normal

1,5,50,25,20,15,10,5,3,2 no se aprox normal.

Ejemplo Se seleccionaron a 1000 mujeres al azar y se

midieron sus estaturas. Tienen una distribución normal?

Estaturas (pulg) Frecuencia

[56-58) 10

[58-60) 64

[60-62) 178

[62-64) 324

[64-66) 251

[66-68) 135

[68-70) 32

[70-72) 6

Ejercicios de aplicación

La siguiente tabla corresponde a la frecuencia de los pesos (gramos) de monedas de un centavo elegidas al azar. ¿Cuáles son sus conclusiones?

Pesos (gramos) Frecuencia

[2,4-2,5) 18

[2,5-2,6) 19

[2,6-2,7) 0

[2,7-2,8) 0

[2,8-2,9) 2

[3,0-3,1) 25

[3,1-3,1) 8

Ejercicios de aplicación

Remítase a siguiente tabla de distribución. ¿Cuáles son sus conclusiones?

Estatura hombres (pulg)

Frecuencia

[60-65) 4

[65-70) 25

[70-75) 9

[75-80) 0

[80-85) 0

[85-90) 0

[90-95) 0

[95-100) 0

[100-105) 1

Una persona taladró un hoyo en un dado, lo rellenó de plomo y lo lanzó 180 veces. Los resultados se presentan en la distribución de frecuencias siguiente. Construya la distribución de frecuencias relativas para los resultados que esperaría de un dado perfectamente legal ¿Existen diferencias en los resultados de los dos dados?

Resultado Frecuencia

1 24

2 28

3 39

4 37

5 25

6 27

GRÁFICOS

Histograma

Es una gráfica de barra donde la escala horizontal representa clases de valores ( marca de clase y la escala vertical representa frecuencias. Las barras se dibujan sin espacios entre sí.

Ejemplo:

Realice el histograma a partir de la siguiente tabla:

Estaturas (pulg) Frecuencia

[56-58) 10

[58-60) 64

[60-62) 178

[62-64) 324

[64-66) 251

[66-68) 135

[68-70) 32

[70-72) 6

A partir del siguiente histograma que muestra las calificaciones de un examen de Estadística responda :

¿Cuántos estudiantes hicieron el examen?,

¿Cuál es la mínima calificación posible?

¿Cuál es la calificación más frecuente?

¿Cuál es el ancho de clase? Y el número de clases?

Polígono de frecuencia

Concepto: Gráfico que utiliza segmentos lineales conectados a puntos que se localizan directamente por encima de los valores de la marca de clase.

Las alturas de los puntos corresponden a la frecuencia de clase.

Ojiva Gráfica lineal que representa frecuencias acumuladas.

En el eje horizontal se muestran el límite superior de cada clase.

Temperatura FrecFrec

Acum%

Acum

[0 - 10) 0 0 0%

[10 - 20) 3 3 15%

[20 - 30) 6 9 45%

[30 – 40) 5 14 70%

[40-50) 4 18 90%

[50 – 60) 2 20 100%

Ojiva: Temperatura diaria

0

2

4

6

8

10

12

14

16

18

20

10 20 30 40 50 60

Límite de Clase

Fre

c. A

cum

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

% A

cum

.

a) ¿Cuántos dias se investigaron?

a) El 60% de los dias registraron temperaturas inferiores a ….

a) ¿Cuantos días se registraron temperaturas menores a 45° ?

A 40 estudiantes en la cafetería se les pidió que estimaran el número de horas que habían dedicado a estudiar en la semana anterior. El registro de respuestas aparece en la tabla. Construya la ojiva

Tiempo de estudio semanal en horas Frecuencia

10 y menos que 20 6

20 y menos que 30 11

30 y menos que 40 9

40 y menos que 50 7

50 y menos que 60 4

60 y menos que 70 2

70 y menos que 80 1

Diagrama tallo hojas Permite ver cómo se distribuyen y donde están

las concentraciones de datos. Se organiza los datos en grupos (llamados

tallos), para que los valores dentro de cada grupo (las hojas) ramifiquen hacia la derecha de cada fila.

Ej: 12,13,25,28,47, 48,49,49,65,66,1101 2 3

2 5 8

4 7 8 9 9

6 5 6

11 0

Efectúe el diagrama de tallo hoja para los siguientes conjuntos de datos 21, 24, 24, 26, 27, 27, 30, 32, 38, 41

613, 632, 658, 717,722, 750, 776, 827,841, 859, 863, 891,894, 906, 928, 933,955, 982, 1034, 1047,1056, 1140, 1169, 1224

Diagramas de dispersión

Gráficas de datos pareados (x,y). El patrón de puntos puede indicarnos que existe

alguna relación entre las variables

0

50

100

150

200

250

300

350

0 50 100 150Variable A

Var

iabl

e B

0

20

40

60

80

100

120

140

160

0 50 100 150Variable A

Var

iabl

e B

Relación creciente o positiva

Relación decreciente o negativa

No existe relación entre x y

Ejemplo

Ejercicio

Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la tabla se describen el nº de errores que corresponden a los intentos realizados. Realice el diagrama de dispersión.

Número de

intentos

Número de errores

1 15

2 12

3 10

4 8

5 7

6 5

7 5

8 2

Ejercicio

Gráficas de serie de tiempo

Se usa para estudiar patrones de las variables a través del tiempo .

Errores comunes

Muestra autoseleccionada: Los propios sujetos deciden ser incluidos. Encuestas por Internet, por correo o telefónicas.

Gráficas engañosas

Errores comunes

Pictogramas:

Preguntas predispuestas: Ej: ¿Debería el presidente utilizar su poder de veto para

eliminar los desperdicios? …………………… 97% si ¿Debería utilizar el presidente su poder de veto? 57% si

Orden de preguntas:◦ Ej: ¿Cree usted que el tránsito vehicular contribuye

a la contaminación mas o menos que la industria? 47% tránsito

◦ ¿Cree usted que la industria contribuye a la contaminación mas o menos que el tránsito vehicular ? 24% tránsito

Correlación y causalidad: Correlación indica que dos variables están relacionadas. Sin embargo correlación no implica causalidad.

Estudios para el propio beneficio.

Imágenes parciales :Ej. “El 90% de todos nuestros automóviles vendidos en este país en los últimos 10 años continua circulando”

Números precisos: Ej. En la actualidad existen 103´215.027 hogares

estadounidenses.

Muestras pequeñas

TALLER DE EJERCICIOS

top related