curso: estadística instrumentos y matriz de datos medidas … · 2018. 4. 18. · la media...

35
Instrumentos y matriz de datos Curso: Estadística Profesor: Gonzalo Fernández Fecha: 19/09/2017 Estadística Descriptiva Medidas descriptivas de Tendencia Central y Posición

Upload: others

Post on 04-Dec-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Instrumentos y matriz de datos

Curso: Estadística

Profesor: Gonzalo Fernández

Fecha: 19/09/2017

Estadística Descriptiva

Medidas descriptivas de

Tendencia Central y Posición

Page 2: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

LOGRO DE LA SESIÓN

Al finalizar la sesión, elestudiante estará en lacapacidad de calcular einterpretar medidas detendencia central yposición de un conjuntode datos sin agrupar yagrupados en tablas defrecuencias con precisión yexactitud de cálculo.

Page 3: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Sesión 5: Medidas de tendencia central y posición

CONTENIDO SABERES PREVIOS

1. Medidas descriptivas de tendencia central:

1.1 Media aritmética.1.2 Mediana.1.3 Moda.2. Medidas descriptivas de

posición:2.1 Cuartiles.2.2 Percentiles.

Conceptos fundamentales de estadística.

Manejo de funciones básicas de Excel o MegaStat.

Page 4: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

INTRODUCCIÓN

Las medidas de tendencia central son medidas estadísticas que se usan para resumir la distribución de datos con un solo valor, dicho valor se dice que es representativo de los datos.

Las medidas de tendencia central son medidas estadísticas quese usan para resumir la distribución de datos con un solo valor,dicho valor se dice que es representativo de los datos.

Page 5: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

ESTADÍSTICA DESCRIPTIVA

RECOLECCIÓN CLASIFICACIÓN

PRESENTACIÓN DESCRIPCIÓN

DATOS

PRESENTACIÓN

TABLAS DE FRECUENCIA

SIN INTERVALOS

CON INTERVALOS

GRÁFICOS

BARRAS CIRCULARES

HISTOGRAMAS

DESCRIPCIÓN

MEDIDAS TENDENCIA CENTRAL, DISPERSIÓN Y FORMA

POSICIÓN

CUARTILES

DECILES

PERCENTILES

CENTRALIZACIÓN

MEDIA MEDIANA

MODA

DISPERCIÓN

RANGO

VARIANZA DESVIACION ESTANDAR

C.V.

FORMA

ASIMETRÍA CURTOSIS

Page 6: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Medidas Resumen

Media Aritmética

Mediana

Moda

Descripción Numerica de Datos

Varianza

Desviación Estándar

Coeficiente de Variación

Rango

Rango Intercuartílico

Asimetría

Tendencia Central Variación Forma

Cuartiles

Percentiles

Page 7: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

CLASIFICACIÓN DE MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central mas utilizadas son:

Media Aritmética

Mediana

Moda

Cuartiles

Deciles

Percentiles

Page 8: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

La Media Aritmética es una de las medidas de resumen más importante

de la Estadística, es un valor que tiende a ubicarse en el centro de la

distribución de un conjunto de datos.

Se obtiene al dividir la suma de todos los valores de un conjunto de

datos entre el número total de datos.

1. MEDIA ARITMÉTICA PARA DATOS NO AGRUPADOS

Donde: xi: valores de la data

n: número total de datos n

x

X

n

i

i 1

Ejemplo 1: La Media de 2,2,3,7 es (2+2+3+7)/4=3,5

- Conveniente cuando los datos se concentran simétricamente

con respecto a ese valor.

- Muy sensible a valores extremos.

- Centro de gravedad de los datos.

Page 9: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

2. MEDIANA PARA DATOS NO AGRUPADOS

Si el número de datos es impar, la mediana es el valor central.

Ejemplo 2: Mediana de 1, 2, 4, 5, 6, 6, 8 es Me=5

Si el número de datos es par, se elige el punto medio de los dos datos centrales.

Ejemplo 3: Mediana de 1, 2, 4, 5, 6, 6, 8, 9 es Me=(5+6)/2=5,5

• Es el valor que ocupa la posición central de un conjunto deobservaciones, una vez que han sido ordenados en formaascendente o descendente.

• Divide al conjunto de datos en dos partes iguales.

- Es conveniente cuando los datos son asimétricos.

- No es sensible a valores extremos.

Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!

Page 10: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Mediana: Posición y Valor• Si los datos están ordenados, la mediana es el valor

“medio” (50% inferiores, 50% superiores)

• La localización (posición) de la mediana (n impar):

• El valor de la mediana NO es afectado porvalores extremos.

1

2

nPosición Mediana posición en los datos ordenados

50% 50%

Me

Datos ordenados

Page 11: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

3. MODA PARA DATOS NO AGRUPADOS

•Observación o clase que tiene la mayor frecuencia en un conjunto

de observaciones.

•Un conjunto de datos puede ser unimodal, bimodal o multimodal.

• Es la única medida de tendencia central que se puede determinarpara datos de tipo cualitativo y cuantitativo.

Ejemplo 4: Se tiene el Ingreso familiar de un grupo de familias

1000 2000 1300 1300 1500 1600

Mo =1300 (Unimodal)

El ingreso más frecuente es 1300 Soles.

1100 1200 1200 1300 1400 1400 1700

Mo = 1200 y Mo = 1400 (Bimodal)

Page 12: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Ejemplo 3:

El gerente del hotel Buen Samaritano de Ica brinda que brinda

hospedaje a turistas que visitan la laguna de Huacachina, tiene el

propósito de conocer el promedio de días que permanecen los turistas.

Para el estudio se ha tomado el registro de 20 días, y los días de

estancia de los turistas son:

1 1 2 2 5 4 1 2 3 5 4 1 2 3 1 4 2 1 4 1

Calcule e interpreta la media, mediana y moda

Interpretaciones:

Page 13: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

MEDIDAS DE CENTRALIZACIÓN

MEDIA O PROMEDIO MEDIANA MODA

( )X ( )Me ( )Mo

Page 14: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Se utilizará cuando los datos están distribuidos en una tabla de

frecuencias. Luego se calcula la media aritmética aplicando la

fórmula:

Donde:

fi = frecuencia absoluta

xi = Marca de clase

n = número de observaciones

Observaciones:

La media se puede hallar sólo para variables cuantitativas.

La media es independiente de las amplitudes de los intervalos.

La media es muy sensible a las puntuaciones extremas.

4. MEDIA ARITMÉTICA PARA DATOS AGRUPADOS

n

i

ii

n

fxX

1

Page 15: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Ejemplo 5: La siguiente tabla muestra el número de autos vendidos

mensualmente por los empleados de una tienda de automóviles:

Interpretación: El promedio mensual de autos

vendidos por los empleados fue de 37.

N° de Autosxi fi fixi

Li Ls

10 20 15 9 135

20 30 25 15 375

30 40 35 26 910

40 50 45 16 720

50 60 55 10 550

60 70 65 4 260

TOTAL n =80 2950

MEDIA ARITMÉTICA PARA DATOS AGRUPADOS

88.3680

2950

1

n

i

ii

n

fxX

Page 16: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Cuando se trabajan con tablas de frecuencias de intervalos, la

fórmula para calcular la mediana es:

5. MEDIANA PARA DATOS AGRUPADOS

12 i

i i

i

n

Me L cf

F

Donde:

Li : Límite inferior de la clase mediana.

Fi-1 : Frecuencia acumulada anterior a la clase mediana.

fi : Frecuencia absoluta de la clase mediana.

ci : Amplitud de la clase mediana.

Page 17: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Ejemplo 6: En el ejemplo 5 calcular la mediana del número de autos

vendidos.

Interpretación: El 50% de los empleados vendieron una

cantidad menor o igual a 36 autos.

40 24 1630 10 30 10 36 15 36

26 26.Me

MEDIANA PARA DATOS AGRUPADOS

N° de AutosXi fi FiLi Ls

10 20 15 9 9

20 30 25 15 24

30 40 35 26 50

40 50 45 16 66

50 60 55 10 76

60 70 65 4 80

TOTAL n =80

n/2=80/2=40ci=10

Mediana

Page 18: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Cuando se trabajan con tablas de frecuencias de intervalos, la

fórmula para calcular la moda es:

Donde:

Li : Límite inferior de la clase modal

ci: Amplitud del intervalo de la clase modal

n : número total de observaciones o datos

Δ1= fj – fj-1 y Δ2= fj – fj+1

Δ1 : Diferencia entre la frecuencia modal y la frecuencia anterior.

Δ2: Diferencia entre la frecuencia modal y la frecuencia siguiente.

1

2 1

i ioM L c

6. MODA PARA DATOS AGRUPADOS

• La moda tiene la ventaja de no ser afectada por valores extremos.

Nota

Page 19: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Ejemplo 7: En el ejemplo 5 calcular la moda del número de autos

vendidos.

MODA PARA DATOS AGRUPADOS

N° de Autosxi fiLi Ls

10 20 15 9

20 30 25 15

30 40 35 26

40 50 45 16

50 60 55 10

60 70 65 4

TOTAL n =80

ci=10

Moda

1130 10 35 24 35

11 10.Mo

Mayor Frecuencia

fi= 26

Δ2= 10

Interpretación: El número de autos vendidos con mayor frecuencia fue de 35.

Δ1= 11

Page 20: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

k

i i

i 1 1 1 2 2 k k

p

1 2 k

n xn x n x ... n x

xn n n ... n

7. MEDIA PONDERADA

La media ponderada de un conjunto de observaciones x1, x2,... xn,

con pesos o ponderaciones p1, p2,... pn se define como:

n

i i

i 1 1 1 2 2 n n

p

1 2 n

p xp x p x ... p x

xP p p ... p

n

i

i 1

P p

Donde:

En particular:

Donde :

ni : Número de elementos de cada grupo.

: Media aritmética (i=1,2, …., k).ix

Page 21: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

A continuación se presentan las notas finales de un alumno, obtenidas al

concluir el semestre académico y los créditos que tiene cada uno de los

cursos que ha llevado:

CURSO Nª de créditos Nota

Matemáticas 4 15

Lenguaje 3 14

Inglés 2 16

¿Cuál es su PROMEDIO de notas ?

EJEMPLO 8: MEDIA PONDERADA

3

1 4 15 3 14 2 16 13414.89

4 3 2 9

i i

ip

n x

xn

Page 22: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Propiedades de la Media

Si , entonces

Luego, Resumiendo

0x

constante a ,xaax

constante a ,axax

0,0,0 11 nxxx

yxyx

constantes ba, ,ybxabyax

Page 23: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Medidas de Posición

• La mediana (poblacional o muestral) divide el conjunto (ordenado) de datos en dos partes iguales. Si se dividen los datos en más de dos partes se pueden obtener medidas de localización más finas.

Primer

cuartil

Segundo

cuartil

Tercer

cuartil

2° cuartil = mediana

Deciles = división

en diez partes

Cuartiles = división

en cuatro partes

Percentiles = división

en 100 partes

Page 24: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Estadísticos de posición

Page 25: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

25% 25% 25% 25%

Q3Q2Q1

Cuartiles

Page 26: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Cuartiles

Medidas de posición que dividen a un conjunto de

datos ordenados en 4 partes iguales y cada una de ellas

representa el 25% de los datos.

Q1: 25% de los datos están debajo del primer cuartil

Q2: 50% de los datos están debajo del segundo cuartil

Q3: 75% de los datos están debajo del tercer cuartil.

25% 25% 25% 25%

Q3Q2Q1

Page 27: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Ejemplo: Calculando Cuartiles

•Datos ordenados: 106, 109, 114, 116, 121, 122, 125, 129

Q1:

Q2:

Q3:

i Q

25

1008 2

109 114

211151( ) .

i Q

50

1008 4

116 121

211852( ) .

i Q

75

1008 6

122 125

212353( ) .

n=8

Note que cuando i es un número entero el cuartil es el promedio de los

valores de los datos ubicados en los lugares i e (i+1), en la data ordenada.

Page 28: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Percentil (Pk): Llamado también centil k, donde el k-ésimopercentil es un valor tal que por lo menos k por ciento de lasobservaciones son menores o iguales a este valor y por lomenos (100-k) por ciento de las observaciones son mayoresa este valor.

Percentil de orden k, localización i=(k/100)n

El percentil de orden 15: Al menos 15% de lasobservaciones están en o por debajo de ese valor, ycuando menos 85% están en o sobre ese valor.

Primer cuartil = Percentil 25

Segundo cuartil = Percentil 50 = Mediana

Tercer cuartil = Percentil 75.

Percentiles

Page 29: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Procedimiento para el cálculo del k-ésimo percentil:

• Paso 1: Ordene los datos de forma ascendente.

• Paso 2: Calcule un índice i, para localizar el percentil.

Se presenta dos casos:

a) Si i no es entero, i se redondea al entero mayor, el k-ésimopercentil es el dato que ocupa la posición i.

b) Si i es entero, el k-ésimo percentil es el promedio de los valores delos datos ubicados en los lugares i e i+1.

• Paso 3: El percentil es el dato que ocupa la posición i.

( )100

ki n

Donde:

k = percentil

i = localización percentil

n = número de datos

Page 30: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

• Data: 14, 12, 19, 23, 5, 13, 28, 17

• Ordenando la data: 5, 12, 13, 14, 17, 19, 23, 28

• Problema: Halle el percentil 30• Número de observaciones n = 8

• Localización del Percentil 30:

• El índice de localización, i, no es un número entero.

• Por tanto, aproximando i al entero mayor, tenemos i = 3.

• El percentil 30 está en la tercera posición de la data ordenada : Percentil 30 = 13

Ejemplo: Calculando Percentiles

Page 31: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Asimétrica

Negativa

Moda

Mediana

Media

Simétrica

(No Asimétrica)

Media

Mediana

Moda

Asimétrica

Positiva

Moda

Mediana

Media

• Si media=mediana=moda, la distribución es simétrica.• Si media<mediana, la distribución es asimétrica negativa.• Si media>mediana, la distribución es asimétrica positiva.

Relación entre la media, mediana y moda

Page 32: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Relación entre la media, mediana y moda

Page 33: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

Sensitividad a los Valores Extremos

• Un conjunto de datos contiene 19 familias, con 8

familias que ganan US$30,000 por año, 10 ganan

US$35,000 por año, y que 1 gana $1 millones por

año.

684,83$19

000,590,1

19

)000,000,1(1)000,35(10)000,30(8

X

$35,000Me

Si la distribución es altamente asimétrica, la

mediana es la mejor elección.

Page 34: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

Page 35: Curso: Estadística Instrumentos y matriz de datos Medidas … · 2018. 4. 18. · La Media Aritmética es una de las medidas de resumen más importante de la Estadística, es un

“Las estadísticas no sustituyen el juicio.”Henry Clay