tema2 ud1-a

26
Probabilidades y Estadística I TEMA 2 Medidas características de una distribución de frecuencias

Upload: jacinto-gonzalez-pachon

Post on 26-Jul-2015

667 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tema2 ud1-a

Probabilidades y Estadística I

TEMA 2

Medidas características de una distribución de frecuencias

Page 2: Tema2 ud1-a

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Page 3: Tema2 ud1-a

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Page 4: Tema2 ud1-a

Probabilidades y Estadística I

1. Introducción

OBJETIVO

Resumir las características más importantes de los datos en un conjunto reducido de números.

Centralización Uniformidad

Dispersión Particularidad

Forma Simetrías/concentración

Relación Relación entre variables

C∈

D∈

F ∈

R∈

(1/2)

R

R

R

R

Page 5: Tema2 ud1-a

Probabilidades y Estadística I

- Distribución de frecuencias absolutas: { } kiin ,...1=

- Distribución de frecuencias relativas: { } kiif ,...,1= - Distribución de frecuencias absolutas acumuladas: { } kiiN ,...1= - Distribución de frecuencias absolutas relativas: { } kiiF ,...1=

1. Introducción (2/2)

ENUNCIADOS GENERALES

Sea x1, x2, ...., xn un conjunto de n datos

Sea X una variable estadística y sean x1’,x2’,...,xk’ sus modalidades (valores diferentes o marcas de clase).

ó

Datos explícitos

Datos implícitos

Page 6: Tema2 ud1-a

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Page 7: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (1/15)

Una forma de representar de forma sintética (agregada) la información contenida en una serie numérica

Criterio Medida Uso

Repeticiones Moda Medidas nominales

Orden Mediana Medidas ordinales

Valor numérico Media Medidas de intervalo

¿Cuál es el centro de los datos?

Page 8: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (2/15)

Moda

2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 Mo= 9

2, 5, 7, 9, 10, 11, 12 Mo no existe

2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 Mo= 4 y 7 (bimodal)

Datos explícitos(idea intuitiva)

Page 9: Tema2 ud1-a

Probabilidades y Estadística I

0 1 2 3 40

0,2

0,4

0,6

0,8

1

1,2

Mo

2. Medidas de centralización (3/15)

Datos implícitosModa (idea intuitiva)

Page 10: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (4/15)

Moda (definición formal)

Sea X una variable estadística y {x’1,x’2,...,x’k} el conjunto finito de modalidades. Sea {n1,n2,...,nk} su distribución de frecuencias absolutas y {f1,f2,.…,fk} su distribución de frecuencias relativas.

Se dice que x’p es la moda de la serie cuando

np= max {n1,n2,...nk}

fp= max {f1,f2,.…,fk}

Page 11: Tema2 ud1-a

Probabilidades y Estadística I

0 1 2 3 40

3

69

12

15

18

2. Medidas de centralización (5/15)

Moda Plurimodalidad

Unimodal

(características)

Page 12: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (6/15)

Mediana

Es el valor que deja a cada lado el 50% de los datos en la serie ordenada

3, 4, 5, 6, 8, 8, 10

3, 4, 4, 5, 6, 8, 8, 10

M = 6

M = 5.5

3, 4, 4, 5, 5, 8, 8, 10 M = 5

Datos explícitos(idea intuitiva)

7 datos

8 datos

8 datos

Page 13: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (7/15)

MedianaDatos

implícitos

5 6 7 8 94

0.2

0.4

0.6

0.8

1

0.5

M

(idea intuitiva)

Page 14: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (8/15)

Mediana (definición formal)

Sea x1, x2, ...., xn una serie de datos y sea x(1) ≤ x(2) ....≤ x(k) la serie ordenadade menor a mayor.

( )

( ) ( )

j

j j+1

n +1x si j2Mn +1si j < j 1

2 2

== + < +

x x

Sea X una variable estadística y F(x) su función acumulativa de frecuencias relativas. Se define la mediana como la solución de la siguiente ecuación funcional

F(x) = ½

Datos explícitos

Datos implícitos

Page 15: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (9/15)

Mediana (características)

Es poco sensible a asimetrías

MM

Page 16: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (10/15)

Mediana (características)

Es insensible a valores atípicos

M M

Page 17: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (11/15)

Media aritmética (idea intuitiva)

Centro de gravedad de los datos

Page 18: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (12/15)

Media aritmética (definición)

1 2 nx x .... x n

+ + +

Datos explícitos

∑∑

=

===k

i

k

iii

ii n

xnxfX

1

1'

'Datos

implícitos

Page 19: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (13/15)

Media aritmética (características)

Cuanto más asimétrica sea más se desplaza la media hacia la cola

Page 20: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (14/15)

Media aritmética (características)

Es muy sensible a valores atípicos

Page 21: Tema2 ud1-a

Probabilidades y Estadística I

2. Medidas de centralización (15/15)

Media aritmética (características)

Es un operador lineal (equivale a la regla de tres)

a X bY a X bY+ = +

Page 22: Tema2 ud1-a

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Page 23: Tema2 ud1-a

Probabilidades y Estadística I

3. Medidas de dispersión (1/11)

MOTIVACIÓN

Page 24: Tema2 ud1-a

Probabilidades y Estadística I

3. Medidas de dispersión (2/11)

Una forma de representar cuánto discrepan los valores de una serie de datos

Distancia media a la media

Varianza/Desviación típica Medidas de intervalo

Orden Cuartiles/Percentiles Medidas ordinales

Discrepancia Rango Medidas nominales

¿cuánto se alejan de lo uniforme los valores de una serie ?

Criterio Medida Uso

Page 25: Tema2 ud1-a

Probabilidades y Estadística I

3. Medidas de dispersión (3/11)

Rango (idea intuitiva)

Rango 1 Rango 2

Page 26: Tema2 ud1-a

Probabilidades y Estadística I

3. Medidas de dispersión (4/11)

Rango (definición formal)

Sea X una variable estadística y {x’1,x’2,...,x’k} el conjunto finito de modalidades. Sea {n1,n2,...,nk} su distribución de frecuencias absolutas y {f1,f2,.…,fk} su distribución de frecuencias relativas.

Rg X = Max X − Min X = x’k − x’1