tema2 ud1-a

Post on 26-Jul-2015

667 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Probabilidades y Estadística I

TEMA 2

Medidas características de una distribución de frecuencias

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Probabilidades y Estadística I

1. Introducción

OBJETIVO

Resumir las características más importantes de los datos en un conjunto reducido de números.

Centralización Uniformidad

Dispersión Particularidad

Forma Simetrías/concentración

Relación Relación entre variables

C∈

D∈

F ∈

R∈

(1/2)

R

R

R

R

Probabilidades y Estadística I

- Distribución de frecuencias absolutas: { } kiin ,...1=

- Distribución de frecuencias relativas: { } kiif ,...,1= - Distribución de frecuencias absolutas acumuladas: { } kiiN ,...1= - Distribución de frecuencias absolutas relativas: { } kiiF ,...1=

1. Introducción (2/2)

ENUNCIADOS GENERALES

Sea x1, x2, ...., xn un conjunto de n datos

Sea X una variable estadística y sean x1’,x2’,...,xk’ sus modalidades (valores diferentes o marcas de clase).

ó

Datos explícitos

Datos implícitos

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Probabilidades y Estadística I

2. Medidas de centralización (1/15)

Una forma de representar de forma sintética (agregada) la información contenida en una serie numérica

Criterio Medida Uso

Repeticiones Moda Medidas nominales

Orden Mediana Medidas ordinales

Valor numérico Media Medidas de intervalo

¿Cuál es el centro de los datos?

Probabilidades y Estadística I

2. Medidas de centralización (2/15)

Moda

2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 Mo= 9

2, 5, 7, 9, 10, 11, 12 Mo no existe

2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 Mo= 4 y 7 (bimodal)

Datos explícitos(idea intuitiva)

Probabilidades y Estadística I

0 1 2 3 40

0,2

0,4

0,6

0,8

1

1,2

Mo

2. Medidas de centralización (3/15)

Datos implícitosModa (idea intuitiva)

Probabilidades y Estadística I

2. Medidas de centralización (4/15)

Moda (definición formal)

Sea X una variable estadística y {x’1,x’2,...,x’k} el conjunto finito de modalidades. Sea {n1,n2,...,nk} su distribución de frecuencias absolutas y {f1,f2,.…,fk} su distribución de frecuencias relativas.

Se dice que x’p es la moda de la serie cuando

np= max {n1,n2,...nk}

fp= max {f1,f2,.…,fk}

Probabilidades y Estadística I

0 1 2 3 40

3

69

12

15

18

2. Medidas de centralización (5/15)

Moda Plurimodalidad

Unimodal

(características)

Probabilidades y Estadística I

2. Medidas de centralización (6/15)

Mediana

Es el valor que deja a cada lado el 50% de los datos en la serie ordenada

3, 4, 5, 6, 8, 8, 10

3, 4, 4, 5, 6, 8, 8, 10

M = 6

M = 5.5

3, 4, 4, 5, 5, 8, 8, 10 M = 5

Datos explícitos(idea intuitiva)

7 datos

8 datos

8 datos

Probabilidades y Estadística I

2. Medidas de centralización (7/15)

MedianaDatos

implícitos

5 6 7 8 94

0.2

0.4

0.6

0.8

1

0.5

M

(idea intuitiva)

Probabilidades y Estadística I

2. Medidas de centralización (8/15)

Mediana (definición formal)

Sea x1, x2, ...., xn una serie de datos y sea x(1) ≤ x(2) ....≤ x(k) la serie ordenadade menor a mayor.

( )

( ) ( )

j

j j+1

n +1x si j2Mn +1si j < j 1

2 2

== + < +

x x

Sea X una variable estadística y F(x) su función acumulativa de frecuencias relativas. Se define la mediana como la solución de la siguiente ecuación funcional

F(x) = ½

Datos explícitos

Datos implícitos

Probabilidades y Estadística I

2. Medidas de centralización (9/15)

Mediana (características)

Es poco sensible a asimetrías

MM

Probabilidades y Estadística I

2. Medidas de centralización (10/15)

Mediana (características)

Es insensible a valores atípicos

M M

Probabilidades y Estadística I

2. Medidas de centralización (11/15)

Media aritmética (idea intuitiva)

Centro de gravedad de los datos

Probabilidades y Estadística I

2. Medidas de centralización (12/15)

Media aritmética (definición)

1 2 nx x .... x n

+ + +

Datos explícitos

∑∑

=

===k

i

k

iii

ii n

xnxfX

1

1'

'Datos

implícitos

Probabilidades y Estadística I

2. Medidas de centralización (13/15)

Media aritmética (características)

Cuanto más asimétrica sea más se desplaza la media hacia la cola

Probabilidades y Estadística I

2. Medidas de centralización (14/15)

Media aritmética (características)

Es muy sensible a valores atípicos

Probabilidades y Estadística I

2. Medidas de centralización (15/15)

Media aritmética (características)

Es un operador lineal (equivale a la regla de tres)

a X bY a X bY+ = +

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Probabilidades y Estadística I

3. Medidas de dispersión (1/11)

MOTIVACIÓN

Probabilidades y Estadística I

3. Medidas de dispersión (2/11)

Una forma de representar cuánto discrepan los valores de una serie de datos

Distancia media a la media

Varianza/Desviación típica Medidas de intervalo

Orden Cuartiles/Percentiles Medidas ordinales

Discrepancia Rango Medidas nominales

¿cuánto se alejan de lo uniforme los valores de una serie ?

Criterio Medida Uso

Probabilidades y Estadística I

3. Medidas de dispersión (3/11)

Rango (idea intuitiva)

Rango 1 Rango 2

Probabilidades y Estadística I

3. Medidas de dispersión (4/11)

Rango (definición formal)

Sea X una variable estadística y {x’1,x’2,...,x’k} el conjunto finito de modalidades. Sea {n1,n2,...,nk} su distribución de frecuencias absolutas y {f1,f2,.…,fk} su distribución de frecuencias relativas.

Rg X = Max X − Min X = x’k − x’1

top related