tipificación, estandarización, valores z

6
Tipificación y estandarización de variables aleatorias Claudia Guerrero Sepúlveda 1 TIPIFICACIÓN, ESTANDARIZACIÓN, transformación de variables Es un procedimiento que facilita la comparación entre: - Los valores de dos distribuciones distintas. - Los valores de variables con unidades distintas - Reconocimiento de valores atípicos o dentro de ciertos valores de acuerdo a la regla empírica Una variable está tipificada o estandarizada cuando a sus valores se les resta su media aritmética y se les divide por su desviación estándar σ x x z i i - = El resultado de esta operación es otra variable (tipificada) con media cero y de varianza y desviación estándar 1. A estas variables se les representa por la letra Z

Upload: claudia-guerrero

Post on 30-Jul-2015

8.185 views

Category:

Documents


1 download

DESCRIPTION

Cálculo de la transformación lineal de una variable aleatoria para efectos de comparación y de aplicación de la regla empírica

TRANSCRIPT

Page 1: Tipificación, estandarización, valores Z

Tipificación y estandarización de variables aleatorias

Claudia Guerrero Sepúlveda

1

TIPIFICACIÓN, ESTANDARIZACIÓN, transformación de variables

Es un procedimiento que facilita la comparación entre:

- Los valores de dos distribuciones distintas.

- Los valores de variables con unidades distintas

- Reconocimiento de valores atípicos o dentro de ciertos valores de acuerdo a la regla

empírica

Una variable está tipificada o estandarizada cuando a sus valores se les resta su media aritmética y

se les divide por su desviación estándar

σ

xxz

i

i

−=

El resultado de esta operación es otra variable (tipificada) con media cero y de varianza y

desviación estándar 1.

A estas variables se les representa por la letra Z

Page 2: Tipificación, estandarización, valores Z

Tipificación y estandarización de variables aleatorias

Claudia Guerrero Sepúlveda

2

Comparación entre los valores de dos distribuciones distintas

Queremos comparar valores de distintas distribuciones, cómo sería el caso de las notas que se

obtienen en por ejemplo matemáticas con dos profesores distintos.

Con el profesor A la media es 7 mientras que quienes obtienen 7 están a .799 desviaciones

estándar de la media.

El valor Z es el número de desviaciones estándar a la izquierda o a la derecha

Con el profesor B quien obtiene un cinco está a -2.58 desviaciones estándar de la media

Conversión entre dos maestros.

Un 8 del profesor A equivale a un X del profesor B

σ

xxz

i

i

−=

iixxz =+σ

8 con el profesor A es igual a una Z=0.70710678

Una Z=0.70710678 del profesor B equivale a

Alumno Calificación Valor Z Alumno Calificación Valor Z

1 8 0.70710678 1 8 0.09407209

2 8 0.70710678 2 7 -0.79961274

3 10 2.12132034 3 7 -0.79961274

4 7 0 4 6 -1.69329756

5 7 0 5 9 0.98775691

6 8 0.70710678 6 8 0.09407209

7 9 1.41421356 7 9 0.98775691

8 9 1.41421356 8 5 -2.58698239

9 6 -0.70710678 9 9 0.98775691

10 6 -0.70710678 10 8 0.09407209

11 7 0 11 9 0.98775691

12 5 -1.41421356 12 9 0.98775691

13 5 -1.41421356 13 7 -0.79961274

14 6 -0.70710678 14 8 0.09407209

15 5 -1.41421356 15 8 0.09407209

16 7 0 16 9 0.98775691

17 7 0 17 8 0.09407209

18 7 0 18 9 0.98775691

19 8 0.70710678 19 7 -0.79961274

20 5 -1.41421356

Medida 7 Medida 7.89473684

Desv. Est 1.41421356 Desv. Est 1.11896272

Page 3: Tipificación, estandarización, valores Z

Tipificación y estandarización de variables aleatorias

Claudia Guerrero Sepúlveda

3

6859.8894.71189.1*70710678.0 =+

En este proceso se homogeneizaron las dos distribuciones, eliminando las características propias y

reduciéndolas a un único patrón.

Alumno Calificación Valor Z Otro profesor Alumno Calificación Valor Z Otro profesor

1 8 0.70710678 9 1 8 0.09407209 7

2 8 0.70710678 9 2 7 -0.79961274 6

3 10 2.12132034 10 3 7 -0.79961274 6

4 7 0 8 4 6 -1.69329756 5

5 7 0 8 5 9 0.98775691 8

6 8 0.70710678 9 6 8 0.09407209 7

7 9 1.41421356 9 7 9 0.98775691 8

8 9 1.41421356 9 8 5 -2.58698239 3

9 6 -0.70710678 7 9 9 0.98775691 8

10 6 -0.70710678 7 10 8 0.09407209 7

11 7 0 8 11 9 0.98775691 8

12 5 -1.41421356 6 12 9 0.98775691 8

13 5 -1.41421356 6 13 7 -0.79961274 6

14 6 -0.70710678 7 14 8 0.09407209 7

15 5 -1.41421356 6 15 8 0.09407209 7

16 7 0 8 16 9 0.98775691 8

17 7 0 8 17 8 0.09407209 7

18 7 0 8 18 9 0.98775691 8

19 8 0.70710678 9 19 7 -0.79961274 6

20 5 -1.41421356 6

Medida 7 Medida 7.89473684

Desv. Est 1.41421356 Desv. Est 1.11896272

Page 4: Tipificación, estandarización, valores Z

Tipificación y estandarización de variables aleatorias

Claudia Guerrero Sepúlveda

4

Los valores de variables individuos

La variable que ha sido tipificada expresa el número de desviaciones típicas que difiere de la

media, así es que en un mismo individuo se pude expresar el número de las desviaciones típicas

que difiere de la media en las diferentes variables y unidades de medida.

Por ejemplo la paciente señalada en verde tiene todos sus valores arriba de la media, a excepción

del peso en el que está bajo de la media. La presión diastólica está a 2.85 desv. Estándar de la

media.

Media 45.00 121.64 81.59 64.88 68.58 73.77

Desv 3.12 16.66 9.97 285.11 2.49 9.47

Edad Zedad Sexo

presión

sistólica

Zpresió

n

sistólica

presió

n

diastó

lica

Zpresión

diastólic

a

colester

ol

Zcoleste

rol altura IN Zaltura peso Zpeso

ataque

(0,no

1,si) Est.Salud

45 0.00 Femenino 124.00 0.14 80 -0.16 254 0.66 70 0.57 86.18 1.31 0 Bueno

48 0.96 Femenino 110.00 -0.70 70 -1.16 240 0.61 73 1.78 97.98 2.56 0 Bueno

40 -1.60 Masculino 114.00 -0.46 80 -0.16 279 0.75 68 -0.23 80.74 0.74 0 Regular

42 -0.96 Masculino 100.00 -1.30 80 -0.16 284 0.77 68 -0.23 67.59 -0.65 0 Bueno

45 0.00 Femenino 190.00 4.10 110 2.85 315 0.88 68 -0.23 82.55 0.93 1 Bueno

49 1.28 Femenino 130.00 0.50 88 0.64 250 0.65 70 0.57 83.91 1.07 0 Muy Malo

50 1.60 Femenino 130.00 0.50 94 1.24 298 0.82 68 -0.23 73.03 -0.08 0 Excelente

43 -0.64 Masculino 110.00 -0.70 74 -0.76 384 1.12 67 -0.63 79.38 0.59 0 Malo

46 0.32 Femenino 120.00 -0.10 80 -0.16 310 0.86 66 -1.03 65.32 -0.89 0 Malo

48 0.96 Masculino 120.00 -0.10 80 -0.16 337 0.95 67 -0.63 58.97 -1.56 0 Excelente

41 -1.28 Femenino 130.00 0.50 80 -0.16 367 1.06 69 0.17 73.48 -0.03 0 Excelente

45 0.00 Femenino 120.00 -0.10 90 0.84 273 0.73 68 -0.23 79.38 0.59 0 Regular

45 0.00 Masculino 130.00 0.50 75 -0.66 273 0.73 66 -1.03 70.31 -0.37 0 Bueno

43 -0.64 Masculino 120.00 -0.10 80 -0.16 314 0.87 74 2.18 70.76 -0.32 0 Muy Malo

44 -0.32 Femenino 115.00 -0.40 70 -1.16 243 0.62 65 -1.44 68.49 -0.56 0 Excelente

42 -0.96 Femenino 140.00 1.10 90 0.84 341 0.97 74 2.18 76.20 0.26 0 Excelente

42 -0.96 Femenino 138.00 0.98 80 -0.16 245 0.63 70 0.57 83.91 1.07 0 Bueno

49 1.28 Masculino 115.00 -0.40 82 0.04 302 0.83 69 0.17 70.36 -0.36 0 Excelente

47 0.64 Femenino 148.00 1.58 110 2.85 302 0.83 69 0.17 68.12 -0.60 1 Excelente

45 0.00 Masculino 120.00 -0.10 70 -1.16 386 1.13 66 -1.03 66.22 -0.80 0 Muy Malo

49 1.28 Femenino 110.00 -0.70 70 -1.16 312 0.87 71 0.97 77.11 0.35 1 Regular

41 -1.28 Femenino 132.00 0.62 90 0.84 302 0.83 69 0.17 73.03 -0.08 0 Malo

46 0.32 Masculino 112.00 -0.58 80 -0.16 394 1.15 69 0.17 75.75 0.21 0 Muy Malo

50 1.60 Masculino 114.00 -0.46 70 -1.16 358 1.03 69 0.17 89.81 1.69 0 Malo

Page 5: Tipificación, estandarización, valores Z

Tipificación y estandarización de variables aleatorias

Claudia Guerrero Sepúlveda

5

Reconocimiento de valores atípicos o dentro de ciertos valores de

frecuencia de acuerdo a la regla empírica

La mayoría de experimentos con los que nos encontramos, cumplen a grandes rasgos un

comportamiento que por lo pronto llamaremos normal.

Si se miden los estudiantes de una universidad será probable que encontremos un buen número

de estaturas alrededor de 1.75, habrá pocos arriba de 1.80 y prácticamente a nadie de 2.0 ms o de

1.40

Hay muchas variables que cumplen este tipo de comportamiento en forma de campana, siendo

esta distribución básica en los estudios estadísticos.

Una de sus características es que la mayor parte de sus observaciones se acumula alrededor de la

media y decrece en forma simétrica cuando nos alejamos de la media

La forma de esta campana dependerá de lo concentradas que estén las observaciones en torno a

su media, concentración (dispersión) que vendrá dada por la varianza, esta característica se

resume en la siguiente regla empírica:

· media ± desviaciones estándar (s) contiene aproximadamente 68% de las observaciones.

· media ± 2 desviaciones estándar (s) contiene aproximadamente 95% de las observaciones.

· media ± 3 desviaciones estándar (s) contiene casi todas las observaciones. 99.7 % de las

Page 6: Tipificación, estandarización, valores Z

Tipificación y estandarización de variables aleatorias

Claudia Guerrero Sepúlveda

6

Observaciones

La regla empírica alrededor de la normal trata entonces de una estimación del % que se encuentra

alrededor de la media en función de las desviaciones estándar.

VALORES ATIPICOS

Se considera que todos los valores a más menos 3 desviaciones estándar son valores atípicos

El caso de la paciente señalada en rojo muestra un comportamiento más allá de las tres

desviaciones estándar por lo que sugiere una nueva medición, tomar un medicamento o una visita

médica.

Media 45.00 121.64 81.59 64.88 68.58 73.77

Desv 3.12 16.66 9.97 285.11 2.49 9.47

Edad Zedad Sexo

presión

sistólica

Zpresió

n

sistólica

presió

n

diastó

lica

Zpresión

diastólic

a

colester

ol

Zcoleste

rol altura IN Zaltura peso Zpeso

ataque

(0,no

1,si) Est.Salud

45 0.00 Femenino 124.00 0.14 80 -0.16 254 0.66 70 0.57 86.18 1.31 0 Bueno

48 0.96 Femenino 110.00 -0.70 70 -1.16 240 0.61 73 1.78 97.98 2.56 0 Bueno

40 -1.60 Masculino 114.00 -0.46 80 -0.16 279 0.75 68 -0.23 80.74 0.74 0 Regular

42 -0.96 Masculino 100.00 -1.30 80 -0.16 284 0.77 68 -0.23 67.59 -0.65 0 Bueno

45 0.00 Femenino 190.00 4.10 110 2.85 315 0.88 68 -0.23 82.55 0.93 1 Bueno

49 1.28 Femenino 130.00 0.50 88 0.64 250 0.65 70 0.57 83.91 1.07 0 Muy Malo

50 1.60 Femenino 130.00 0.50 94 1.24 298 0.82 68 -0.23 73.03 -0.08 0 Excelente

43 -0.64 Masculino 110.00 -0.70 74 -0.76 384 1.12 67 -0.63 79.38 0.59 0 Malo

46 0.32 Femenino 120.00 -0.10 80 -0.16 310 0.86 66 -1.03 65.32 -0.89 0 Malo

48 0.96 Masculino 120.00 -0.10 80 -0.16 337 0.95 67 -0.63 58.97 -1.56 0 Excelente

41 -1.28 Femenino 130.00 0.50 80 -0.16 367 1.06 69 0.17 73.48 -0.03 0 Excelente

45 0.00 Femenino 120.00 -0.10 90 0.84 273 0.73 68 -0.23 79.38 0.59 0 Regular

45 0.00 Masculino 130.00 0.50 75 -0.66 273 0.73 66 -1.03 70.31 -0.37 0 Bueno

43 -0.64 Masculino 120.00 -0.10 80 -0.16 314 0.87 74 2.18 70.76 -0.32 0 Muy Malo

44 -0.32 Femenino 115.00 -0.40 70 -1.16 243 0.62 65 -1.44 68.49 -0.56 0 Excelente

42 -0.96 Femenino 140.00 1.10 90 0.84 341 0.97 74 2.18 76.20 0.26 0 Excelente

42 -0.96 Femenino 138.00 0.98 80 -0.16 245 0.63 70 0.57 83.91 1.07 0 Bueno

49 1.28 Masculino 115.00 -0.40 82 0.04 302 0.83 69 0.17 70.36 -0.36 0 Excelente

47 0.64 Femenino 148.00 1.58 110 2.85 302 0.83 69 0.17 68.12 -0.60 1 Excelente

45 0.00 Masculino 120.00 -0.10 70 -1.16 386 1.13 66 -1.03 66.22 -0.80 0 Muy Malo

49 1.28 Femenino 110.00 -0.70 70 -1.16 312 0.87 71 0.97 77.11 0.35 1 Regular

41 -1.28 Femenino 132.00 0.62 90 0.84 302 0.83 69 0.17 73.03 -0.08 0 Malo

46 0.32 Masculino 112.00 -0.58 80 -0.16 394 1.15 69 0.17 75.75 0.21 0 Muy Malo

50 1.60 Masculino 114.00 -0.46 70 -1.16 358 1.03 69 0.17 89.81 1.69 0 Malo