distribución normal suma de variables aleatorias · si s es la suma de un gran número de...

31
Distribución Normal Suma de variables aleatorias 1ºC 2019 Clase Nº 9 Mg. Stella Figueroa

Upload: others

Post on 26-Jan-2020

18 views

Category:

Documents


0 download

TRANSCRIPT

Distribución NormalSuma de variables aleatorias 1ºC 2019

Clase Nº 9Mg. Stella Figueroa

Fue descubierta y publicada por primera

vez en 1733

por Abraham de Moivre (1667-1754)

Karl F. Gauss (1777-1855)

Distribución normalo gaussiana o de Laplace- Gauss

Pierre Simon Laplace

(1745-1827)

Caracteres fisiológicos

ej: efecto de una misma dosis de un fármaco.

Caracteres morfológicos de individuos

(personas, animales, plantas,...)

de una especie (tallas, pesos, diámetros, perímetros,...).

Caracteres sociológicos

ej: consumo de cierto producto por un mismo grupo de

individuos, puntuaciones de examen

Errores cometidos al medir ciertas magnitudes.

Y en general cualquier característica que se obtenga

como suma de muchos factores.

Distribución binomial a la Normal:

con np ≥ 5 y n(1-p) ≥ 5.

Distribución de Poisson a la Normal: λ ≥ 10

Razones principales para su estudio

Numerosos

fenómenos

se

aproximan

con esta

distribución

Aproxima

distribuciones

de variables

discretas

Proporciona

la base de la

inferencia

estadística

por su

relación con

el TLC

Distribución Normal

Se dice que x que toma todos los valores reales, tiene una distribución normal, si su fdp está dada por:

21

21f(x) con - < x <

2

0

x

e

y

Notación

21

21f(x) con - < x <

2

0

x

e

y

Ejercicio: verificar que es una fdp legítima.

2

21 1

2 21 1

2 2

xt

e dx e dt

21

2

nosepuedeobtenerde forma finita Integral de Poisson

1 12 1

2 2

t

e dt

x~ N (µ, σ) <=> su fdp está dada por

Principales características de la

distribución Normal

• Es una curva uniforme con ordenadas siempre positivas,

definida para todo real x.

•Tiene forma de campana, es decir, es monótona creciente

hacia ambos lados del máximo, y es asintótica al eje de las

abscisas

•Es simétrica con respecto de la recta x= donde coinciden

la mediana (Me) y la moda (Mo ).

Para x tendiendo a , el límite f(x) =0.

•La función tiene un máximo en x = . Los puntos de inflexión

tienen como abscisas los valores . Verificar estas

propiedades.

Características numéricas

Demostrar que:

2( ) ( )E x y V x

La esperanza se puede interpretar como un factor de

traslación.

Interpretación geométrica

La desviación

estándar

es un

factor

de escala

0

0.4

0.8

1.2

-2.50 -1.50 -0.50 0.50 1.50 2.50x

0.25

0.5

1

f(x)

Teorema

)a;N(a~zbaxzy ),( N~Si 222 bx

1)N(0;~zzy ),( N~Si 2

xx

Demostrar el Teorema y el Corolario

Corolario

Si Z tiene una distribución normal con Esperanza cero y

varianza 1, se dice que Z tiene una distribución normal

estandarizada.

La forma estandarizada de cualquier distribución

normal se puede obtener aplicando el corolario de este

teorema

Aplicación del Teorema

1)N(0;~zzy ),( N~Si 2

xx

P Pa x b

a x b

Fórmula de transformación

abbz

aP

2

02

0 0

1

2

tz

P Z z z e dt

Ejemplos

N(100;16)~x

Verificar que:

a) P(90 < x < 105) = 0,8882

b) P(x<104) = 0,8413

c) P( x>95) = 0,8944

d) Si P(x<a) = 0,42 entonces a = 99,2

Cálculo de la probabilidad de desviación prefijada. Regla de las 3 sigmas.

2. 1

Si dos variables aleatorias

están normalmente

distribuidas con igual

esperanza, entonces la

probabilidad de tomar

un valor en el intervalo

es mayor para la

variable de menor

varianza.

,

xPxPx 2,N~

1

xP

9973,0132

Esto significa que es

prácticamente cierto el

suceso 3x 33 xPSi

Esencia de la regla de las tres sigmas

Si una variable aleatoria está distribuida normalmente, entonces

la desviación respecto de la esperanza matemática, en valor absoluto, es menor que el triple de la

dispersión.

En la práctica esto significa que si la distribución de una variable no se conoce, pero se cumple la

condición

3x

Se puede suponer que dicha variable está

distribuida normalmente.

Si S es la suma de un gran número de variables aleatorias x1

x2,…,xn independientes, entonces bajo ciertas

restricciones leves, referidas al aporte de los sumandos ,

la función de densidad de probabilidad de la variable

aleatoria S se distribuye normalmente.

El valor de este teorema es que no requiere

condiciones para las distribuciones de las variables

aleatorias individuales que se suman.

Teorema Central del Límite

1

2

1

~ 0,1

n

i

i

n

i

i

S

z N1

n

i

i

S x

2

1 1 1

2

1 1 1

( )

( )

i i i i

n n n

i i i

i i i

n n n

i i i

i i i

E x V x

E S E x E x

V S V x V x

Por ser las xi independientes

TCL

Es decir, si

Si las xi NO están

idénticamente distribuidas:

(No son I.I.D)

Si las xi están idénticamente

distribuidas (I.I.D):

1 1

( ) .

i

n n

i i

i i

E x

E S E x E x n

2

2

1 1

( ) .

i

n n

i i

i i

V x

V S V x V x n

Por ser las xi independientes

~ 0,1

.

S nz N

n

Con xi

I.I.D

Con xi

NO

I.I.D

Supóngase que un proceso de fabricación produce lavadoras de

las cuales, alrededor del 5% son defectuosas. Si se inspeccionan

100 lavadoras ¿Cuál es la probabilidad de que haya entre 2 y 6

lavadoras defectuosas?

0,4977

2 6 3 ( 4) ( 5)P x P x P x P x

3 97 4 96 5 95100 100 100

0,05 .0,95 0,05 .0,95 0,05 .0,953 4 5

Comparemos el resultado del cálculo directo con el

cálculo aproximado, es decir, aplicando el TCL:

Problema

0,4659

1 1

2 2Si a x b a x b

5,5 5 2,5 52,5 5,5

4,75 4,75

0,23 1,15 0,591 0,1251

P x

Aplicamos el TCL con la corrección por continuidad para variables discretas

1) Calculamos E(x)=np=100.0,05=5

2) V(x)= np(1-p)=100.0,05.0,95= 4,75

3) “Trabajamos con el igual”, es decir, si 2<x<6, 3 ≤x≤ 5

El resultado

exacto es 0,4977

Una fábrica de productos alimenticios produce carne enlatada,

con un peso medio de 250 grs y una varianza de 900 grs

cuadrados por lata. Si los pesos de las latas son

estadísticamente independientes. Las cajas contienen 60

latas. Se elige una al azar, hallar la probabilidad de que:

a) El peso de la caja sea a lo sumo 14,5 kg.

b) El peso de la caja sea al menos 15,3 kg.

Problema

: es el peso de cada lata S: es el peso de la cajaix

2( ) 250 . ( ) 30i iE x grs V x grs

60 60 60

1 1 1

( ) 60.250 15.000 15 .i i i

i i i

S x E S E x E x grs kg

60 60

2

1 1

( ) 60.900 54.000

( ) 60.900 60.30 232,38 0,23238

i i

i i

V S V x V x grs

S grs kg

Solución

14,5 15) 14,5 2,15 0,0158

0,23238a P S

15,3 15) 15,3 1 1 1,29

0,23238

1 0,9015 0,0985

b P S

a) El peso de la caja sea a lo sumo 14,5 kg.

b) El peso de la caja sea al menos 15,3 kg.

Calculamos las probabilidades

pedidas

• El n que se requiere para aplicar el teorema central del límite en gran parte depende de la forma de la distribución de las variables

aleatorias individuales que se suman

•Si los sumandos están normalmente distribuidos , al aplicar el

teorema central del límite, las probabilidades obtenidas son

exactas. No importa n.

•Si no se conoce la distribución de los sumandos, para n mayor o

igual que 25, se obtienen buenas aproximaciones.

•Si las variables aleatorias se distribuyen binomialmente, n >10

si

p 0,5

tambien si p 0 ó 1 n debe ser bastante mayor.

Consideraciones finales

2

2

1; 1-

11-

P x k k ók

P x kk

La probabilidad de que una variable aleatoria

X asuma un valor que está dentro de las k

dispersiones de su esperanza, es por lo menos2

11 0k

k

2

1la P x k

k

O también

por ser sucesos contrarios

Con esperanza y

varianza finitas

Desigualdad de Tchebyshev

2) El significado de esta desigualdad reside en su completa

universalidad, ya que puede ser aplicada a cualquier variable

aleatoria

3) Si conocemos la distribución de probabilidades de una variable

aleatoria discreta o continua, podemos calcular, si existen,

E(x) y V(x).

11

01

122

ky

k1)1 kSi

La recíproca no es cierta, pero podemos dar una cota superior o

inferior de dicha probabilidad

Consideraciones

Ley de los grandes números

Teorema de Bernoulli

Cuando el número de repeticiones de un experimento aleatorio

aumenta, la fA converge en sentido probabilístico a la probabilidad

teórica P(A)( ) para Af P A n

En una sucesión de pruebas de Bernoulli

dado un número positivo arbitrario,

1 0lim An

P f p

0 0lím An

P f p

En toda

sucesión de

pruebas de

Bernoulli, la

frecuencia

relativa

converge en

sentido

probabilístico

a p.

Dado un experimento y un suceso A asociado a dicho experimento,

consideramos n repeticiones independientes del experimento, x

es el número de veces que ocurre A en las n repeticiones, además P(A) = P

en cada repetición.

X es una variable aleatoria binomial

A

xf

n 1E x np y V x np p

1 1

.A

xE f E E x n p p

n n n

2 2

11 1. 1A

p pxV f V V x n p p

n n n n

Demostración

0

2

11AP f p k

k

Como

2

11

1

AP f pn

p p

2 2

1 1p p p pk k

n n

2

11A

p pP f p

n

2

1 11A

p pP f p k

n k

2

11 1A

n n

p pP f p

nlím lím

1An

P f plím

Aplicamos la desigualdad de

Tchebyshev

Dada una muestra aleatoria, es decir: una sucesión de v.a. x1, x2, x3, x4,…..xn

0

El límite, en probabilidad, de la media muestral para n

es igual a la media de la población de la que se extrajo la

muestra

1 0n n

P x ó P xlím lím

Teorema de Bernoulli generalizado

1 2 3, , ,..... nx x x x

Son variables aleatorias independientes,

con2( ) ( )i iE x y V x

1

ni

i

xx

n

Es una función de

1 2 3, , ,..... nx x x x

Por lo tanto, la media muestral es otra variable aleatoria

1 1

1 1. .

n ni

i

i i

xE x E E x n

n n n

2

2

2 21 1

1 1. .

n ni

i

i i

xV x V V x n

n n n n

1 2 3, , ,..... nx x x x

Demostración

Consideramos 22

2.

nk k

n

2

1. 1-P x k

kn

2

2

1. 1-P x k

nn

2

2. 1-P x k

nn

2

2< ó P x

n

Aplicamos la desigualdad de Tchebyshev

El teorema se puede generalizar a variables

aleatorias con su esperanza y varianza

respectivas.

2

2n n

P 1xlím límn

n

P 1xlím

n

0 P 0ó xlím

Aplicamos Límite en Probabilidad