ley de los nu´meros grandes - ucaramirez/clases/parte5.pdf · ley de los nu´meros grandes 2.1....

Post on 06-Feb-2018

216 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Capıtulo 2

Ley de los numeros grandes

2.1. La ley debil de los numeros grandes

Los juegos de azar, basan su sistema de ganancias, fundamentalmente en la estabilidad alargo plazo garantizada por las leyes de la probabilidad. Consideremos el juego de la ruletaamericana. Esta consiste en una rueda en posicion horizontal, por donde puede circular unapequena bola. La rueda esta subdividida en 38 zonas enumeradas, cada una de las cualessubtiende un angulo de la misma magnitud. Al estabilizarse el movimiento de la bola, estapermanece quieta en una de las zona. En un juego tıpico, el jugador paga 1 dolar por apostarla salida de uno de los 38 numeros. En caso de ganar, se le devuelve el dolar mas 35 dolaresadicionales. En caso de perder, pierde un dolar. Suponiendo que la probabilidad de salida delos numeros es uniforme, el valor esperado de la ganancia X del jugador serıa

E(X) = −1 ×37

38+ 35 ×

1

38= −0,05263

Podrıamos preguntarnos que importancia tiene este calculo. La ley de los numeros grandes,descubierta por Jacob Bernoulli en el siglo 18 nos da la respuesta.

Teorema 2.1. (Ley debil de los numeros grandes: version con momentos de orden 2).Consideremos una sucesion Xn : n ≥ 1 de variables aleatorias i.i.d. de cuadrado integrable.Luego, para todo ǫ > 0 se tiene

lımn→∞

P

(∣

∑nk=1 Xk

n− E(X)

≥ ǫ

)

= 0.

El adjetivo debil ha sido introducido para distinguir este resultado de la llamada ley fuertede los numeros grandes, que establece que en realidad la convergencia del promedio empıricoa la esperanza es casi segura. En terminos del juego de la ruleta americana, la ley de los numerosgrandes nos indica que el valor promedio de la ganancia de la casa de apuestas por jugador tiendea −E(X) = 0,05263, y por lo tanto es positivo. Es decir, aunque de vez en cuando apareceranjugadores afortunados que ganaran 35 dolares, la ley de los numeros grandes establece siempreexistira una cantidad suficientemente grande de apuestas a partir de las cuales el balance parala casa es favorable.

La demostracion de la ley debil de los numeros grandes es sencilla, y se basa en la siguienteobservacion.

Lema 2.2. Sean X1, . . . ,Xn variables aleatorias centradas no correlacionadas de a pares. Luego

29

30 CAPITULO 2. LEY DE LOS NUMEROS GRANDES

V ar(X1 + · · · + Xn) = V ar(X1) + · · · + V ar(Xn).

Demostracion. (Prueba de la ley debil de los numeros grandes). Sea ǫ > 0. Por ladesigualdad de Tchebytschev y el lema anterior

P (|X1 + · · · + Xn|/n > ǫ) ≤1

ǫ2

V ar(X1)

n.

Claramente el miembro izquierdo tiende a 0 cuando n tiende a ∞.

La ley debil de los numeros grandes sigue siendo valida si suponemos solo que la sucesionde variables aleatorias es integrable. Veremos este resultado como un caso particular de la leyfuerte de los numeros grandes. Por otra parte, una variacion del Lemma 2.2, demostrada porBengt von Bahr y Carl-Gustav Esseen, permite facilmente generalizar el Teorema 2.6.

Lema 2.3. (Desigualdad de von Bahr-Esseen). Sea Xn : n ≥ 1 una sucesion de variablesaleatorias independientes y centradas. Luego para todo 1 ≤ r ≤ 2 se tiene que

E

n∑

k=1

Xk

r

≤ 4n∑

k=1

E(|Xk|r). (2.1)

Observacion. Este resultado fue publicado en 1965 en The Annals of Statistics. El 4 queaparece en el lado derecho de (2.1) se puede mejorar por un 2.

El primer paso para probar la desigualdad de von Bahr-Esseen, es el siguiente resultado deClarkson de 1936, introducido para el estudio de espacios uniformemente convexos.

Lema 2.4. (Desigualdad de Clarkson). Si 1 ≤ r ≤ 2, entonces para todo par de reales x ey se tiene que

|x + y|r + |x − y|r ≤ 2(|x|r + |y|r).

Demostracion. La desigualdad es trivialmente cierta para y = 0 o para r = 1. Luego, comoambos miembros de la desigualdad son funciones pares, basta suponer que x ≥ y > 0 y r > 1.Definimos t = y/x. Luego tenemos que probar que

(1 + t)r + (1 − t)r ≤ 2(1 + tr).

Si f(r) = (1 + t)r + (1 − t)r y g(r) = 2(1 + tr), notemos que

g′(r) = 2tr ln t ≤ 0.

Ademas

f ′(r) = (1 + t)r ln(1 + t) + (1 − t)r ln(1 − t).

Como f(2) = g(2), es suficiente demostrar que f ′(r) ≥ 0. Ahora notemos que

f ′′(r) = (1 + t)r(ln(1 + t))2 + (1 − t)r(ln(1 − t))2 ≥ 0.

Luego, basta probar que f ′(1) ≥ 0. Pero

f ′(1) = (1 + t) ln(1 + t) + (1 − t) ln(1 − t) ≥ 0.

2.1. LA LEY DEBIL DE LOS NUMEROS GRANDES 31

En efecto, basta notar la segunda derivada de la funcion g(x) = x ln x, es positiva, y por lotanto es una funcion convexa. Luego f ′(r) ≥ 0.

Necesitamos un lema antes de probar la desigualdad de von Bahr-Esseen. En lo que sigue,dada una variable aleatoria X, designaremos por X ′ a una variable aleatoria independiente deX pero con la misma distribucion.

Lema 2.5. Sean X e Y variables aleatorias centradas e independientes. Supongamos que paraalgun r ≥ 1 se tiene que E|X|r < ∞ y E|Y |r < ∞. Luego

E|X|r ≤ E|X + Y |r.

Demostracion. Por la desigualdad de Jensen para esperanza condicional

E|X|r = E(|E(X + Y |X)|r) ≤ E(E(|X + Y |r|X)) = E|X + Y |r.

Demostracion. (Prueba de la desigualdad de von Bahr-Esseen). Si X e Y son variablesaleatorias arbitrarias, la desigualdad de Clarkson implica que

E|X + Y |r + E|X − Y |r ≤ 2(E|X|r + E|Y |r). (2.2)

Luego

E|X − X ′|r ≤ 4E|X|r. (2.3)

Supongamos ahora que la distribucion de Y condicionada a X es simetrica. Luego E|X +Y |r =E|X − Y |r, y de (2.2) tenemos que

E|X − Y |r ≤ E|X|r + E|Y |r. (2.4)

Demostraremos la desigualdad de von Bahr-Esseen ocupando un argumento de induccion. Cla-ramente la desigualdad se satisface para n = 1. Supongamos ahora que es cierta para n ≤ m.Luego

E|Sm+1|r = E|Sm + Xm+1|

r ≤ E|Sm + Xm+1 − X ′m+1|

r

≤ E|Sm|r + E|Xm+1 − X ′m+1|

r ≤ E|Sm|r + 4E|Xm+1|r,

donde en la primera desigualdad hemos ocupado el Lemma 2.5, en la segunda la desigualdad(2.4) y en la tercera la desigualdad (2.3). Por lo tanto es cierta para n = m + 1, lo que terminala demostracion.

Teorema 2.6. (Ley debil de los numeros grandes: version con momentos de ordenr > 1). Consideremos una sucesion Xn : n ≥ 1 de variables aleatorias i.i.d. con momentosde orden r finitos, y r > 1. Luego, para todo ǫ > 0 se tiene

lımn→∞

P

(∣

∑nk=1 Xk

n− E(X)

≥ ǫ

)

= 0.

32 CAPITULO 2. LEY DE LOS NUMEROS GRANDES

Proseguimos con una generalizaciones de la ley debil. La primera debilita la condicion deintegrabilidad.

Teorema 2.7. (Ley debil de los numeros grandes generalizada). Sea Xn : n ≥ 1una sucesion de variables aleatorias i.i.d. en un espacio de probabilidad (Ω,M, P ). Luego lassiguientes condiciones son equivalentes.

(i) Existe una sucesion an : n ≥ 1 tal que para todo ǫ > 0,

lımn→∞

P

(∣

∑nk=1 Xk

n− an

≥ ǫ

)

= 0.

(ii) lımn→∞ nP (|X| ≥ n) = 0.

Ademas, si (i) se satisface, necesariamente

an = E(X1|X|≤n).

Demostracion. Primero probamos que (ii) implica (i). Definimos X ′n = Xn1|Xn|≤n. Por la

desigualdad de Tchebychev, para cada ǫ > 0

P

(∣

∑nk=1 Xk

n− E(X ′

n)

≥ ǫ

)

≤1

ǫ2nE((X ′

n)2) + nP (|X1| ≥ n). (2.5)

Pero

E((X ′n)2) =

∫ n

−nx2dFX1

(x) = n2(FX1(n) − FX1

(−n)) − 2∫ n

−nxFX1

(x)dx

= −n2(FX1(−n) − FX1

(n)) + 2∫ n

0 x(FX1(−x) − FX1

(x))dx

= −n2(FX1(−n) + 1 − FX1

(n)) + 2∫ n

0 x(FX1(−x) + 1 − FX1

(x))dx

= −n2P (|X1| ≥ n) + 2∫ n

0 xP (|X1| ≥ x)dx. (2.6)

Esto prueba que el primer termino del lado derecho de la desigualdad (2.5) tiende a 0 cuandon tiende a ∞.

Corolario 2.8. Sea Xn : n ≥ 1 una sucesion de variables aleatorias i.i.d. simetricas en unespacio de probabilidad (Ω,M, P ). Luego las siguientes condiciones son equivalentes.

(i) Para todo ǫ > 0,

lımn→∞

P

(∣

∑nk=1 Xk

n

≥ ǫ

)

= 0.

(ii) lımn→∞ nP (|X| ≥ n) = 0.

Ejemplo. El teorema anterior muestra que la ley debil de los numeros grandes se puedesatisfacer aunque la distribucion comun de la sucesion no sea integrable. Por ejemplo, tomemosFX definida por

1 − FX(x) =1

x ln x.

2.1. LA LEY DEBIL DE LOS NUMEROS GRANDES 33

La siguiente generalizacion de la ley debil de los numeros grandes, muestra que incluso lahipotesis de independencia no es necesaria.

Definicion 2.9. (Arreglo triangular). Un arreglo triangular de variables aleatorias es unconjunto Xn,k de variables aleatorias indexadas por n ≥ 1 y 1 ≤ k ≤ n.

Teorema 2.10. Consideremos un arreglo triangular Xn,k de variables aleatorias integrablesen un espacio de probabilidad (Ω,M, P ). Luego, las siguientes condiciones son equivalentes.

(i) Para todo ǫ > 0,

lımn→∞

P

(∣

1

n

n∑

k=1

Xn,k −1

n

n∑

k=1

E(Xn,k)

> ǫ

)

= 0.

(ii)

lımn→∞

E

(

(∑n

k=1(Xn,k − E(Xn,k)))2

n2 + (∑n

k=1(Xn,k − E(Xn,k)))2

)

= 0.

Demostracion. Para probar que (ii) implica (i) basta ocupar la desigualdad de Tchebychevcon la funcion x2/(n2 + x2). Ahora notemos que si Y es una variable aleatoria arbitraria, setiene que para tod ǫ > 0,

P (|Y | ≥ ǫ) ≥

x2

1 + x2dFY (x) − ǫ2.

Eligiendo Y =(

Pnk=1

(Xn,k−E(Xn,k)))2

n2+(Pn

k=1(Xn,k−E(Xn,k)))

2 , vemos que esto implica que

E

(

Y 2

1 + Y 2

)

≤ ǫ2 + P (|Y | ≥ ǫ).

Como ǫ > 0 es arbitrario, esto muestra que (i) implica (ii).

Tenemos el siguiente corolario con una condicion mas explıcita.

Corolario 2.11. Sea Xn,k un arreglo triangular de variables aleatorias de cuadrado inte-grable en un espacio de probabilidad (Ω,M, P ). Supongamos que las siguientes condiciones sesatisfacen:

(i)∑n

k=1 V ar(Xn,k) = o(n2).

(ii) lımn→∞ supk,j:|k−j|≥n Cov(Xn,k,Xn,j) = 0,

Luego, para todo ǫ > 0 se tiene que

lımn→∞

P

(∣

1

n

n∑

k=1

Xn,k −1

n

n∑

k=1

E(Xn,k)

> ǫ

)

= 0.

Pero la condicion (ii) implica que los dos terminos del lado derecho convergen a 0 cuando ntiende a ∞.

34 CAPITULO 2. LEY DE LOS NUMEROS GRANDES

Demostracion. Por el Teorema 2.10, vemos que basta probar que

lımn→∞

1

n2E

(

n∑

k=1

(Xn,k − E(Xn,k))

)2

= 0.

La esperanza en esta expresion se puede escribir como

n∑

k=1

V ar(Xn,k) +∑

1≤k,j≤n

Cov(Xn,k,Xn,j).

Por la hipotesis (i), basta probar que

lımn→∞

1

n2

1≤k,j≤n

Cov(Xn,k,Xn,j) = 0.

Ahora, Cov(Xn,k,Xn,j) ≤√

V ar(Xn,k)V ar(Xn,j) ≤ V ar(Xn,k) + V ar(Xn,j). Luego, solo tene-mos que probar que para todo δ > 0 existe un m tal que

lım supn→∞

1

n2

1≤k,j≤n:|k−j|≥m

Cov(Xn,k,Xn,j) ≤ δ.

Pero esto es evidentemente cierto porque el termino del lado izquierdo de esta exresion es menoro igual a supk,j:|k−j|≥m Cov(Xn,k,Xn,j) que tiende a 0 por la condicion (ii).

Una aplicacion interesante de la ley de los numeros grandes para demostrar una version delteorema de aproximaciıon de Weierstrass.

Teorema 2.12. (Teorema de Bernstein). Consideremos una funcion continua f en el in-tervalo [0, 1]. Luego, los polinomios de Bernstein

Bn(x) =

n∑

k=0

f(k/n)(n

k

)

xk(1 − x)n−k,

aproximan uniformemente a f en [0, 1].

2.2. Una version elemental de la ley fuerte de los numeros gran-

des

La convergencia en probabilidad, en la ley debil de los numeros grandes, se puede facilmentetransformar en convergencia casi segura, si le exigimos mas a la sucesion de variables aleatoriasi.i.d.

Teorema 2.13. (Version elemental de la ley fuerte de los numeros grandes). Con-sideremos una sucesion Xn : n ≥ 1 de variables aleatorias i.i.d. con momentos de orden 4finitos. Luego

P

(

lımn→∞

∑nk=1 Xk

n= E(X1)

)

= 1.

top related