teorema de chebyshev
TRANSCRIPT
TEOREMA DE CHEBYSHEV.
Si una variable aleatoria tiene una varianza o desviación estándar pequeña, esperaríamos
que la mayoría de los valores se agrupan alrededor de la media. Por lo tanto, la
probabilidad de que una variable aleatoria tome un valor dentro de cierto intervalo
alrededor de la media es mayor que para una variable aleatoria similar con una desviación
estándar mayor si pensamos en la probabilidad en términos de una área, esperaríamos
una distribución continua con un valor grande de σ que indique una variabilidad mayor y,
por lo tanto, esperaríamos que el área este extendida. Sin embargo, una desviación
estándar pequeña debería tener la mayor parte de su área cercana a µ.
Podemos argumentar lo mismo para una distribución discreta. En el histograma de
probabilidad. El área se extiende mucho más que. Lo cual indica una distribución más
variable de mediciones o resultados el matemático ruso P. L. Chebyschev (1821–1894)
descubrió que la fracción de área entre cualesquiera dos valores simétricos alrededor de
la media está relacionada con la desviación estándar. Como el área bajo una curva de
distribución de probabilidad, o de un histograma de probabilidad, suma 1, el área entre
cualesquiera dos números es la probabilidad de que la variable aleatoria tome un valor
entre estos números.
El siguiente teorema, debido a Chebyshev da una estimación conservadora de la
probabilidad de que una variable aleatoria tome un valor dentro de κ desviaciones
estándar de su media para cualquier número real κ proporcionaremos la demostración
solo para el caso continuo y se deja el caso discreto como ejercicio.
1. Caso variable discreta.
La probabilidad de que cualquier variable aleatoria X, tome un valor dentro de la κ
desviaciones estándar de la media es al menos 1−1
k2. Es decir:
P (μ−kσ <X<μ+kσ )≥1− 1k2
De hecho, la desigualdad de Chebyshev se puede escribir también como:
P (|X−μ|<kσ )≥1− 1k2
O bien, utilizando el complemento:
P (|X−μ|<kσ )≤ 1k2
El teorema de Chebyshev tiene una valides para cualquier distribución de observaciones
y, por esta razón los resultados son generalmente débiles el valor que el teorema
proporciona es solo un límite inferior. Es decir, sabemos que la probabilidad de una
variable aleatoria que cae dentro de dos desviaciones estándar de la media no puede ser
menor que 3/4, pero nunca sabemos cuánto podría ser en realidad únicamente cuando se
conoce la distribución de probabilidad podemos determinar probabilidades exactas. Por
esta razón llámanos al teorema resultado de distribución libre cuando se supongan
distribuciones específicas. El uso del teorema de Chebyshev se restringe a situaciones
donde se desconoce la forma de la distribución.
Ejemplo 1.
1.- Una variable aleatoria X tiene una media µ = 12 una varianza σ2 = 9, y distribución de
probabilidad conocida. Utilizando el teorema de Chevyshev obtener:
a) P (4 < X < 18).
b) P (3 < X < 21).
Solución
a) P (4 < X < 18) = P[ 12 – (2) (3) < X < 12 + (2) (3) ] ≥ 3/4
b) P (3 < X < 21) = P[ 12 – (3) (3) < X < 12 + (3) (3) ] ≥ 8/9
Ejemplo 2.
Tener a mano un suministro adecuado de refacciones es función importante del almacén
de una gran empresa electrónica. Se estudió la demanda mensual de tarjetas para
impresoras de microcomputadoras durante algunos meses y se vio que el promedio o
media es 28 y la desviación estándar es 4. ¿Cuántas tarjetas de impresora deben tener a
la mano al principio de cada mes para asegurar que la demanda será mayor que la oferta
cuando mucho con una probabilidad de 0,10?
Solución
Sea X la variable aleatoria que representa la demanda.
Utilizando el teorema de Chebyshev con k=√10 se tiene:
P (X−μ≥kσ )≤ P (|X−μ|≥kσ )≤ 1k2= 1
(√10 )2=0,1
Es decir:
P (X−28≥√10(4))≤0,1
P (X ≥40,65 )≤0,1
Por lo que deben existir 41 tarjetas de impresora en el inventario.
El teorema de Chebyshev y la regla empírica proporcionan una interpretación de µ y
para las variables aleatorias continuas, como en el caso de las variables aleatorias
discretas. Aun si desconocemos las distribuciones exactas de las variables aleatorias de
interés, el conocimiento de las medias y las desviaciones estándar nos permite especificar
cotas significativas para las probabilidades de eventos que a menudo nos interesan.
2. Caso de variable continua.
En la sección anterior propusimos y utilizamos el teorema de Chebyshev. Ahora
replanteamos este teorema y proporcionamos una demostración aplicable al caso de una
variable aleatoria continua.
Si Y es una variable aleatoria con media finita µ y varianza 2, entonces, para cualquier
k>0,
P (|Y−μ|<kσ )≥1− 1
k2o P (|Y−μ|≥kσ )≤ 1
k2
Demostración
Demostraremos el teorema para una variable aleatoria continua. Para el caso de una
variable discreta se procede de manera similar. Si f ( y ) es la función de densidad de Y,
entonces
V (Y )=σ2=∫−∞
∞
( y−μ )2 f ( y )dy
V (Y )=σ2= ∫−∞
μ−kσ
( y−μ )2 f ( y )dy+ ∫μ−kσ
μ+ kσ
( y−μ )2 f ( y )dy+ ∫μ+ kσ
∞
( y−μ )2 f ( y )dy
La segunda integral siempre es mayor o igual a cero ( y−μ)2≥k2σ2 para todos los valores
de y entre los límites de integración de la primera y tercera integrales; es decir, las
regiones de integración se encuentran en las colas de la función de densidad y sólo
abarcan valores de y para los cuales ( y−μ)2≥k2σ2. Reemplace la segunda integral por
cero y sustituya k 2σ 2 por ( y−μ)2 en la primera y tercera integrales para obtener la
desigualdad
V (Y )=σ2≥ ∫−∞
μ−kσ
k2σ2 f ( y )dy+ ∫μ+ kσ
∞
k2σ2 f ( y )dy
Así
σ 2≥k2σ2[ ∫−∞
μ−kσ
f ( y )dy+ ∫μ+kσ
∞
f ( y )dy ]O
σ 2≥k2σ2 {P (Y ≤ μ−kσ )+P (Y ≤ μ+kσ ) }=k2σ2P (|Y−μ|≥kσ ) .
Dividiendo entre k 2σ 2 obtenemos:
P (|Y−μ|≥kσ )≤ 1k2
o, de forma equivalente,
P (|Y−μ|<kσ )≥1− 1
k2
El verdadero valor del teorema de Chebyshev radica en el hecho de que nos permite
determinar cotas para las probabilidades que, por lo común, hubiéramos tenido que
obtener mediante tediosos cálculos matemáticos (suma o integración). Además, a
menudo hace posible obtener medias y varianzas de variables aleatorias sin necesidad de
especificar la distribución de la variable. En situaciones de esta naturaleza el teorema de
Chebyshev todavía proporciona cotas importantes para las probabilidades de interés.
Ejemplo 3.
Supongamos que la experiencia demuestra que el tiempo Y (en minutos) necesario para
dar mantenimiento periódico a un dictáfono sigue una distribución gamma con α = 3.1 y β
= 2. A un nuevo técnico en mantenimiento le toma 22,5 minutos revisar la máquina. ¿Este
tiempo utilizado en el mantenimiento al dictáfono concuerda con el periodo anterior?
Solución: La media y la varíanza de los tiempos de mantenimiento (con base en la
experiencia anterior) son, de acuerdo con el teorema:
µ = αβ = (3,1)(2) = 6,2 y 2 = αβ2 = (3,1)(22) = 12,4
Se deduce que σ 2=√12,4=3,52 .Advierta que y = 22.5 minutos supera a la media µ=6,2
minutos por 16,3 minutos, o k = 16.3/3.52 = 4,63 desviaciones estándar. Así, según el
teorema de Chebyshev,
P (|Y−6,2|≥16,3 )=P (|Y−μ|≥4,63 σ )≤ 1
4,632=0,0466
Esta probabilidad se basa en el supuesto de que la distribución de los tiempos de
mantenimiento no ha cambiado con el tiempo. Por lo tanto, si observamos que P(Y ≥ 22,5)
es pequeña, debemos concluir que nuestro nuevo técnico en mantenimiento generó por
azar un periodo de mantenimiento prolongado, que tiene baja probabilidad de ocurrir, o
que es más lento que los anteriores. Si tomamos en cuenta la baja probabilidad de
P(Y≥22.5), optamos por la última posibilidad.
La probabilidad exacta, P(Y≥22.5), del ejemplo requeriría la evaluación de la integral
P (Y ≥22,5 )=∫22,5
∞y2,1e− y /2
23,3 Γ (3,1)dy
Aunque podríamos utilizar las tablas de Pearson (1965) para evaluarla, no podemos
hacerlo directamente. Las integrales similares para la función de densidad beta y otras
funciones de densidad son difíciles de evaluar. El teorema de Chebyshev a menudo
proporciona de inmediato cotas para las probabilidades, evitándonos cálculos de
integración laboriosos o la búsqueda de tablas adecuadas.