libro estadistica para su apoyo en el semestre

Upload: diana-margarita-venta-gonsalez

Post on 14-Apr-2018

226 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    1/125

    Area de Ciencias Basicas

    ESPECIALIZACION ENESTADISTICA APLICADA

    Universidad del Norte

    Gua resumida sobre

    Metodos EstadsticosTeora y practica

    Dr. rer. nat Humberto LLinas SolanoProfesor de la Universidad del Norte

    Barranquilla - Colombia

    2005

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    2/125

    Contenido

    1 Estadstica descriptiva 41.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2 Medidas estadsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.3 Analisis exploratorio de datos . . . . . . . . . . . . . . . . . . . . . . . 9 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

    2 Probabilidad 202.1 Experimentos, espacios muestrales y eventos . . . . . . . . . . . . . . . 202.2 Tecnicas de conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.3 Introduccion a la probabil idad . . . . . . . . . . . . . . . . . . . . . . . 222.4 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    3 Distribuciones de probabilidad 313.1 Variables aleatorias discretas . . . . . . . . . . . . . . . . . . . . . . . 313.2 Variables aleatorias continuas . . . . . . . . . . . . . . . . . . . . . . . 32 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    4 Distribuciones especiales 364.1 La distribucion uniforme (discreta) . . . . . . . . . . . . . . . . . . . . 364.2 La distribucion binomial . . . . . . . . . . . . . . . . . . . . . . . . . . 364.3 La distribucion de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 374.4 La distribucion hipergeometrica . . . . . . . . . . . . . . . . . . . . . . 394.5 Las distribuciones binomial negativa y geometrica . . . . . . . . . . . . 414.6 La distribucion uniforme (continua) . . . . . . . . . . . . . . . . . . . . 424.7 La distribucion normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 424.8 Las distribuciones gamma y exponencial . . . . . . . . . . . . . . . . . 454.9 Resumen de las distribuciones especiales . . . . . . . . . . . . . . . . . 48

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    3/125

    CONTENIDO 2

    Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

    5 Distribuciones conjuntas 54

    5.1 Vectores aleatorios discretos . . . . . . . . . . . . . . . . . . . . . . . . 545.2 Vectores aleatorios continuos . . . . . . . . . . . . . . . . . . . . . . . 56 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

    6 Distribuciones muestrales 616.1 Conceptos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616.2 Distribuciones muestrales de algunos estadsticos . . . . . . . . . . . . 626.3 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

    7 Intervalos de confianza 71

    7.1 Estimacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 717.2 Intervalos de confianza . . . . . . . . . . . . . . . . . . . . . . . . . . 727.3 Intervalos de confianza para algunos parametros . . . . . . . . . . . . . 727.4 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 747.5 Determinacion del tamano de una muestra . . . . . . . . . . . . . . . . 77 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

    8 Pruebas de hipotesis 848.1 Conceptos de la prueba de hipotesis . . . . . . . . . . . . . . . . . . . 848.2 Pruebas para algunos parametros poblacionales . . . . . . . . . . . . . 868.3 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

    Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

    A Gua rapida para trabajar con Statgraphics 97A.1 Analisis de un solo conjunto de datos . . . . . . . . . . . . . . . . . . . 97A.2 Analisis simultaneo de dos o mas conjuntos de datos . . . . . . . . . . 97A.3 Graficos de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . 98A.4 Diagramas de presentacion . . . . . . . . . . . . . . . . . . . . . . . . 98A.5 Variables numericas multidimensionales . . . . . . . . . . . . . . . . . . 99A.6 Distribuciones de probabilidad . . . . . . . . . . . . . . . . . . . . . . 99A.7 Inferencias basadas en una sola muestra . . . . . . . . . . . . . . . . . 99A.8 Inferencias basadas en dos muestras . . . . . . . . . . . . . . . . . . . 100A.9 Bondad de ajuste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

    B Gua rapida para trabajar con SPSS 101B.1 Definicion de las variables . . . . . . . . . . . . . . . . . . . . . . . . . 101

    B.1.1 Transformacion de una variable . . . . . . . . . . . . . . . . . . 102B.1.2 Recodificacion de una Variable . . . . . . . . . . . . . . . . . . 103B.1.3 Filtrado de datos . . . . . . . . . . . . . . . . . . . . . . . . . 103

    B.2 Analisis exploratorio de datos . . . . . . . . . . . . . . . . . . . . . . . 104B.3 Inferencia sobre una o mas poblaciones . . . . . . . . . . . . . . . . . . 105

    C Uso de la calculadora en la estadstica 106

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    4/125

    Contenido 3

    D Apendice de tablas 108D.1 La funcion de distribucion binomial . . . . . . . . . . . . . . . . . . . . 108D.2 La funcion de distribucion de Poisson . . . . . . . . . . . . . . . . . . . 110D.3 La funcion de distribucion normal . . . . . . . . . . . . . . . . . . . . . 112D.4 La funcion gamma incompleta . . . . . . . . . . . . . . . . . . . . . . 114D.5 Valores crticos para la distribucion t de Student . . . . . . . . . . . . . 115D.6 Valores crticos para la distribucion chi-cuadrada . . . . . . . . . . . . . 116D.7 Valores crticos para la distribucion F . . . . . . . . . . . . . . . . . . . 118D.8 Algunos numeros aleatorios uniformemente distribuidos . . . . . . . . . 122

    Bibliografa & Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    5/125

    CAPITULO 1

    Estadstica descriptiva

    1.1 Introduccion

    1. Por que usted necesita conocer estadstica?Tres razones fundamentales:

    (a) Presentar y describir la informacion en forma adecuada.

    (b) Inferir conclusiones sobre poblaciones grandes basandose solamente en lainformacion obtenida de subconjuntos de ellas.

    (c) Utilizar modelos para obtener pronosticos confiables.

    2. TerminosPoblacion, muestra, datos, parametro, estadstico, Censo.

    3. Metodos estadsticos.Metdos estadsticos = estadstica descriptiva + estadstica inferencial.

    4. Organizacion de datos.Por el tipo de dato, de acuerdo a escalas de medidas, mediante tablas y medianterepresentaciones graficas.

    5. Organizacion de datos de acuerdo al tipo.Existen dos tipos de datos: categoricos (o cualitativos) y numericos (cuantita-tivos). Estos ultimos se clasifican a su vez en discretos y continuos.

    6. Organizacion de datos de acuerdo a escalas de medidas.Nominal, ordinal, de intervalo y de razon. Ver LLinas [11] o Weimer [23] paramayores detalles.

    7. Organizacion de datos mediante tablas.Se necesita concepto: Frecuencias absoluta, relativa, acumulada y acumuladarelativa. Dos tipos de tablas:

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    6/125

    1.1 Introduccion 5

    (a) Tablas de frecuencias agrupadas.Tablas con datos + frecuencias.

    Ejemplo 1.1.1 La tabla de frecuencias (no agrupada) para el conjunto de datos3 5 7 6 4 3 7 6 6 7 5 7 es

    Dato 3 4 5 6 7 Frecuencia 2 1 2 3 4

    (b) Tablas de frecuencias no agrupadas.Intervalos de clase, lmites de clase, fronteras de clase, Marcas de clase, ampli-tud w. Para hallar numero de clases c: Regla de Sturges (c = (3, 3) log n + 1)o c =

    n.

    Ejemplo 1.1.2 (Datos con un solo lugar decimal) Forme una distribucionde frecuencias considerando los siguientes datos:

    8,9 10,2 11,5 7,8 10,0 12,2 13,5 14,1 10,0 12,2 6,8 9,5 11,5 11,2 14,9 7,5 10,0 6,0 15,8 11,5

    SOLUCION:

    Paso 1. El rangoR es 9,8.

    Paso 2. Por regla de Sturges, c = 5 (aproximar al entero mas cercano).

    Paso 3. w = Rc

    = 2 (aproximar al entero siguiente).

    Paso 4. Como la unidad de medida es 0,1 (por tener los datos un solo lugar decimal)y como el punto medio de cada unidad de medida es 0,05, entonces,

    Frontera inf. de primera clase = dato menor 0,05 = 5, 95.

    En consecuencia, la tabla es

    Clase Cuenta Frecuencia Marcas de clase X

    5,95 - 7,95 |||| 4 6,957,95 - 9,95 || 2 8,95

    9,95 - 11,95 ||||| ||| 8 10,9511,95 - 13,95 ||| 3 12,9513,95 - 15,95 ||| 3 14,95

    8. Organizacion de datos mediante representaciones graficas.Hay graficas de varios tipos, entre los cuales se encuentran los siguientes: eldiagrama circular o de pastel, el pictograma, el diagrama de barras, el diagrama decaja y bigote, el histograma, el polgono (de frecuencia o de frecuencias relativas),la ojiva (o polgono de frecuencias acumuladas o polgono de frecuencias relativasacumuladas) y el diagrama de tallo y hojas.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    7/125

    1.2 Medidas estadsticas 6

    9. Histograma

    Fronteras

    Frec.

    rel.(en%)

    5 ,95 7, 95 9, 95 11, 95 1 3, 95 15 ,950

    10

    20

    30

    40

    Fronteras

    Frec.

    rel.(en%)

    (a) Histograma de frecuencias relativas

    Fronteras

    Frec.

    acum.

    5, 95 7, 95 9, 95 11, 95 13 ,95 15 ,950

    4

    8

    12

    16

    20

    Fronteras

    Frec.acum.

    (b) Histograma de frecuencias acumu-ladas

    10. Polgono y ojiva.

    Marcas de clase

    Frecuencias

    4,95 6,95 8,95 10,95 12,95 14,95 16,950

    2

    4

    6

    8

    Marcasdeclase

    Frecuencias

    (c) Polgono de frecuencias

    Fronteras superiores

    Frec.

    acum.

    5, 95 7, 95 9, 95 11, 95 13 ,95 15 ,950

    4

    8

    12

    16

    20

    Fronterassuperiores

    Frec.

    acum.

    (d) Ojiva

    1.2 Medidas estadsticas

    1. Medidas de tendencia central o de centralizacion.La media aritmetica (ponderada), la mediana, la moda, el rango medio (promedio

    de los datos mayor y menor), la media geometrica, la media armonica y la mediacuadratica. En LLinas [11] se hace una descripcion completa de estas medidas.

    2. Medidas de colocacion o de posicion relativa.La mediana, los percentiles, deciles y . En LLinas [11] se hace una descripcioncompleta de estas medidas.

    3. Medidas de dispersion o de variabilidad.El rango (diferencia entre datos mayor y menor), el rango intercuartil (diferenciaentre el tercer y el primer cuartil), la varianza, la desviaci on estandar y el coeficientede variancion de Pearson (desviacion estandar dividida entre la media, multiplicadapor 100 por ciento). En LLinas [11] se explican con detalles todas estas medidas.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    8/125

    1.2 Medidas estadsticas 7

    4. Aplicaciones de la desviacion estandar poblacional.Se utilizan dos reglas:

    (a) Regla de Tchebychev (valida para cualquier poblacion).Por lo menos el 100(1 1/k2)% de los valores de la poblacion se encuentranen el intervalo [ k; + k].

    k 1,5 2 2,5 3 3,5 4

    100(1 1/k2)% 55,6% 75% 84% 88,9% 91,18% 93,7%

    (b) Regla emprica (valida solo para poblaciones de forma acampanada).El 68% de los datos de la poblacion se encuentran en [ ; + ] y el95% de los datos en [ 2; + 2].

    Ejemplo 1.2.1 Un inspector de control de calidad selecciona aleatoriamente 14 clavos

    de una caja de 100 clavos de 1 pulgada (una pulg.=2,54 cm). Las longitudes, en cm,son

    2, 54 2, 55 2, 50 2, 60 2, 51 2, 52 2, 70 2, 40 2, 36 2, 53 2, 54 2, 52 2, 51 2, 55.

    Si el inspector decide excluir los clavos que est an fuera del intervalo x 2s, entonces,a lo mas el 25% estaran fuera del intervalo. Se verifica la regla de Tchebychev?

    5. Coeficiente de variacion de Pearson.

    CV =

    desviacion estandar de los datos

    media aritmetica de los datos

    100%.

    Ejemplo 1.2.2 Los siguientes datos representan el promedio de millas por galondiario por cinco das para un determinado auto: 20, 25, 30, 15, 35. Por consiguiente,el tamano relativo de la dispersion media alrededor de la media con relacion a lamedia es 31,6%.

    Ejemplo 1.2.3 El gerente de operaciones de un servicio de paquetera desea adquiriruna nueva flota de autos. Cuando los paquetes se guardan con eficiencia en el inte-rior de los autos (durante la preparacion de las entregas), se deben considerar dosrestricciones principales: el peso (en libras) y el volumen (en pies cubicos) de cadapaquete. Ahora, en una muestra de 200 paquetes, el peso promedio es 26 libras conuna desviacion estandar de 3,9 libras. Ademas, el volumen promedio de cada paquetees 8,8 pies cubicos con una desviacion estandar de 2,2 pies cubicos. Por consiguiente,

    con relacion a la media, el volumen de un paquete es mucho mas variable que su peso.Por que?

    Ejemplo 1.2.4 Un inversionista potencial piensa adquirir acciones en una de doscompanas A o B, listadas en la Bolsa de Valores de Nueva York. Si ninguna de lascompanas ofrece dividendos a sus clientes y ambas tienen igual clasificacion (segunvarios servicios de inversion) en terminos de crecimiento potencial, el posible inver-sionista quizas considere la volatilidad (variabilidad) de ambas acciones para ayudaren la decision de inversion. En los ultimos meses, el precio promedio de las acciones enla compana A fue de 50 dolares con una desviacion estandar de 10 dolares. Ademas,durante el mismo periodo, el precio promedio de las acciones en la compana B fuede 12 dolares con una desviacion estandar de 4 dolares. Entonces, en relacion con lamedia, el precio de las acciones B es mucho m as variable que el de las acciones A.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    9/125

    1.2 Medidas estadsticas 8

    6. Medidas de formas.Coeficiente de sesgo y medida de curtosis.

    7. Simetra y asimetra.Una distribucion de frecuencias sera simetrica o asimetrica segun lo sea su repre-sentacion grafica.1

    Si una distribucon no es simetrica, se dice que es asimetrica a la derecha (positi-vamente) o a la izquierda (negativamente).2

    En la figura 1.1 se ilustra el caso en que la distribucion de frecuencias tiene unasola moda.

    (e) Distribucion simetrica (f) Distribucion asimetrica a la derecha

    (g) Distribucion asimetrica a la izquierda

    Fig. 1.1: Comparacion de tres distribuciones unimodales cuya forma difiere.

    8. Coeficiente de sesgo Ap.Se define como:

    Ap =Media aritmetica Moda

    Desviacion estandar.

    Cuando Ap = 0, se dice que la distibucion es simetrica; cuando Ap < 0, sedice que la distribucion es sesgada negativamente o a la izquierda y

    1En cualquier distribucion simetrica, la media coincide con la mediana.2En las medidas asimetricas unimodales la mediana esta entre la media y la moda.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    10/125

    1.3 Analisis exploratorio de datos 9

    cuando Ap > 0, se dice que la distribucion es sesgada positivamente o a laderecha.

    9. Relacion emprica entre media, mediana y moda.Para distribuciones campanoides, unimodales y moderadamente asimetricas secumple aproximadamente la relacion emprica

    Media Moda 3(Media aritmetica Mediana),

    Con lo anterior, el coeficiente de asimetra de Pearson la podemos calcular tambiena traves de la formula

    Ap =3(Media aritmetica Mediana)

    Desviacion estandar.

    10. Medidas de curtosis o apuntamiento.Se aplican a distribuciones campaniformes, es decir, unimodales simetricas o conligera asimetra.

    1.3 Analisis exploratorio de datos

    Muchos autores presentan el diagrama de tallo y hoja como tecnica del analisis ex-ploratorio de datos. Consiste en desarrollar un resumen de cinco numeros y construir undiagrama de caja y bigotes.

    1. Resumen de cinco numeros.Consiste en cinco cantidades que se emplean para resumir los datos: valor mnimo,primer cuartil (Q1), Mediana (Q2), tercer cuartil (Q3) y valor maximo.

    2. Situaciones para reconocer la simetra de los datos.Si la distribucion es simetrica:

    La distancia de Q1 a la mediana es igual a la distancia de la mediana a Q3. La distancia del valor mnimo a Q1 es igual a la distancia de Q3 al valor

    maximo.

    La mediana y el rango medio son iguales. (Estas medidas son iguales a lamedia de los datos.)

    3. Situaciones para reconocer la no simetra de los datos.Si la distribucion no es simetrica:

    En las distribuciones sesgadas a la derecha, la distancia de Q3 al valor maximoexcede la distancia del valor mnimo a Q1. Ademas, la mediana es menorque el rango medio.

    En las distribuciones sesgadas a la izquierda, la distancia del valor mnimo aQ1 excede la distancia de Q3 al valor maximo. Ademas, el rango medio esmenor que la mediana.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    11/125

    1.3 Analisis exploratorio de datos 10

    Diagrama de caja y bigotes

    Salarios mensuales2200 2400 2600 2800 3000

    Valoratpico(moderado)

    Valoresatpicos(extremos)

    1,5R.I1,5R.I

    Mediana

    Media

    +

    2,2002,4002,6002,8003,000

    ++

    PrimerTercercuartilcuartil

    3R.I

    Fig. 1.2: Diagrama de caja y bigotes

    4. Diagrama de caja y bigotes.(R.I. significa el rango intercuartil, los segmentos horzontales son los llamadosbigotes y los valores que estan por fuera de los bigotes se llaman valores atpicos).

    5. Diagramas de cajas multiples (o comparativos).La figura 1.3 contiene los diagramas de caja de las calificaciones en un examende matematicas para quince estudiantes de primer curso de primaria, quince de

    segundo y quince de tercero.

    Calificaciones

    Primero

    Segundo

    Tercero

    40 50 60 70 80 90 100Calificaciones

    Fig. 1.3: Diagrama de caja y bigotes de las calificaciones en un examen

    En el diagrama puede apreciarse que no hay valores atpicos en ninguno de los tresgrupos. Los estudiantes del tercer curso consiguieron la mejor mediana, pero suscalificaciones tienen una variabilidad considerablemente mayor que la de los otrosgrupos. Otro hecho que llama la atencion es la gran cantidad de calificaciones

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    12/125

    Cap. 1. Ejercicios 11

    bajas obtenidas por los estudiantes de primer curso. Finalmente, podemos afirmarque las distribuciones de frecuencias de los tres conjuntos de datos estan sesgadasa la izquierda.

    Ejercicios

    1. Diga si la afirmacion dada es verdadera o falsa. Justifique siempre su respuesta. En casoque sea falso, de un contraejemplo.

    (a) Si la desviacion estandar de un conjunto de datos es 0, entonces, los datos son iguales.

    (b) No existen datos de tal forma que sean iguales el rango y la varianza.

    (c) Existen datos con desviacion estandar negativa.

    (d) En una distribucion simetrica, la media, la mediana y la moda son iguales.

    (e) La desviacion estandar esta dada por las mismas unidades que la media.(f) Toda informacion numerica proporciona datos cuantitativos.

    (g) Toda informacion no numerica ofrece datos cuantitativos.

    (h) Cuando todos los datos son categoricos, la moda es la unica medida de tendenciacentral que se puede utilizar.

    (i) Si el primer cuartil en el primer examen de estadstica fue de 3,0, entonces, este valorindica que el 25% de los estudiantes ganaron el examen.

    2. Clasifique los datos siguientes en cuantitativos (numericos) y cualitativos (categoricos).En caso de ser numerico, como discretos o continuos:

    (a) Estaturas en centmetros de cuatro jugadores de futbol.

    (b) Las temperaturas promedios diarias en el ultimo mes.

    (c) Clasificacion etnica de 30 empleados.

    (d) Numeros telefonicos de ciertas personas.

    (e) Distancia (en metros) recorrido por un atleta en una temporada.

    (f) Peso perdido (en kilogramos) por 10 personas debido a una dieta.

    (g) Fecha de cumpleanos de determinadas personas.

    (h) Calificaciones (E, S, A, D, I) de unos estudiantes de bachillerato.

    3. Se clasifico a los estudiantes de un programa universitario de acuerdo a con el semestreque cursa y su preferencia deportiva. Los resultados estan registrados en la siguiente tabla.

    Primero Segundo Tercero CuartoFutbol 15 14 5 9Beisbol 12 22 6 6Voleivol 5 5 9 5Basquetbol 26 7 6 7Natacion 7 8 4 2

    (a) Que porcentaje de los estudiantes de primer semestre prefieren el futbol?

    (b) Que porcentaje de los aficionados a la natacion son de segundo semestre?

    (c) Que porcentaje del total de los estudiantes prefieren el basquetbol?

    (d) Que porcentaje de los estudiantes son de cuarto semestre?

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    13/125

    Cap. 1. Ejercicios 12

    (e) Que porcentaje del total de estudiantes son de tercer o cuarto semestre?

    (f) Que porcentaje prefiere la natacion, el voleibol o el beisbol?

    4. Los siguientes datos representan las cuentas telefonicas mensuales, en miles de pesos, de25 residentes de un pequeno pueblo:

    21,48 21,15 25,12 23,47 27,81 19,80 36,05 28,50 26,6620,35 30,22 25,49 20,80 23,83 25,35 23,48 25,81 21,0726,83 30,96 33,38 20,77 19,98 35,87 22,02

    (a) Que porcentaje del grupo pago mas de 21.000 pesos?

    (b) Que porcentaje pago mas de 22.000 pesos pero menos de 27.000 pesos?

    5. Los datos que se indican a continuacion representan el costo (en miles de pesos) de laenerga electrica durante un determinado mes del ano para una muestra aleatoria de 50

    apartamentos en cierta ciudad importante:128 144 168 109 167 141 149 206 175 123153 197 127 82 96 171 202 178 147 102135 191 137 129 158 108 119 183 151 114111 148 213 130 165 157 185 90 116 172143 187 166 139 149 95 163 150 154 130

    (a) Obtenga una tabla de frecuencias con 7 intervalos de clase.

    (b) Grafique el correspondiente histograma de frecuencias, el polgono de frecuenciasrelativas y la ojiva con frecuencias acumuladas relativas.

    (c) Alrededor de que cantidad parece concentrarse el costo mensual de energa electrica?

    (d) Segun su opinion, cual de las graficas representa mejor la distribucion de los costosde energa electrica?

    6. Responda las siguientes preguntas. Justifique sus respuestas.

    (a) Que escala de medida se requiere para la mediana? Y para la moda?

    (b) En que condiciones coinciden la media, la mediana y la moda de una muestra?

    (c) En que caso sera demasiado grande la diferencia entre la media y la mediana?

    7. Una empresa de servicio electrico de una ciudad le realiza la lectura del contador de luz aun usuario, obteniendo los siguientes datos:

    Fecha Lectura

    Agosto 27 00553 KwhAgosto 30 00571 Kwh

    Septiembre 4 00605 Kwh

    El recibo de pago le llego al usuario con lectura de 00638 Kwh, realizada el 9 de septiembre,pero la empresa no dejo constancia de lectura, hecho que motivo el reclamo del usuarioalegando que le estaban cobrando de mas. Tiene la razon el usuario? Explique.

    8. Los neumaticos de cierta marca tiene una duracion de vida con media de 29.000 kilometrosy desviacion tpica de 3.000 kilometros.

    (a) Encontrar un intervalo en el que se pueda garantizar que se encuentra por lo menosel 75% de los tiempos de vida de los neumaticos de esta marca.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    14/125

    Cap. 1. Ejercicios 13

    (b) Usando la regla imprica y suponiendo que la poblacion tiene forma acampanada,encontrar un intervalo en el cual se estime que se encuentra aproximadamente el 95%de los tiempos de vida de los neumaticos de esta marca.

    9. Los valores de presion sangunea se reportan a veces a los 5 mm Hg mas cercanos (100,105, 110, etc.). Suponga que los valores reales de presion sangunea para nueve individuosseleccionados al azar son:

    130,0 113,7 122,0 108,3 131,5 133,2 118,6 127,4 138,4

    (a) Cual es la mediana de los valores reportados de presi on sangunea?

    (b) Suponga que la presion del octavo individuo es 127,6 en lugar de 127,4 (un peque nocambio en su valor). Como afectara esto a la mediana de los valores reportados?Que dice esto sobre la sensibilidad de la mediana para redondear o agrupar los datos?

    10. La propagacion de grietas por fatiga en diversas partes de aeronaves ha sido objeto de

    profundo estudio en anos recientes. Los datos que aparecen a continuacion constan detiempo de propagacion (horas de vuelo/104) para llegar a un tamano de grieta dado enagujeros sujetadores que se usan en aeronaves militares:

    0,915 0,937 0,983 1,007 0,736 0,863 0,865 0,9131,132 1,140 1,153 1,253 1,394 1,011 1,064 1,109

    (a) Calcule los valores de la media y mediana muestrales.

    (b) En cuanto se puede reducir la observacion muestral mas grande, sin afectar el valorde la mediana?

    11. Una manifestacion interesante de la variacion surge cuando se efectuan los analisis deemision de gases en los vehculos automotores. Los requisitos de costo y tiempo del

    procedimiento federal de prueba (PFT) en cierto pais evitan la difusi on de su uso en losprogramas de inspeccion vehicular. Como resultado, muchas agencias han desarrolladoanalisis menos costosos y mas rapidos con la esperanza de reproducir los resultados.Segun un artculo de una prestigiosa revista, se dice que la eceptacion del PFT comopatron de excelencia ha conducido a la creencia de que las mediciones repetidas en elmismo vehculo daran resultados identicos (o casi). Los autores del artculo aplicaron elPFT a siete vehculos caracterizados como grandes emisores. Los resultados de uno deesos vehculos son los siguientes:

    HC (g/mi) 32,2 32,5 13,8 18,3CO (g/mi) 232 236 118 149

    (a) Calcule las desviaciones estandar muestrales de las observaciones de HC y CO. Parece

    justificada la creencia general?(b) Compare los coeficientes de variacion de cada conjunto de datos para determinar

    cuales presentan mayor o menor variacion.

    12. Un taller de mecanica acepta una orden por 10.000 ruedas de 2 pulgadas de diametro.Las especificaciones de tamano del producto podran ser mantenidas solo si el diametromedio es de 2 pulgadas y la desviacion estandar es muy pequena. En este caso, cual esel margen de tolerancia permitido para la desviacion estandar?

    13. A continuacion se presentan algunas medidas estadsticas (mediana, primer y tercer cuartil)y una tabla de frecuencia agrupada, para las edades de un grupo de personas que hayen una sala de concierto. A partir de estos datos, responder las preguntas que aparecenabajo. Mediana = 20, primer cuartil = 17,5 y tercer cuartil = 23.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    15/125

    Cap. 1. Ejercicios 14

    Frecuencia Frecuencia Frec. acum.Edades Frecuencia relativa acumulada relativa

    11,5 - 14,5 2 0,0500 2 0,0500

    14,5 - 17,5 8 0,2000 10 0,250017,5 - 20,5 11 0,2750 21 0,525020,5 - 23,5 10 0,2500 31 0,775023,5 - 26,5 8 0,2000 39 0,975026,5 - 29,5 1 0,0250 40 1,0000

    (a) Cual era el numero exacto de personas que haban en la sala del concierto?

    (b) Cual es la media aproximada de las personas que asistieron al concierto?

    (c) Que edad tienen el 77,5% de las personas?

    (d) Que porcentaje de personas tienen una edad entre 11,5 y 20,5?

    (e) Que porcentaje de personas tienen una edad mayor de 23,5?

    (f) Cuantas personas tienen una edad entre 17,5 y 20,5?(g) Cuantas personas tienen una edad mayor que 14,5?

    (h) Que interpretacion tiene el valor de la mediana y el de los cuartiles?

    14. Los siguientes datos representan los rendimientos porcentuales anuales en cuentas demercado de dinero de una muestra de 15 bancos comerciales en el area metropolitana deuna ciudad a una determinada fecha:

    Nombre del Banco Rendimiento Nombre del banco RendimientoBanco su cuenta 3,10 Banco el Pais 2,28The Bank 2,63 Banco la Clave 3,01Mein Bank 2,79 Banco del Norte 2,53

    Your Bank 3,25 Banco del Sur 2,00El Banco del pueblo 1,90 Banco Nacional 3,05Aero Bank 2,79 Nuestro Banco 2,02Union Bank 2,90 Banco el dinero 3,05Bank del cliente 2,73

    (a) Proporcione el resumen de cinco numeros.

    (b) Construya el diagrama de caja y bigotes y describa la forma.

    (c) Si alguien le dijera:los rendimientos del mercado de dinero no varan mucho de unbanco a otro, con base en estos datos, que dira?

    15. Una de las metas de toda administracion es ganar lo mas posible en relacion con el

    capital invertido en la empresa. Una medida del exito en alcanzarla es el retorno sobrela aportacion, que es la relacion de la ganancia neta entre el valor de las acciones. Acontinuacion se muestran los porcentajes de ganancia sobre las acciones para 25 empresas.

    11,4 15,8 52,7 17,3 12,3 9,0 19,6 22,9 41,65,1 17,3 31,1 6,2 19,2 14,7 9,6 8,6 11,2

    16,6 5,0 30,3 12,8 12,2 14,5 9,2

    Forme el resumen de cinco numeros, trace un diagrama de caja y bigotes y determine sihay valores atpicos. Como podra un analista financiero usar esta informacion?

    16. Considere la variable anchura que contiene el conjunto de datos que encontramos en elarchivo calles.sf3 y que corresponde al ancho de 112 calles de Madrid (Espana).

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    16/125

    Cap. 1. Ejercicios 15

    (a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera fronterainferior sea 0 y la ultima frontera superior sea 40. A partir de ella, responda lassiguientes preguntas:

    i. Cuantas calles tienen un ancho entre 5 y 25 kilometros?

    ii. Que porcentaje de calles tienen un ancho entre 10 y 30 kilometros?

    iii. Cuantas calles tienen un ancho mayor de 20 kilometros?

    iv. Que porcentaje de calles tienen un ancho mayor 25 kilometros?

    v. Cuantas calles tienen un ancho menor de 15 kilometros?

    vi. Que porcentaje de calles tienen un ancho menor de 35 kilometros?

    (b) Con 8 clases (en donde la primera frontera inferior sea 0 y la ultima frontera superiorsea 40), construir los histogramas de frecuencias absolutas y de frecuencias absolutasacumuladas, los polgonos de frecuencia y de frecuencias relativas y las ojivas de fre-cuencias acumuladas y de frecuencias relativas acumulada. A partir de estos graficos,responda las siguientes preguntas:

    i. Aproximadamente cuantas calles tienen un ancho mayor que 16,9 kilometros?

    ii. Aproximadamente cuantas calles tienen un ancho menor que 12,5 kilometros?

    iii. Que porcentaje aproximado de calles tienen un ancho mayor de 7,7 kilometros?

    iv. Que porcentaje aproximado de calles tienen un ancho menor de 13,8 kilometros?

    (c) Estudie la simetra de la distribucion de los datos.

    (d) Existen valores atpicos? Cuantos? Cuales?

    (e) Existe alguna transformacion que mejora la simetra? Y la presencia de valoresatpicos? Indique en caso positivo la transformacion seleccionada.

    17. En el archivo de datos autos.sf3 mostramos las distancias recorridas (dadas en millaspor galon) de 154 modelos de automoviles sacados al mercado entre los anos 1978 y

    1982 por diferentes fabricantes: americanos (origen=1), europeos (origen=2) y japoneses(origen=3). Tambien aparecen los respectivos cilindrajes de los autos, las potencias, etc.

    (a) Construya un diagrama de caja y bigotes para los datos de la distancia recorrida y apartir de el, responda las siguientes preguntas: Entre cuales valores vara la distanciarecorrida? Cuanto recorre el 50% central de los autos? Hay valores atpicos? Essimetrica o asimetrica la distribucion de los datos? En caso de ser asimetrica, esasimetrica a la izquierda o a la derecha? Cuales son los valores de la media y de lamediana?

    (b) Estudie el grado de simetra de los datos de la distancia recorrida de cuatro manerasdiferentes (compare sus respuestas):

    i. Utilizando las medidas estadsticas (media, mediana, moda, sesgo, etc. )

    ii. Construyendo un histograma de frecuencias con 5 clases.iii. Construyendo un un histograma con 13 clases. Porque este histograma resulta

    mas adecuado que el que construyo con 5 clases?

    iv. Construyendo un grafico de simetra con la opcion graphical options . . . symmetryplot de Statgraphics.

    18. Se han medido los diametros (en milmetros) de 50 tornillos y se han obtenido los resultadosque mostramos en el archivo tornillos.sf3.

    (a) Forme la tabla de frecuencias con 6 clases para los datos y, a partir de ella, respondalas siguientes preguntas:

    i. Cuantos tornillos tienen un diametro entre 29 y 32 milmetros?

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    17/125

    Cap. 1. Ejercicios 16

    ii. Que porcentaje de tornillos tienen un diametro entre 30 y 34 milmetros?

    iii. Cuantos tornillos tienen un diametro mayor de 32 milmetros?

    iv. Que porcentaje de tornillos tienen un diametro mayor 34 milmetros?

    v. Cuantos tornillos tienen un diametro menor de 31 milmetros?

    vi. Que porcentaje de tornillos tienen un diametro menor de 33 milmetros?

    (b) Con 6 clases, construir los histogramas de frecuencias absolutas y de frecuenciasabsolutas acumuladas, los polgonos de frecuencia y de frecuencias relativas y lasojivas de frecuencias acumuladas y de frecuencias relativas acumulada. A partir deestos graficos, responda las siguientes preguntas:

    i. Aproximadamente cuantos tornillos tienen un diametro mayor que 34,4 mil metros?

    ii. Aproximadamente cuantos tornillos tienen un diametro menor que 32,2 milmetros?

    iii. Que porcentaje aproximado de tornillos tienen un diametro mayor de 31,6milmetros?

    iv. Cuantos tornillos tienen un diametro menor de 32,8 milmetros?

    (c) Estudie la simetra de la distribucion de los datos.

    19. Los datos del archivo fotocopia.sf3 muestran el gasto en fotocopias (en miles de pesos)de 70 estudiantes universitarios durante un determinado ano.

    (a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera fronterainferior sea 0 y la ultima frontera superior sea $ 1.400.000. A partir de ella, respondalas siguientes preguntas:

    i. Cuantos estudiantes han gastando entre $ 175.000 y $ 525.00 en el ano?

    ii. Que porcentaje de estudiantes han gastando entre $ 700.000 y $ 1.225.000 enel ano?

    iii. Cuantos estudiantes han gastando mas de $ 1.050.000 en el ano?

    iv. Que porcentaje de estudiantes han gastando mas de $ 350.000 en el ano?v. Cuantos estudiantes han gastando menos de $ 875.000 en el ano?

    vi. Que porcentaje de estudiantes han gastando menos de $ 525.000 en el ano?

    (b) Con 8 clases (en donde la primera frontera inferior sea 0 y la ultima frontera superiorsea $ 1.400.000), construir los histogramas de frecuencias absolutas y de frecuenciasabsolutas acumuladas, los polgonos de frecuencia y de frecuencias relativas y lasojivas de frecuencias acumuladas y de frecuencias relativas acumulada. A partir deestos graficos, responda las siguientes preguntas:

    i. Aproximadamente cuantos estudiantes han gastando mas de $ 767.810 en elano?

    ii. Aproximadamente cuantos estudiantes han gastando menos de $ 391.821 en el

    ano?iii. Que porcentaje aproximado de estudiantes han gastando mas de $ 601.583 en

    el ano?

    iv. Cuantos estudiantes han gastando menos de $ 1.104.220 en el ano?

    (c) Estudie la simetra de la distribucion de los datos.

    (d) Existen valores atpicos? Cuantos? Cuales?

    (e) Realice una transformacion logartmica de los datos e interprete los resultados. Co-mente las diferencias con los datos sin transformar.

    20. En el archivo de datos doscientos.sf3 proporcionamos las sesenta y nueve mejores marcasde todos los tiempos en la prueba de 200 metros lisos masculinos (las marcas se dan ensegundos), as como el nombre del atleta y la fecha en que se consiguio la marca.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    18/125

    Cap. 1. Ejercicios 17

    (a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera fronterainferior sea 19,2 segundos y la ultima frontera superior sea 20,2 segundos. A partirde ella, responda las siguientes preguntas:

    i. Cuantos atletas han recorrido entre 19,325 y 19,7 segundos?

    ii. Que porcentaje de atletas han recorrido entre 19,45 y 19,95 segundos?

    iii. Cuantos atletas han recorrido mas de 19,7 segundos?

    iv. Que porcentaje de atletas han recorrido mas de 19,45 segundos?

    v. Cuantos atletas han recorrido menos de 19,95 segundos?

    vi. Que porcentaje de atletas han recorrido menos de 19,825 segundos?

    (b) Con 8 clases (en donde la primera frontera inferior sea 19,2 segundos y la ultima fron-tera superior sea 20,2 segundos.), construir los histogramas de frecuencias absolutasy de frecuencias absolutas acumuladas, los polgonos de frecuencia y de frecuenciasrelativas y las ojivas de frecuencias acumuladas y de frecuencias relativas acumulada.A partir de estos graficos, responda las siguientes preguntas:

    i. Aproximadamente cuantos atletas han recorrido mas de 19,818 segundos?

    ii. Que porcentaje aproximado de atletas han recorrido mas de 19,845 segundos?

    iii. Que porcentaje aproximado de atletas han recorrido mas de 19,782 segundos?

    iv. Aproximadamente cuantos atletas han recorrido menos de 20,03 segundos?

    (c) Estudie la simetra de la distribucion de los datos.

    (d) Se detecta algo peculiar en la distribucion de estos datos?

    (e) Se detecta algun valor potencialmente atpico? Cual es?

    21. En el archivo de datos Cavendish.sf3 presentamos 29 medidas de la densidad de la tierraobtenidas por Henry Cavendish en 1798 empleando una balanza de torsion. La densidadde la tierra se proporciona como un multiplo de la densidad del agua.

    (a) Utilice los diagramas de tallo y hojas y de cajas para determinar si existe algun valoratpico.

    (b) Proponga, razonando la respuesta, un valor para la densidad de la tierra.

    22. En el archivo de datos autos.sf3 mostramos las distancias recorridas (dadas en millaspor galon) de 154 modelos de automoviles sacados al mercado entre los anos 1978 y1982 por diferentes fabricantes: americanos (origen=1), europeos (origen=2) y japoneses(origen=3). Tambien aparecen los respectivos cilindrajes de los autos, las potencias, etc.

    (a) Considere por separado los conjuntos de distancias recorridas de los modelos de cadauno de los cinco anos.

    i. Analice grafica y numericamente cada uno de estos conjuntos.

    ii. Utilizando la opcion Plot . . . Exploratory Plots . . . Multiple Box-and-WhishkerPlot . . . Data=distancia . . . Level codes=year . . . obtenga los diagramas de cajas(multiples) de los cinco conjuntos de distancias recorridas con respecto a cadauno de los anos. Que se observa? Conoce alguna razon que pueda explicarlo que resulta de los analisis numericos y de la observacion de los diagramas decajas?

    (b) Ahora, construya el diagrama de caja multiple de la distancia recorrida de los au-tomoviles segun su cilindrada.

    i. Teniendo en cuenta cada uno de los diagramas, responda las preguntas formu-ladas en la parte (a).

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    19/125

    Cap. 1. Ejercicios 18

    ii. Compare entre s los distintos diagramas y responda las siguientes preguntas:Donde es mas fuerte la asimetra? Donde es menor? Donde no existe? Varabastante los valores de la media y de la mediana para los diferentes grupos?

    (c) Construya el diagrama de caja multiple de la potencia de los automoviles segun suorigen y responda las preguntas formuladas en el inciso anterior.

    23. En el archivo de datos gemelos.sf3 mostramos los resultados de tests de inteligenciarealizados a parejas de gemelos monozigoticos. Los gemelos monozigoticos se formanpor la division en dos de un mismo ovulo ya fecundado y, por tanto, tienen la mismacarga genetica. Al mismo tiempo, por razones obvias, es muy frecuente que compartan elentorno vital y es difcil separar ambos factores. En el conjunto de datos, los datos de lacolumna A corresponden al gemelo criado por sus padres naturales, los de la columna B alcriado por un familiar u otra persona. Mediante la opcion Compare . . . Two Samples . . .Two Sample Comparison . . . Sample 1=A . . . Sample 2=B . . . Ok, resuelva lo siguiente:

    (a) Compare la simetra de los datos de la columna A y B.

    (b) Construya un diagrama de caja multiple para los datos de la columna A y B y describasus interesantes propiedades.

    (c) Como interpreta el coeficiente de variacion de ambos conjuntos de datos?

    24. En 1893 Lord Rayleigh investigo la densidad del nitrogeno empleando en su obtenciondistintas fuentes. Previamente haba comprobado la gran discrepancia existente entre ladensidad del nitrogeno producido tras la eliminacion del oxgeno del aire y el nitrogenoproducido por la descomposicion de ciertos compuestos qumicos. Los datos del archivoRayleigh.sf3 muestran esta diferencia de forma clara. Esto llevo a Lord Rayleigh a in-vestigar detenidamente la composicion del aire libre de oxgeno y al descubrimiento de unnuevo elemento gaseoso, el argon.

    (a) Analice numerica y graficamente estos datos. Preste especial atencion a los diagramasde tallo y hojas y al diagrama de cajas. Hay alguna peculiaridad de la poblacion depesos que se manifieste en un diagrama y no en el otro?

    (b) Realice diagramas de cajas dividiendo los datos en los pesos obtenidos a partir de airey los obtenidos a partir de compuestos qumicos del nitrogeno. Que se observa?

    25. Una de las medidas de seguridad de los reactores nucleares frente a desajustes en el procesode generacion de energa o de extraccion de esta es el disparo del reactor. Esta medidaconsiste en la detencion del proceso de fusion mediante la insercion en el nucleo del reactorde venenos neutronicos. El numero de disparos no previstos de un reactor en un periodo esun indicador de problemas de comportamiento y de fiabilidad en la planta. En el archivode datos disparos.sf3 proporcionamos, para dos anos diferentes (1984 y 1993), el numero

    de disparos no previstos en sesenta y seis reactores nucleares de los Estados Unidos deNorteamerica.

    (a) Analice numerica y graficamente, por separado, el numero de disparos de reactor encada uno de los dos anos considerados.

    (b) Compare graficamente las distribuciones de ambas variables Se aprecian diferenciasimportantes entre ellas? Que conclusiones le merece esta comparacion?

    26. Sea una variable X que presenta los valorees x1, x2, x3, x4, x5 con frecuencias absolutasn1 = 1, n2 = 2, n3 = 8, n4 = 5 y n5 = 6.

    (a) Representar la variable X mediante digramas de barras horizontales.

    (b) Hacer la representacion con barras horizontales apiladas.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    20/125

    Cap. 1. Ejercicios 19

    (c) Representar la variable X mediante digramas de barras verticales.

    (d) Representar la variable X mediante un diagrama de barras varticales con la lnea basesituada a la altura del punto 4.

    (e) Representar la variable X mediante un diagrama de barras horizontales con rectangulosde error representados por lneas y definidos por la variable Y cuyos valores son 1,5;2,5; 3,5; 3 y 2.

    27. La encuesta de poblacion activa elaborada por una empresa referente al cuarto trimestrede 1.970 presenta para el numero de activos por ramas los siguientes datos:

    RAMA DE ACTIVIDAD MILES DE ACTIVOSAgricultura, caza y pesca 3706,3Fabriles 3437,8Construccion 1096,3Comercio 1388,3

    Transporte 648,7Otros servicios 2454,8

    (a) Realizar un grafico de sectores con porcentajes del numero de activos por ramas.

    (b) Realizar el grafico conlas etiquetas de las ramas de actividad sobre los sectores.

    (c) Desplazar el sector relativo a la rama con menor numero de activos.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    21/125

    CAPITULO 2

    Probabilidad

    2.1 Experimentos, espacios muestrales y eventos

    1. Experimentos determinsticos y aleatorios.

    (a) Experimento: cualquier accion que genera observaciones.

    (b) Experimento determinstico: al repetirse bajo las mismas condiciones,genera siempre los mismos resultados (como, por ejmplo, las leyes fsicas).

    (c) Experimento aleatorio (o estocastico): Al repertirse bajo las mismas

    condiciones, no genera siempre los mismos resultados.

    2. Espacio muestral, evento y evento elemental.

    (a) Espacio muestral : Conjunto de todos los posibles resultados de unexperimento aleatorio.

    (b) Evento: cualquier subconjunto de .

    (c) Evento elemental: evento con un solo elemento.

    2.2 Tecnicas de conteo

    Conteo por enumeracion de elementos, conteo a traves de diagramas de arbol, teoremafundamental del conteo, principio de adicion, conteo de permutaciones y el conteo decombinaciones.

    1. Permutacion.Arreglo ordenado de una cantidad finita de objetos distintos.

    2. Situaciones especiales (relacionadas con permutaciones).

    Permutaciones sin repeticion de n objetos tomados todos a la vez. Permutaciones sin repeticion de n objetos tomados de k en k (k n).

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    22/125

    2.2 Tecnicas de conteo 21

    Permutaciones circulares. Permutaciones con repeticion de n objetos tomados de ken k(kes cualquier

    numero natural). Permutaciones de n objetos de los cuales hay n1 de un primer tipo, n2 deun segundo tipo, . . ., nk de un k-esimo tipo, donde n1+ n2+ + nk = n.

    Maneras de hacer una particion de un conjunto.Solo ilustraremos la primera.

    3. Permutaciones sin repeticion de n objetos tomados todos a la vez.El numero de permutaciones de un conjunto de n elementos distintos es igual1 an! := 1 2 (n 1) n, siendo 0! := 1.

    Ejemplo 2.2.1 Suponga que una empresa dispone de ocho maquinas atornilladorasy de ocho espacios en el area de produccion. Entonces, hay 8! = 40.320 maneras deordenar las ocho maquinas en los ocho espacios disponibles.

    4. Combinacion.Cualquier escogencia de k objetos de un conjunto de n objetos distintos, sinimportar el orden en que los k objetos son escogidos (una combinacion puede sercon repeticion o sin repeticion).

    5. Formula para calcular el numero de combinaciones.El numero de combinaciones de k objetos seleccionados, sin repeticion, de unconjunto de n elementos, es2

    nk

    :=

    n!

    k!(n k)!, siendo

    n0

    := 1.

    Y el numero de combinaciones de k objetos seleccionados con repeticion, de unconjunto de n elementos, es

    n + k 1

    k

    =

    (n + k 1)!

    k!(n 1)!, siendo

    n

    0

    := 1.

    Ejemplo 2.2.2 (Combinaciones tomadas de 2 en 2, sin repeticion) Hay 10 posi-bles formas de escoger dos letras de un total de 5, cuando el orden no importa y la

    seleccion es sin repeticion.

    Ejemplo 2.2.3 (Combinaciones tomadas de 2 en 2, con repeticion) Hay 15 posi-bles formas de escoger dos letras de un total de 5, cuando el orden no importa y laseleccion es con repeticion.

    1El smbolo ! se conoce con el nombre de factorial. Cuando escribamos, por ejemplo, 5!leeremos 5 factorial. Algunos valores factoriales son los siguientes:

    1! = 1, 2! = 2 1 = 2, 3! = 3 2 1 = 6, 4! = 4 3 2 1 = 24, etc.

    2Los numerosn

    k

    se conocen con el nombre de coeficiente binomial.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    23/125

    2.3 Introduccion a la probabilidad 22

    2.3 Introduccion a la probabilidad

    En general, hay 4 formas de calcular o estimar la probabilidad, a saber, mediantelos siguientes metodos (que se relacionan todos entre s): axiomatico, de la fre-cuencia relativa, clasico y subjetivo.

    Solo explicaremos brevemente los metodos emprico y clasico.

    6. Propiedades de la probabilidad.

    (a) P() = 0 y P() = 1.(b) Si los eventos A, B y C son mutuamente excluyentes,3 entonces, P(A B

    C) = P(A) + P(B) + P(C).

    (c) P(A) = 1 P(A), siendo A el complemento de A.

    (d) 0 P(A) 1.(e) P(A) = P(A B) + P(A B).(f) Teorema de adicion para 2 eventos o formula de Silvester:

    P(A B) = P(A) + P(B) P(A B).

    (g) Teorema de adicion para 3 eventos o formula de Silvester:

    P(ABC) = P(A)+P(B)+P(C)P(AB)P(AC)P(BC)+P(ABC).

    7. Metodo emprico.Utiliza datos que se han observado empricamente, registra la frecuencia con queha ocurrido algun evento en el pasado y estima la probabilidad de que el eventoocurra nuevamente con base en estos datos historicos.

    8. Frecuencia relativa de un evento.Supongamos que un experimento aleatorio se repite n veces y que un eventoA asociado con estas n repeticiones ocurre exactamente k veces. Entonces, lafrecuencia relativa del evento A es fn =

    kn

    .

    Ejemplo 2.3.1 La tabla2.1 muestra experimentos hechos por tres investigadores:

    Observese que en cada una de las investigaciones, la frecuencia relativa del numero decaras es aproximadamente 0,5, que es la probabilidad de obtener una cara.

    9. Probabilidad emprica.Sea A un evento asociado con un experimento. Entonces, la probabilidad P(A) esaproximadamente igual a la frecuencia relativa de A si efectuamos el experimentomuchas veces.

    Al usar esta definicion, tener en cuenta:

    Esta probabilidad es solo una estimacion del valor real.3Es decir, todas las posibles intersecciones son vacas.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    24/125

    2.3 Introduccion a la probabilidad 23

    FrecuenciaHecho Numero de Numero relativa

    por Lanzamientos de caras de caras

    Buffon 4.040 2.048 0,5069K. Pearson 12.000 6.019 0,5016K. Pearson 24.000 12.012 0,5005

    Fig. 2.1: Lanzamientos de una moneda realizada por 3 investigadores

    A mayor numero de experimentos mejor sera la estimacion. Los experimentos deben repetirse siempre bajo las mismas condiciones.

    10. Probabilidad (clasica) un evento elemental.Sea un espacio muestral finito y no vaco. Entonces,

    P(evento elemental) =1

    Numero de elementos de . (2.1)

    Ejemplo 2.3.2 Consideremos el experimento de lanzar una moneda. Entonces, laprobabilidad de obtener cara, simbolizado porP(C), y la de obtener sello, simbolizadopor P(S), esta dado por P(C) = P(S) = 1

    2= 0, 5. Estas probabilidades las interpreta-

    mos de la siguiente manera: En un gran numero de lanzamientos aparecera una caraaproximadamente en la mitad de los lanzamientos y sello en la otra mitad. O tambienpodemos decir: si la moneda se lanza repetidamente, entonces, el 50% (que resulta demultiplicar 0,5 por 100) de las veces resultara cara y en el otro 50%, sello.

    11. Probabilidad (clasica) de un evento.Sea finito, no vaco y supongamos que (2.1) se cumple para cada evento ele-mental de . Entonces, para cada evento A de , tenemos

    P(A) =Numero de elementos de A

    Numero de elementos de . (2.2)

    Ejemplo 2.3.3 Dos dados no falsos se lanzan. Sea B el evento de obtener por lomenos un 11. Entonces, la probabilidad de que la suma sea por lo menos un 11 esP(B) = 3

    36= 1

    12.

    Ejemplo 2.3.4 En la primera epoca del desarrollo de un yacimiento de petroleo, unaempresa estimo en 0,1 la probabilidad de que las reservas economicamente recuper-ables excedieran los 2.000 millones de barriles. La probabilidad de que las reservasexcediesen los 1.000 millones de barriles se estimo en 0,5. Dada esta informacion, laprobabilidad estimada de que las reservas se encuentren entre 1.000 y 2.000 millonesde barriles es 0, 5 0, 1 = 0, 4.

    Ejemplo 2.3.5 Un estante tiene 6 libros de matematicas y 4 de fsica. Si todoslos libros de matematicas son diferentes y los libros de fsica tambien, entonces, laprobabilidad de que 3 libros determinados de matematicas esten juntos es P(A) =8!3!10!

    = 0, 0666.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    25/125

    2.3 Introduccion a la probabilidad 24

    Ejemplo 2.3.6 Una caja de doce lapiceros tiene dos que est an defectuosos. Se ex-traen tres lapiceros sin reemplazo. Entonces, la probabilidad de que dos salgan defec-tuosos es P(A) = 10

    220= 0, 045.

    12. Probabilidad condicional de A dado B.

    Se define como P(A/B) = P(AB)P(B)

    si P(B) > 0.

    Ejemplo 2.3.7 Una persona lanza una moneda tres veces. Entonces, la probabilidad

    de obtener 3 caras dado que salio por lo menos una cara es 1/87/8

    = 17

    .

    13. Teorema de multiplicacion para 2 eventos.Si A y B son dos eventos de un espacio muestral = y si P(B A) > 0,entonces,

    P(B

    A) = P(B/A) P(A)o por

    P(B

    A) = P(A/B) P(B).

    Ejemplo 2.3.8 Supongamos que una caja tiene diez bolas, de los cuales tres est andefectuosas. Se sacan dos bolas, una detras de la otra y sin reemplazo. Sean A elevento la primera bola sacada esta defectuosa yB el evento la segunda bola sacadaesta defectuosa. Entonces, la probabilidad de sacar una bola defectuosa seguida deotra defectuosa es

    P(A B) = P(A) P(B/A) = 310

    29

    .

    14. Teorema de multiplicacion para 3 eventos.Si P(A1 A3) > 0, entonces,

    P(A1 A3) = P(A1) P(A2/A1) P(A3/A1 A2).

    Como podemos observar claramente, en este teorema hemos considerando que A1 es el evento

    que primero sucede, luego sucede A2; posteriormente, A3.

    Ejemplo 2.3.9 Una caja contiene 6 fichas rojas, 4 blancas y 5 azules. Halle laprobabilidad de que se extraigan en el orden roja (R), blanca (B) y azul (A) si lasfichas no se reemplazan es P(R B A) = 0, 044.

    15. Teorema de la probabilidad total.Si los eventos A1, A2, . . ., An forman una particion

    4 de un espacio muestral y

    si P(Ai) > 0 para todo i = 1 , . . . , n, entonces, para cada evento B de , se tieneque

    P(B) = P(B/A1) P(A1) + P(B/A2) P(A2) + + P(B/An) P(An).Ejemplo 2.3.10 La caja I contiene 3 fichas rojas(R) y 2 azules (A), en tanto que lacaja II contiene 2 fichas rojas y 8 azules. Se lanza una moneda no falsa de tal formaque si cae cara, entonces, se saca una ficha de la caja I y, por el contrario, si cae sello,se saca una ficha de la caja II. Supongamos que quien lanza la moneda no revela siresulta cara o sello (de tal forma que la caja de la cual se sac o una ficha no se revela).

    4Es decir, todas las posibles intersecciones son vacas y la union de todos los eventos son igualesa .

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    26/125

    2.3 Introduccion a la probabilidad 25

    Fig. 2.2: Diagrama para la situacion del ejemplo 2.3.10

    Entonces, la probabilidad de haber sacado una ficha roja es

    P(R) = P(R/I) P(I) + P(R/II) P(II) = 0,4.

    Ejemplo 2.3.11 Un editor enva propaganda de un libro de estadstica al 70% deaquellos profesores que estan a cargo de esa materia. El 40% de aquellos que recibieronla propaganda se decidieron a utilizar el libro, inclusive, el 20% de los que no recibieronla propaganda tambien utilizaran el libro. Entonces, la probabilidad de utilizar ellibro es 0,34 (se aplica el teorema de la probabilidad; tambien se puede calcular laprobabilidad con ayuda del diagrama de arbol que aparece en la figura 2.3).

    Fig. 2.3: Diagrama para la situacion del ejemplo 2.3.11

    16. Regla o teorema de Bayes.Sea A1, A2, . . . , An una particion

    5 de un espacio muestral . Entonces, paracada evento B con P(B) > 0 y para todo k= 1 , . . . , n, se tiene

    P(Ak/B) =P(B/Ak) P(Ak)

    P(B/A1) P(A1) + P(B/A2) P(A2) + + P(B/An) P(An) .

    Para poder aplicar la regla de Bayes, recomendamos dibujar siempre un diagramade arbol.

    5Es decir, todas las posibles intersecciones son vacas y la union de todos los eventos son igualesa .

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    27/125

    2.3 Introduccion a la probabilidad 26

    Ejemplo 2.3.12 Considere la situacion del ejemplo2.3.10. Entonces, la probabilidadde haber escogido la caja I (es decir, que el resultado de la moneda sea cara) es

    P(I/R) = P(R/I) P(I)P(R/I) P(I) + P(R/II) P(II)

    =35

    12

    35 12 +

    15 12

    = 34

    = 0, 75.

    Ejemplo 2.3.13 Un analista de bolsa examina las perspectivas de las acciones de ungran numero de companas. Cuando se investigo el comportamiento de estas accionesun ano antes, se descubrio que el 15% experimentaron un crecimiento superior al de lamedia, el 40% inferior y el 45% restante se mantuvieron alrededor de la media. El 30%de los valores que crecieron por encima de la media fueron clasificados como buenasadquisiciones por el analista, al igual que el 15% de las que crecieron alrededor dela media y el 20% de las que tuvieron un crecimiento inferior. Al aplicar el teoremade Bayes, la probabilidad de que un valor clasificado como buena adquisicion porel analista crezca por encima de la media del mercado es igual a 0,3658.

    Ejemplo 2.3.14 En cierta ciudad, aproximadamente el 10% de los habitantes estaafectado por una rara enfermedad (A), para la cual se ha desarrollado una prueba dediagnostico. A traves de esta prueba se ha determinado que el 85% de los individuosque padecen la enfermedad, presentan un resultado positivo (B), mientras que el20% de los individuos sin la enfermedad muestran un resultado de prueba positivo.Supongamos que se hace una prueba en un individuo seleccionado al azar. Todaslas probabilidades mencionadas en el problema se pueden identificar en el siguientediagrama de arbol que se muestra en la figura2.4.

    Fig. 2.4: Diagrama de arbol para los datos del ejemplo 2.3.12.

    (a) La probabilidad de que el resultado sea positivo es

    P(B) = P(A) P(B/A) + P(A) P(B/A) = 0, 085 + 0,18 = 0, 265.

    (b) Si el resultado es positivo, entonces, la probabilidad de que el individuo tenga

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    28/125

    2.4 Independencia 27

    la enfermedad es (por el teorema de Bayes):

    P(A/B) =P(A B)

    P(B)

    =0, 085

    0, 265

    = 0, 3207.

    2.4 Independencia

    1. Independencia.A, B son (estocasticamente) independientes, si y solo si P(A/B) = P(A) y sondependientes en cualquier otro caso. Es decir, el evento A es independiente delevento B si la probabilidad de A no se ve afectada por la ocurrencia o no de B.

    2. Teorema de multiplicacion para eventos independientes.Dos eventos A, B de un espacio muestral = son independientes si y solo si

    P(A B) = P(A)P(B).

    3. Teorema de independencia.Sean A, B eventos de un espacio muestral = . Entonces, las siguientes cuatroproposiciones son equivalentes:

    (a) A y B son independientes. (b) A y B son independientes.

    (c) A y B son independientes. (d) A y B son independientes.

    Ejercicios

    1. Una universidad realiza tres tipos de pruebas a 100 aspirantes y obtiene los siguientesresultados: 2 fracasaron en las tres pruebas; 7, en la primera y en la segunda; 8, en lasegunda y en la tercera; 10, en la primera y en la tercera; 25, en la primera; 30, enla segunda; 25, en la tercera. Determine el numero de aspirantes que conforman lossiguientes eventos:

    (a) Fracasaron exactamente en una prueba.

    (b) Aprobaron las tres pruebas.

    (c) Fracasaron en la primera y en la tercera, pero no en la segunda.

    (d) Fracasaron en la segunda y en la tercera, pero no en la primera.

    (e) Fracasaron en al menos una prueba.(f) Aprobaron al menos una prueba

    (g) Aprobaron la segunda o la tercera, pero no la primera.

    2. Un equipo de futbol ha determinado contratar un futbolista de talla internacional para elproximo campeonato. Sean A, B y C eventos que representan el hecho de que el futbolistacontratado ha jugado en el Real Madrid, en el Milan y en el Bayern de Munich, respecti-vamente. Utilice las operaciones de union, interseccion y complemento para describir, enterminos de A, B y C, dibuje un diagrama de Venn y sombree la region correspondientea cada uno.

    (a) Por lo menos el futbolista ha jugado en uno de los tres equipos mencionados ante-riormente.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    29/125

    Cap. 2. Ejercicios 28

    (b) El futbolista ha jugado en los tres equipos mencionados anteriormente.

    (c) El futbolista ha jugado en el Real Madrid y no en el Milan.

    (d) El futbolista solo ha jugado en el Bayern de Munich.(e) El futbolista ha jugado exactamente en uno de los tres equipos mencionados ante-

    riormente.

    3. Los estudiantes de un curso de estadstica se clasifican como estudiantes de administra-cion, economa o ingeniera; como repitente o no repitente y tambien como hombre omujer. Encuentre el numero total de clasificaciones posibles para los estudiantes de dichocurso.

    4. Supongamos que 7 personas se quieren organizar en una fila. De cuantas manerasdiferentes pueden hacerlo?

    5. La mayor accionista de una determinada empresa decide que en el futuro se divida el pre-supuesto de publicidad entre tres agencias. Seis son las agencias que se estan considerando

    para este trabajo. Cuantas son las posibles elecciones de tres agencias?

    6. Las placas para autos en Barranquilla antes tenan dos letras y cuatro numeros. El sistemade nomenclatura cambio y ahora son de tres letras y tres numeros. Con el sistema actual,aumento o disminuyo el numero de placas que se pueden emitir? En que porcentaje?

    7. En una comunidad el 30% de las personas son fumadoras, 55% son bebedoras y 20%tanto fumadoras como bebedoras. Calcule la probabilidad de que una persona elegida alazar (a) fume pero no beba, (b) ni fume ni beba, (c) fume o no beba. Interprete siempresus resultados.

    8. Para un control de calidad se seleccionan aleatoriamente dos abanicos sin reemplazo de unlote. Si uno de los dos abanicos esta defectuoso, todo el lote se rechaza. Si una muestrade 200 abanicos contiene cinco defectuosos calcule la probabilidad de que la muestra sea

    rechazada.

    9. La siguiente tabla recoge las proporciones de adultos en cierta ciudad, clasificadas enaquellos que fuma o no fuman y aquellos que tiene problemas de salud.

    Problemas Fuman No fumanS 0,15 0,09No 0,18 0,58

    (a) Cual es la probabilidad de que un adulto de esta poblaci on elegido al azar tengaproblemas de salud?

    (b) Cual es la probabilidad de que un adulto de esta poblaci on elegido fume?

    (c) Cual es la probabilidad de que un adulto de esta poblacion elegido al azar que nofume tenga problemas de salud?

    10. En cierta empresa, 31% de los empleados son europeos, 42% son asiaticos y 27% sonlatinoamericanos. De los empleados europeos, 34% son mujeres; de los asiaticos, 42%son mujeres; mientras que de los latinoamericanos, 72% son mujeres.

    (a) Cual es la probabilidad de que un empleado seleccionado al azar sea una (mujer)europea? (Hombre) asiatico?

    (b) Cual es la probabilidad de que un empleado seleccionado al azar sea una mujer?Hombre?

    (c) Si un empleado seleccionado al azar es una mujer, cual es la probabilidad de que seaeuropea? Asiatica? Latinoamericana?

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    30/125

    Cap. 2. Ejercicios 29

    (d) Repita el inciso anterior, teniendo en cuenta que el empleado seleccionado sea unhombre.

    11. Una empresa fabrica computadores, cuyo disco duro tienen capacidad de 20 GB y otroscon capacidad de 30 GB. En el mes anterior, 35% de los computadores vendidos han sidolos que tienen disco duro de 20 GB. De los compradores de computadores con disco durode 20 GB, 45% compran los que tienen una memoria RAM de 356 MB, mientras queel 30% de los compradores de computadores con disco duro de 30 GB tambien lo hacenas. Si sabemos que un comprador seleccionado al azar ha comprado un computador conmemoria RAM de 356 MB, cual es la probabilidad de que tenga un computador con discoduro de 30 GB?

    12. Una prestigiosa Universidad de Barranquilla utiliza tres hoteles locales para proporcionarhospedaje nocturno a sus profesores invitados. Supongamos que a 25% de los profesoresse les asignan habitaciones en el Hotel Las Nieves, al 45% en el Hotel El Mar y al 30%en el Hotel San Felipe. Si hay una decorado especial en 3% de la habitaciones del Hotel

    Las Nieves, 5% del Hotel El Mar y en 8%de las habitaciones del Hotel San Felipe, cuales la probabilidad de que

    (a) a un cliente se le asigne una habitacion con decorado especial?

    (b) a una persona con una habitacion que tiene un decorado especial se le haya acomodadoen el Hotel El Mar?

    13. Una emisora de bonos municipales tiene tres categoras de clasificacion (A, B y C).Suponga que el ano pasado, de los bonos municipales que se emitieron en cierto pais,70% tuvieron clasificacion A, 20% clasificacion B y 10% clasificacion C. De los bonosmunicipales con clasificacion A, 50% fueron emitidos en ciudades, 40% en suburbios y10% en areas rurales. De los bonos municipales con clasificacion B, 60% fueron emitidosen ciudades, 20% en suburbios y 20% en areas rurales. De los bonos municipales con

    clasificacion C, 90% fueron emitidos en ciudades, 5% en suburbios y 5% en areas rurales.(a) Que proporcion de bonos municipales emiten las ciudades? Los suburbios? Las

    areas rurales?

    (b) Si una ciudad emitiera un nuevo bono municipal, cual seria la probabilidad de quetuviera clasificacion A?

    14. Se les pregunto a los suscriptores de un periodico local si lean regularmente, ocasional-mente o nunca la seccion de deportes y, tambien, si haban practicado futbol durante elano anterior. La proporciones obtenidas en la encuesta figuran en la siguiente tabla.

    Futbol Lee regularmente Lee ocasionalmente Nunca leeS 0,21 0,16 0,31No 0,10 0,04 0,18

    (a) Cual es la probabilidad de que un suscriptor elegido al azar nunca lea la seccion dedeportes?

    (b) Cual es la probabilidad de que un suscriptor elegido al azar haya jugado futbol duranteel ano pasado?

    (c) Cual es la probabilidad de que un suscriptor que nunca lea la secci on de deporteshaya jugado futbol durante el ano pasado?

    (d) Cual es la probabilidad de que un suscriptor que ha jugado futbol durante el anopasado nunca lea la seccion de deportes?

    (e) Cual es la probabilidad de que un suscriptor que no lea regularmente la seccion dedeportes haya jugado futbol durante el ano pasado?

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    31/125

    Cap. 2. Ejercicios 30

    15. Suponga que las proporciones de fenotipos sanguneos en determinada poblacion son lossiguientes: A : 35%, B : 28%, AB : 13% y O : 24%. Supongamos que los fenotipos dedos personas seleccionadas al azar son independientes entre s. Cual es la probabilidad

    de que ambos fenotipos sean O?

    16. Se clasifican muestras de hule de espuma de tres proveedores de acuerdo a si cumplen ono con las especificaciones. Los resultados de 100 muestras se resumen a continuaci on:

    Proveedor S cumple No cumple1 17 32 18 103 50 2

    Si A denota el evento de que una muestra es del proveedor 1 y si B denota el evento deque una muestra cumple con las especificaciones, determine si A y B son independientes.Son independientes A y B?

    17. Se selecciono una muestra de 570 encuestados en una cierta ciudad para recoger in-formacion acerca del comportamiento de los consumidores. Entre las preguntas estaba:Disfruta usted comprando ropa? De 270 hombres, 165 respondieron que s. De 300mujeres, 224 respondieron que s.

    (a) Suponga que el participante elegido es mujer. Cual es la probabilidad de que nodisfrute comprando ropa?

    (b) Suponga que el participante elegido disfruta comprando la ropa. Cual es la proba-bilidad de que la persona sea hombre?

    (c) Los eventos disfrutar comprando ropa y sexo del participante, son estadsticamenteindependientes? Explique.

    18. Una compana de seguros estima que el 30% de los accidentes de automovil son debidosal estado de embriaguez del conductor y que el 20% provocan heridos. Ademas, el 40% delos accidentes que dan lugar a heridos son debidos al estado de embriaguez del conductor

    (a) Cual es la probabilidad de que un accidente elegido al azar haya sido causado por elestado de embriaguez del conductor y haya dado lugar a heridos?

    (b) Son los sucesos debido al estado de embriaguez del conductor y da lugar a heridosindependientes?

    (c) Si un accidente elegido al azar es causado por el estado de embriaguez del conductor,cual es la probabilidad de que haya dado lugar a heridos?

    (d) Cual es la probabilidad de que un accidente elegido al azar haya sido provocado porel estado de embriaguez del conductor y no haya dado lugar a heridos?

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    32/125

    CAPITULO 3

    Distribuciones de probabilidad

    3.1 Variables aleatorias discretas

    1. Variable aleatoria.X : R. Se clasifica en discreta o continua.

    2. Variable aleatoria discreta.Tiene una cantidad o finita o (infinita) enumerable de valores.

    3. Funcion de probabilidad f de X.

    Una funcion f : R [0, 1] tal quef(x) =

    P(X = x), si x = x1, x2, . . .;0, de otra forma.

    Es claro que:

    (a) f(x) 0 para todo valor x real.

    (b)xR

    f(x) = 1.

    (c) La grafica de f es un histograma de probabilidad.

    4. Funcion de distribucion acumulada deX

    .Una funcion F : R [0, 1] definida porF(t) = P(X t) =

    x;xt

    f(x), para todo t real.

    5. Propiedades de F.

    (a) 0 F(t) 1.(b) F es creciente y escalonada.

    (c) F(

    ) = 1 y F(

    ) = 0.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    33/125

    3.2 Variables aleatorias continuas 32

    6. Comentarios generales.

    (a) P(X = a) no siempre es cero.

    (b) P(a < X b) = F(b) F(a).(c) P(a X b) = F(b) F(a).(d) P(a X b) = P(a < X b).

    7. Como se calcula f a partir de F?Si a es el valor maximo posible de X que es estrictamente menor que a, entonces,

    f(a) = F(a) F(a)

    8. Esperanza y varianza.

    E(X) = k

    xk f(xk), V(X) = k

    (xk )2 f(xk).

    9. Propiedades de la esperanza y varianza.

    (a) E(aX + b) = aE(X) + b.

    (b) V(aX + b) = a2V(X).

    (c) V(X) = E(X2)

    E(X)2

    .

    3.2 Variables aleatorias continuas1. Variable aleatoria.

    X : R. Se clasifica en discreta o continua.2. Variable aleatoria continua.

    Tiene una cantidad infinita no enumerable de valores.

    3. Funcion de densidad f de X.Una funcion f : R [0,) que cumple las dos condiciones:

    (a) P(a

    X

    b) =

    b

    a f(x) dx, para todo a y b reales.(b) El area bajo toda la grafica de f es 1, es decir,

    f(x) dx = 1.

    La grafica de f es una curva.

    4. Funcion de distribucion acumulada de X.Una funcion F : R [0, 1] definida por

    F(t) = P(X t) =t

    f(x) dx, para todo t real.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    34/125

    Cap. 3. Ejercicios 33

    5. Propiedades de F.

    (a) 0

    F(t)

    1.

    (b) F es creciente y continua.

    (c) F() = 1 y F() = 0.6. Comentarios generales.

    (a) P(X = a) siempre es cero.

    (b) P(a < X b) = F(b) F(a).(c) P(a X b) = F(b) F(a).(d) P(a X b) = P(a < X b) = P(a X < b) = P(a < X < b).

    7. Como se calcula f a partir de F?f(x) = F (x), para todo valor de x en donde exista la derivada.

    8. Esperanza y varianza.

    E(X) =

    x f(x) dx, V (X) =

    (x )2 f(x) dx.

    9. Propiedades de la esperanza y varianza. Las mismas que en el caso discreto.

    Ejercicios1. Son las siguientes afirmaciones verdaderas o falsas? Justifique cada respuesta.

    (a) Toda variable aleatoria es un numero.

    (b) Si f es la funcion de probabilidad de una variable aleatoria discreta X y 0 es un posiblevalor de X, entonces, f(0) = 0.

    (c) Para cualquier variable aleatoria discreta X se cumple que P(X = 1) = 1, en donde 1es un posible valor de X.

    (d) Si F es la funcion de distribucion acumulada de una variable aleatoria X discreta,entonces, F es una funcion escalonada.

    (e) Si X es una variable aleatoria discreta con funcion de distribucion acumulada F, en-

    tonces, se cumple que P(3 X < 5) = F(5) F(3).(f) Si f es la funcion de densidad de una variable aleatoria continua X, entonces, f(x) =

    P(X = x), para todo numero real x.

    (g) Para cualquier variable aleatoria continua X se cumple que P(X = 1) = 1.

    (h) Si F es la funcion de distribucion acumulada de una variable aleatoria X continua,entonces, F es una funcion escalonada

    (i) Si X es una variable aleatoria continua con funcion de distribucion acumulada F,entonces, se cumple que P(4 X < 8) = F(8) F(4).

    (j) Si X es cualquier variable aleatoria y si la variable aleatoria X +4 tiene esperanza 1,entonces, la esperanza de X es 5.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    35/125

    Cap. 3. Ejercicios 34

    2. Una pizzera, que atiende pedidos por correo, tiene cinco lneas telefonicas. Sea X lavariable aleatoria que representa al numero de lneas en uso en un momento especfico.Supongamos que la funcion de probabilidad f de X esta dada en la siguiente tabla:

    Valor x de X 0 1 2 3 4 5f(x) 0,20 0,25 0,10 0,15 0,09 0,21

    Calcule la probabilidad de cada uno de los siguientes eventos:

    (a) A = a lo sumo 2 lneas estan en uso.

    (b) B = menos de 4 lneas estan en uso.

    (c) C = por lo menos 3 l neas estan en uso.

    (d) D = entre 2 y 4 (ambos inclusive) lneas estan en uso.

    (e) E = entre 2 y 5 (ambos inclusive) l neas no estan en uso.

    (f) F = por lo menos 3 lneas no estan en uso.

    3. La funcion de probabilidad de la variable aleatoria X que representa al numero de imper-fecciones por 4 metros de un papel especial en rollos continuos de ancho uniforme, estadada por

    x 0 1 2 3 4

    f(x) 0,21 0,28 0,10 0,25 0,16

    Determine la funcion de distribucion acumulada de X y representela graficamente.

    4. Una fabricante de lapiceros tiene un programa de control de calidad que incluye la in-speccion de lapiceros recibidos para revisar que no tengan defectos. Supongamos que, encierto da, el recibe lapiceros en lotes de cinco y se seleccionan dos lapiceros de un lote

    para inspeccionarlos. Podemos representar los posibles resultados del proceso de seleccionpor pares. Por ejemplo, el par (3, 4) representa la seleccion de los lapiceros 3 y 4 parainspeccionarlos.

    (a) Haga una lista de los resultados diferentes.

    (b) Supongamos que los lapiceros 3 y 4 son los unicos defectuosos de un lote de cinco yse van a escoger dos lapiceros al azar. Defina la variable aleatoria X como el numerode de lapiceros defectuosos observado entre los inspeccionados. Encuentre la funcionde probabilidad de X.

    (c) Encuentre la funcion de distribucion acumulada F de X y representela graficamente.

    5. Al invertir en unas acciones particulares, una persona puede tener una ganancia en un anode $8.000.000 con probabilidad de 0,4 o tener una perdida de $2.000 con probabilidad de0,6. Cual es la ganancia esperada de esta persona? Interprete su respuesta.

    6. El numero total de horas, medidas en unidades de 10 horas, que una familia utiliza unalavadora en un perodo de 6 meses es una variable continua X con funcion de densidad

    f(x) =

    x, si 0 < x < 1,

    2 x si 1 x < 2,0, de otro modo.

    (a) Haga un bosquejo de la grafica de f.

    (b) Cual es la probabilidad de que en un perodo de 6 meses, una familia utilice sulavadora menos de 15 horas? Entre 5 y 12 horas?

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    36/125

    Cap. 3. Ejercicios 35

    7. Suponga que la temperatura de reaccion (en grados centgrados) de cierto proceso qumicoes una variable aleatoria continua X con funcion de densidad

    f(x) = 1 x, si k x k,0, de otra manera.

    (a) Halle el valor de k para que f sea en realidad una densidad y, luego, trace la graficade f.

    (b) Calcule la probabilidad de que la temperatura de reaccion sea estrictamente positiva.

    (c) Calcule la probabilidad de que la temperatura de reaccion se encuentre entre 0 y 1/2grados centgrados.

    (d) Calcule probabilidad de que la temperatura de reaccion sea menor que 1/4 gradoscentgrados o mayor que 1/4 grados centgrados.

    8. Un maestro universitario nunca termina su clase antes de que suene la campana y siempretermina su clase por lo menos 2 minutos despues de que suena la campana. Sea X eltiempo (en minutos) que transcurre entre la campana y el termino de la clase, y supongaque la funcion de densidad de X es

    f(x) =

    kx2, si 0 x 2,0, de otra manera.

    (a) Encuentre el valor de k y luego grafique f.

    (b) Cual es la probabilidad de que la clase termine por lo menos 1 minuto despues deque suene la campana?

    (c) Cual es la probabilidad de que la clase continue entre 60 y 90 segundos despues de

    que suene la campana?(d) Cual es la probabilidad de que la clase continue por lo menos 90 segundos despues

    de que suene la campana?

    9. Un vendedor recibe un salario anual de 12.000.000 de pesos, mas un 5% del valor delas ventas que realiza. Las ventas anuales pueden representarse mediante una variablealeatoria con media 20.000.000 de pesos y desviacion t pica de 2.000.000 de pesos. Hallela media y la desviacion del ingreso anual de este vendedor.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    37/125

    CAPITULO 4

    Distribuciones especiales

    1. Distribuciones especiales discretas:Uniforme discreta, de Bernoulli, binomial, de Poisson, hipergeometrica, binomialnegativa, geometrica, etc.

    2. Distribuciones especiales continuas:Uniforme continua, normal, gamma, exponencial, t de Student, Chi-cuadrada, Fde Weibull, etc.

    4.1 La distribucion uniforme (discreta)1. Definicion.

    Una variable aleatoria discreta X con los valores enteros sobre el intervalo [a, b]tiene distribucion uniforme discreta sobre el conjunto de los numeros en-teros que estan en el intervalo [a, b], cuando se tiene que P(X = x) = 1

    ba+1,para todo x entero que esta en el intervalo [a, b]. Ademas,

    E(X) =a + b

    2y V(X) =

    (b a + 1)2 1

    12.

    4.2 La distribucion binomial1. Experimento de Bernoulli.

    Aquel con solo dos resultados posibles: exito y fracaso y en donde un exitoocurre con probabilidad p, siendo 0 < p < 1.

    2. Experimento binomial.Es un experimento de Bernoulli que se ejecuta n veces, de tal manera que lasdiferentes ejecuciones se efectuen independientemente unas de las otras.

    3. Distribucion binomial.Si se realiza n veces un experimento de Bernoulli con probabilidad de exito p y si

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    38/125

    4.3 La distribucion de Poisson 37

    X denota al numero total de exitos obtenidos, entonces, la probabilidad de que seobtengan k exitos es

    P(X = k) = nkpk (1 p)nk, k= 0 , 1 , 2 , . . . , n .La correspondiente distribucion de X se conoce con el nombre de distribucionbinomial con parametros n y p. Ademas, E(X) = np y V(X) = np(1 p).

    Fig. 4.1: Distribucion binomial para varios n pero fijo np = 3.

    Ejemplo 4.2.1 Una moneda no falsa es lanzada 10 veces. Consideraremos el eventocara como un exito y sello como un fracaso. Es claro que p = 0, 5, n = 10 ylas condiciones basicas que caracterizan a la distribucion binomial se satisfacen. Porconsiguiente,

    (a) La probabilidad de tener exito exactamente 7 veces es 0,1172.

    (b) La probabilidad de tener a lo mas 7 exitos es 0,945.

    (c) La probabilidad de tener por lo menos 3 exitos es 0,945 y la probabilidad deningun exito es 9.766104.

    4.3 La distribucion de Poisson

    1. Experimento y proceso de Poisson.

    Consideremos las siguientes variables aleatorias:

    (a) El numero de partculas emitidas por cierta sustancia radioactiva en un de-terminado lapso de tiempo.

    (b) El numero de llamadas que llegan a una central telefonica en cierto intervalode tiempo.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    39/125

    4.3 La distribucion de Poisson 38

    (c) El numero de ordenes de devolucion de piezas que recibe una empresa enuna semana.

    (d) El numero de veces que falla una pieza de un equipo durante un perodo detres meses.

    (e) El numero de huelgas anuales en un empresa.

    Cada una de estas variables aleatorias esta asociada a unos procesos llamadosprocesos de Poisson.

    2. Distribucion de Poisson.Consideremos un proceso de Poisson con parametro > 0 (es decir, es el numeropromedio de ocurrencias por unidad de tiempo) y sea X el numero de eventosque ocurren en un intervalo de tiempo [0, t]. Entonces, la probabilidad de queocurran k eventos en el intervalo [0, t] esta dada por

    P(X = k) =1

    k!ek, k= 0 , 1 , 2 , 3 , . . . .

    siendo e la base del logaritmo natural. La correspondiente distribucion de X seconoce con el nombre de distribucion de Poisson con parametro . E(X) =V(X) = .

    Fig. 4.2: Distribuciones de Poisson para varios valores del parametro .

    Ejemplo 4.3.1 Los sabados por la manana, los clientes entran en una pequena tiendade un centro comercial suburbano a una tasa esperada de 0,50 por minuto. Halle laprobabilidad de que el numero de clientes que entran en un intervalo especfico de 10minutos es (a) 3, (b) a lo mas 3.SOLUCION:Las hipotesis del proceso de Poisson parecen ser razonables en este contexto. Damospor sentado que los clientes no llegan en grupos (o podemos contar al grupo enterocomo un solo cliente) y que la entrada de un cliente no aumenta ni disminuye la

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    40/125

    4.4 La distribucion hipergeometrica 39

    probabilidad de que llegue otro. Para obtener , observamos que auna tasa media de0,50 por minuto durante un periodo de 10 minutos, podemos esperar = (0,50)(10) =5 entradas. SeaX la variable aleatoria que representa al numero de clientes que entran

    en un intervalo especfico de 10 minutos. Por tanto, (a) P(X = 3) = 0, 1403 y (b)P(X 3) = 0, 2650.

    Ejemplo 4.3.2 La distribucion de Poisson ha resultado ser muy util en problemasde lneas de espera o colas. Los clientes llegan a una maquina fotocopiadora a unatasa media de 2 cada 5 minutos. En la practica, se pueden representar los procesosde llegada de esta clase mediante una distribucion de Poisson. Asumiendo que este esel caso,

    (a) La probabilidad de que no haya llegadas en un perodo de cinco minutos es 0,135.

    (b) La probabilidad de que haya 1 llegada es 0,271.

    (c) La probabilidad de que haya estrictamente mas de dos llegadas es 0,323.

    3. Teorema de aproximacion de la binomial a la Poisson.Sea X una variable aleatoria binomial con parametros n y p. Si n es grande(n 100), p pequena (p 0,01) y np tiene un tamano moderado (np 20),entonces, la distribucion binomial con parametros n yp puede aproximarse bien porla distribucion de Poisson con parametro = np. Es decir, bajo estas condicionesse cumple que

    b(k; n;p) p(k; np), k= 0 , 1 , 2 , 3 , . . .

    o, que es equivalente,

    B(k; n;p) P(k; np), k= 0 , 1 , 2 , 3 , . . . .

    Ejemplo 4.3.3 Una cierta compana electronica produce 15.000 unidades de un tipoespecial de tubo al vaco. Se ha observado que, en promedio, 3 tubos de 300 sondefectuosos. La compana empaca los tubos en cajas de 600. Cual es la probabilidadde que en una caja de 600 tubos hayan (a) 5 tubos defectuosos, (b) por lo menos 3defectuosos y (c) a lo mas 1 defectuoso?SOLUCION:Sea X la variable aleatoria que representa al numero de tubos defectuosos. Entonces,X es una variable binomial con parametrosn = 600 yp = 0,01. Aplicando el teoremade aproximacion, tenemos (a) P(X = 5)0, 161, (b) P(X 3) = 0, 938 y (c) P(X 1) =0, 017

    .

    4.4 La distribucion hipergeometrica

    1. Experimento hipergeometrico.

    En general, un experimento hipergeometrico con parametros n, M y Nesta basado en las siguientes suposiciones (vease la figura 4.3):

    (H1) La poblacion o conjunto donde deba hacerse el muestreo es una poblaci onfinita con N elementos.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    41/125

    4.4 La distribucion hipergeometrica 40

    (H2) Cada elemento de la poblacion puede ser caracterizado como un exito o unfracaso.

    (H3) Hay M exitos en la poblacion.(H4) Se elige una muestra sin reemplazo de n individuos, de tal forma que sea

    igualmente probable seleccionar cada subconjunto de tamano n.

    Fig. 4.3: Esquema grafico de un experimento hipergeometrico

    2. Distribucion hipergeometrica.Sea X el numero de exitos obtenidos en una muestra escogida al azar al realizar unexperimento hipergeometrico con parametros n, M y N. Entonces, la probabilidadde elegir de manera exacta k exitos en n intentos esta dada por

    P(X = k) =

    Mk

    NMnk

    Nn

    , donde k= 0 , 1 , 2 , . . . , n y n N. (4.1)

    La correspondiente distribucion de X se conoce con el nombre de distribucionhipergeometrica con parametros n, M y N.

    E(X) = n MN

    y V(X) =

    N n

    N 1

    n M

    N

    1 M

    N

    .

    Las distribuciones binomial e hipergeometrica coinciden cuando nN 0,05.

    Ejemplo 4.4.1 Una cantidad de 8 componentes electricas estan sujetas a un controlde calidad. Fue encontrado que 3 de las componentes no estaban defectuosas y lascomponentes que quedaban s lo estaban. Si una muestra aleatoria de 3 componentes

    son escogidas de este lote, cual es la probabilidad de que (a) exactamente 2 de ellasesten defectuosas?, (b) a lo mas 1 de ellas este defectuosa?SOLUCION:Sea X la variable aleatoria que representa al numero de componentes defectuosas.Aplicando la distribucion hipergeometrica con parametros n = 3, N = 8 y M = 3,tenemos que (a) P(X = 2) = 0, 26786 y (b) P(X 1) = 0, 714286.

    Ejemplo 4.4.2 Una compana recibe un pedido de 20 artculos. Dado que la in-speccion de cada artculo es cara, se sigue la poltica de analizar una muestra de 6artculos de cada envo (seleccionada sin reemplazo y sin orden), aceptando la remesasi no hay mas de un artculo defectuoso en la muestra. Entonces, la probabilidad deque sea aceptado un pedido con cinco artculos defectuosos es de 0,516.

  • 7/27/2019 Libro Estadistica Para Su Apoyo en El Semestre

    42/125

    4.5 Las distribuciones binomial negativa y geometrica 41

    4.5 Las distribuciones binomial negativa y geometrica

    1. Experimento binomial negativo.

    Un experi