analisis del dato estadistico ii - guia a actualizada

155

Upload: canelonesc4654

Post on 27-Jun-2015

3.396 views

Category:

Documents


5 download

TRANSCRIPT

CONTENIDO.MDULO I: TEORIA DE CONJUNTOS Y PROBABILIDADMDULO II: VARIABLES ALEATORIAS DISCRETAS Y CONTINUASMDULO III: ESTIMACIONMDULO IV: CONTRASTE DE HIPOTESISMDULO V: REGRESION Y CORRELACION LINEAL SIMPLE2345678910111213141516SmbolosMatemticosSmbolos Descripcin Pertenece No pertenece aContenido en Estrictamente Contenido No est contenido Igual DiferenteUninInterseccinA B DiferenciaP(A) Conjuntos de Partes de Ax < y x menor que yx y x menor o igual a y[a,) Intervalo Cerrado por la izquierda( , b] Intervalo Cerrado por la derecha(a,) Intervalo Abierto por la izquierda(- , b) Intervalo Abierto por la derecha[a, b] Intervalo Cerrado(a, b) Intervalo Abierto(x, y) Par ordenadoAxB Producto Cartesiano17Interpretaciones de la Probabilidad 1A pesar de que el concepto de probabilidad es una parte tan comn y natural de la experiencia de la gente, no existe una nica interpretacin cientfica del trmino probabilidad aceptada por todos losestadsticos,filsofosy dems autoridades cientficas. A travs de los aos, cada interpretacin de la probabilidad propuesta por unos expertos ha sido criticada por otros. De hecho, el verdadero significado de la probabilidad es todava un trmino muy conflictivo y surge en muchas discusiones filosficas actuales sobre los fundamentos de la estadstica. Se expondrn tres interpretaciones (o definiciones) diferentes de la probabilidad, cada una de estas interpretaciones puede ser til en la aplicacin de la teora de la probabilidad a problemas prcticos. Interpretacin Clsica de la Probabilidad (o Probabilidad a priori) Lateoradelaprobabilidadensuscomienzosestuvoasociadaalosjuegosdeazar. Esta asociacin impulsa la interpretacin clsica. Por ejemplo, supngase que se quiere conocer la probabilidaddequeal lanzar unamonedasalgacara. Puedeargumentarsedelasiguiente manera: Como hay solamente dos formas en que la moneda puede caer, cara o sello, y como la moneda esta balanceada, podra esperarse que sea tan probable que salga cara como sello, as la probabilidad de cara estar dada por el valor 1/2. Esta interpretacindelaprobabilidad esta basada en el concepto deresultados igualmente probables que son mutuamente excluyentes. Generalizando, si el resultado de algn proceso debeser unodenresultados diferentes yestosnresultados sonigualmenteprobables y mutuamente excluyentes, entonces la probabilidad de cada resultado es 1/n. Considrese otro ejemplo: Si un dado es lanzado (hay seis posibles resultados) cualquiera de las seis caras numeradas pueden salir. Estos seis resultados son mutuamente excluyentes dado que dos o ms caras no pueden salir simultneamente, 1Basadoenlossiguientestextos:DeGroot, Morris.ProbabilidadyEstadstica.Pgs. 2-6;Mood, Graybilly Boes. Introduction to the Theory of Statistics. Pgs. 3-5. 18ysieldadoesjusto2, losseisresultadossonigualmenteprobables,esdecirqueporla naturalezadel proceso, porsusimetra, todaslascarastienenlamismaoportunidadde aparecer. Ahora se quiere la probabilidad de que el resultado de un lanzamiento sea un nmero par. Tres de los seis posibles resultados tienen este atributo. La probabilidad de que un nmero par aparecer cuando el dado es lanzado es 3/6 1/2. Similarmente, la probabilidad que un cinco aparecer cuando un dado es lanzado es 1/6. La probabilidad que el resultado de un lanzamiento ser mayor que 2 es 2/3. Deestemodo, setienedemanera ms general que, si losnresultados de un fenmeno aleatorio son mutuamente excluyentes e igualmente probables y si n(A) de estos resultados presentan el atributo A, entonces la probabilidad de A es la proporcin n (A)/n. Debe notarse que por la interpretacin clsica, la probabilidad de A es un nmero entre 0 y 1(ambosinclusive). Laproporcin n(A)/ndebesermenorqueoiguala1, yaqueel nmero total de posibles resultados no puede ser menor que el nmero de resultados con un atributo especfico. Si es seguro que un suceso ocurra, su probabilidad es 1; si es imposible queocurra, suprobabilidadescero. De esta manera, la probabilidad de obtener un 7 al lanzar un dado es 0. La probabilidad que al lanzar un dado se obtenga un nmero menor que 8 es igual a 1. Las probabilidades determinadas por la definicin clsica son llamadasprobabilidades a priori, debido a que se llega al resultado solamente por razonamiento deductivo. Hay algunas limitaciones en la interpretacin clsica: 1.No proporciona un mtodo sistemtico para asignar probabilidades a resultados que no sean igualmente probables. 19Por ejemplo, es lanzada una moneda sabiendo que esta sesgada a favor de las caras, es decir, es ms probable que aparezca una cara que un sello. Los dos posibles resultados del lanzamiento de la moneda no son igualmente probables3. Cul es la probabilidad de cara? La definicin clsica no tiene la posibilidad de ayudar aqu. 2. Hay otra dificultad cuando a la interpretacin clsica se le hacen preguntas como: Cul es la probabilidad de que nazca un varn en Barinas? Cul es la probabilidad de que un hombre muera antes de los 50 aos? Cul es la probabilidad de que una persona se case? Todasestas sonpreguntas legtimas quesequierentraer al campodelateorade probabilidad. Sin embargo, las nociones de simetra, igualmente probable, etc., no pueden ser utilizadas como lo son en los juegos de azar. 3. Otro inconveniente surge cuando los resultados del proceso no son finitos. Esto aparece muchasvecescuandoel nmeroderesultadosposiblesdel procesoesposiblemente muy grande. Por ejemplo, Cul es la probabilidad de que lleguen a una interseccin vial ms de 500 automviles entre las 12 PM y la 1 PM? Nota 1: Hayquetenercuidadoyponeratencinalascalificacionesdemutuamenteexcluyente, igualmenteprobablesyaleatorio. Supngasequesedeseacalcular laprobabilidadde obtener doscarassi unamonedaeslanzadadosveces. Pudierarazonarsequehaytres posibles resultados para los dos lanzamientos: dos caras, dos sellos o una cara y un sello. Unodeestostresresultadostieneel atributodeseado, esdecir, doscaras; Adems la probabilidad es 1/3. Este razonamiento es incorrecto ya que los tres resultados dadosno sonigualmenteprobables.Eltercer resultado, una cara y un sello, puede ocurrir de dos manerasdebidoaquelacarapuedeaparecerenel primerlanzamientoyel selloenel segundo; o la 2 Es decir, el dado es un cubo perfecto en el sentido de que es simtrico y no est arreglado para que alguna de sus caras tenga ms chance de ocurrir. 203 Esto se conoce con la expresin: la moneda no est balanceada, no es simtrica o no es justa 21carapuedeaparecerenelsegundo lanzamiento y el sello en el primero.As hay cuatro resultados igualmente probables: (cara, cara), (cara, sello), (sello, cara) y (sello, sello)4. El primero de estos tiene el atributo deseado, mientras los otros no. La probabilidad correcta esentonces1/4. El resultadodeberaser el mismosi dosmonedasbalanceadasfueran lanzadas simultneamente. Ahora, supngase que se desea calcular la probabilidad que una carta extrada de una baraja de bridge5 ser un as o una espada. En la enumeracin de los resultados favorables, pueden contarse 4 ases y trece espadas y se concluye que hay 17 resultados con el atributo deseado. Esto es claramente incorrecto ya que estos 17 resultadosno son mutuamente excluyentes debidoaqueel as deespadas es tantoas comoespada. Hay16resultados queson favorables a un as o una espada, as la probabilidad correcta es 16/52 o 4/13. Interpretacin Frecuentista de la Probabilidad (Probabilidad a Posteriori) En muchos problemas, la probabilidad de obtener algn resultado especifico de un proceso puede ser interpretado en el sentido de la frecuencia relativa con la que se obtendra ese resultado si el proceso se repitiera un nmero grande de veces en condiciones similares. Supngase que una moneda simtrica la cual parece estar bien balanceada fue lanzada 100 veces, los resultados fueron los siguientes: Tabla 1. Resultados obtenidos al lanzar una moneda 100 veces. ResultadoFrecuencia observada Frecuencia relativa observadaFrecuencia relativa esperada a largo plazo C560.560.50 S440.440.50 TOTAL10011 Obsrvese que la frecuencia relativa de caras esta cerca de 1/2. Esto era lo que se esperaba ya que la moneda era simtrica. Supngase ahora que un dado fue lanzado 300 veces, con los siguientes resultados: Tabla 2. Resultados obtenidos al lanzar un dado 300 veces. ResultadoFrecuencia observada Frecuencia relativa observada Frecuencia relativa esperada a largo plazo 1510.1700.1667 2540.1800.1667 3480.1600.1667 4510.1700.1667 5490.1630.1667 6470.1570.1667 TOTAL30011 Ntese ahora que la frecuencia relativa de la cara con 1 esta cerca de 1/6; de manera similar para 2, 3, 4, 5 y 6. Estos resultados no son inesperados, ya que el dado estaba balanceado; era de esperarse que cada cara ocurriera con aproximadamente la misma frecuencia en el largo plazo. Esto sugiere que se pueden usar las frecuencias relativas como una aproximacin para la probabilidad. En otras palabras, se supone que la proporcin de lanzamientos en los que se obtiene una cara en el lanzamiento de una moneda o de los nmeros de un dado se puede usar comounaaproximacindelarespectivaprobabilidad. Advirtasequeaunquelas frecuencias relativas de los diferentes resultados son predecibles, el resultado actual de un lanzamiento individual es impredecible. Enlosejemplosanteriorespuedeusarselainterpretacinclsicaolafrecuentistayse obtienen aproximadamente los mismos resultados. Esto se debe a que la moneda y el dado estn bien balanceados y son simtricos. Supngase ahora que la moneda no est balanceada, as que los dos casos: cara y sello, no son igualmente probables que ocurran. Aqu la definicin clsica no es til en la misin de encontrar el valor de una probabilidad. Entonces, podra utilizarse la interpretacin de la frecuencia relativa o posiblemente algn anlisis fsico de la moneda no balanceada. En muchas investigaciones cientficas, se toman observaciones las cuales tienen un elemento de incertidumbre o son impredecibles. Como un ejemplo, supngase que se quiere predecir, si al nacer un bebe en cierta localidad ser varn o hembra. Esto es individualmente un evento incierto, pero los resultados de grupos de nacimientos pueden ser satisfactorios. Se ha encontrado que existe una cierta regularidad a largo plazo, la cual es similar a la regularidad a largo plazo de la frecuencia relativa de una cara cuando una moneda es lanzada. Si por ejemplo es encontrado, examinando registros, que alrededor de 51% de los nacimientos en esta localidad son masculinos, este nmero puede ser tomado como una aproximacin a la probabilidad de que nazca un varn en esa localidad. Para hacer esta idea mas concreta, se asumir que una serie de observaciones pueden ser obtenidas bajo condiciones uniformes. Es decir, una observacin de un experimento aleatorioeshecha; entonceselexperimento se repiti bajo las mismas condiciones y se tomotra observacin. Esto se repite muchas veces, y mientras las condiciones son similares cada vez, hay una variacin incontrolable la cual es aleatoria, as que las observaciones son individualmente impredecibles. En muchos de estos casos las observacionescaendentrodeciertasclasesendondelasfrecuenciasrelativassonmuy estables. Esto sugiere que se postule un numero p, llamado la probabilidad del evento, y pseraproximadopor lafrecuenciarelativaconlacual las observaciones repetidas satisfacen el evento en particular. En la Figura 1 se muestran los resultados de efectuar en cinco oportunidades, el experimento de lanzar 150 veces una moneda balanceada y graficar el comportamiento de larespectivafrecuenciarelativadecara. Comoeradeesperarse, enloscincocasos, al principioexisteciertafluctuacinen las respectivas frecuencias relativas.A medida que aumenta el nmero de lanzamientos, esta frecuencia relativa se va estabilizando mostrando unatendenciaclarahacialafrecuenciarelativa0,5. Ntesequealgunas delas curvas tiendenmsrpidoa0,5queotras. Portanto, segnlainterpretacinfrecuentistadela probabilidad, p=0,5; que es el mismo valor delaprobabilidaddecara queseobtiene bajolainterpretacin clsica. Esta es una ilustracin de cmo se comporta la frecuencia relativa en el largo plazo6. Deestemodoparacalcular laprobabilidadpdequeunsucesoAocurra, serealizael experimentosucesivamentebajocondiciones similaresysevacontandoel nmerode veces que ocurre A. Sea n(A) el nmero de veces que ocurre el suceso A en las primeras n repeticiones. Entonces lafrecuencia relativade ocurrencia deAen las primerasn repeticiones del experimento viene dada por: La probabilidad de A es el lmite de este cociente, cuando n tiende a infinito, si este lmite existe:

Esta claro que las condiciones mencionadas son muy vagas para servir como base de una definicin cientfica de probabilidad. Por tanto, este criterio de la probabilidad a posteriori recibe varias crticas, entre las cuales se pueden mencionar las siguientes: 1. Se menciona unnmerograndede repeticiones de unproceso, peronohay una identificacin clara del nmero especfico que podra considerarse suficientemente grande. 2. Se afirma que la moneda debera ser lanzada cada vez en condiciones similares, pero estascondicionesnosedescribenconprecisin. Lascondicionesenlacual selanzala moneda no pueden ser completamente idnticas para cada lanzamiento porque entonces los resultadosseriantodosigualesyseobtendranslocarasoslosellos. Dehecho, una personaexperimentadapuedelanzar una moneda repetidamente y cogerla de tal manera que obtenga una cara en casi todos los lanzamientos. En consecuencia, los lanzamientos no deben ser completamente controlados sino que deben tener una caracterstica aleatoria. 13.Seasevera, adems, quelafrecuencia relativa de caras sera aproximadamente 1/2, peronoseespecificaunlmiteparalavariacinposiblerespectoal valor 1/2. Si una moneda fueselanzada1.000.000de veces,no se esperara obtener exactamente 500.000 caras. En realidad, sera muy sorprendente si se obtuvieran exactamente 500.000 caras. Por otro lado, tampoco se espera que el nmero de caras difiriera mucho de 500.000. 4. Otro inconveniente de la interpretacin frecuentista de la probabilidad es que slo puede utilizarse para un problema en el que pueda haber, al menos en principio, un nmero grande de repeticiones similares de cierto proceso. Muchos problemas importantes no son de este tipo. Por ejemplo,la interpretacin frecuentista de la probabilidad no puede ser aplicada directamente a la probabilidad de que un determinado conocido contraiga matrimonio en los prximos dos aos. Interpretacin Subjetiva de la Probabilidad De acuerdo con la interpretacin subjetiva o personal de la probabilidad, la probabilidad que una persona asigna a uno de los posibles resultados de un proceso representa su propio juicio sobre la probabilidad de que se obtenga el resultado. Este juicio estar basado en las opiniones e informacin de la persona acerca del proceso. Otra persona que puede tener diferentesopinionesoinformacindistintapuedeasignar unaprobabilidaddiferenteal mismo resultado. Por esta razn, resulta ms apropiado hablar de la probabilidad subjetiva que asigna cierta persona a un resultado, que de la verdadera probabilidad de ese resultado. Conel objetodequeunapersonaseacapazdeasignarprobabilidadessubjetivasalos resultados,debeexpresar sugrado de creencia en trminos numricos. La interpretacin subjetiva de la probabilidad puede ser formalizada, en general, si los juicios de una persona acercadelasprobabilidadesdediversascombinacionesderesultadossatisfacenciertas condiciones de consistencia. Entonces puede demostrarse que sus probabilidades subjetivas para los diferentes sucesos posibles pueden ser determinadas en forma nica. La interpretacin subjetiva tiene, sin embargo, dos dificultades: 1. El requisito de que los juicios de una persona sobre las probabilidades de un nmero infinitodesucesosseancompletamenteconsistentes ylibres decontradicciones no parece humanamente posible. 2. La interpretacin subjetiva no proporciona bases objetivas para que dos o ms cientficos que trabajan juntos obtenganuna evaluacin conjunta de suestadode conocimiento en un rea cientfica de inters comn. La evaluacin por un determinado cientfico de la probabilidad de algn resultado incierto debe ser, en ltima instancia, su propia evaluacin, basada en todas las evidencias de que dispone. Esta evaluacin puede estar parcialmente basada en la interpretacin frecuentista de la probabilidad, ya que el cientfico puede tener en cuenta la frecuencia relativa de la ocurrencia de este resultado o de resultados similares en el pasado. Tambin puede basarse parcialmente en la interpretacin clsica de la probabilidad, puesto que el cientfico puede tener en cuenta el nmero total de resultados posibles que considera igualmente probables. Sin embargo, la asignacin final de probabilidades numricas es responsabilidad del propio cientfico. La Teora de la Probabilidad y las Interpretaciones de Probabilidad La teora de la probabilidad y la estadstica se pueden desarrollar, sin considerar la controversia en torno a las diferentes interpretaciones del trmino probabilidad. Esta teora es correctaypuedeser aplicadatilmente, conindependenciadelainterpretacinde probabilidad que se utilice en un problema particular. Una vez asignadas las probabilidades a algunos resultados de algn proceso, todos los expertos estn completamente de acuerdo en que la teora matemtica de la probabilidad proporciona la metodologa apropiada para ampliar el estudio de estas probabilidades. Probabilidad de un eventoLas probabilidades se plantean con respecto a algn evento. El evento en cuestin puede ser que llueva, haya ganancias, caiga cara, se obtenga un rendimiento de por lo menos 6%, se termine el curso, se obtengan buenas calificaciones, entre otros.Las probabilidades pueden expresarse en mltiples formas, incluyendo decimales, fraccionesyporcentajes.Porejemplo,la posibilidad de lluvia se puede establecer como 20%,2 de 10,0.20, o bien 1/5.La probabilidad de que un evento ocurra est dada mediante un nmero que va de 0 a 1.La probabilidad de algn evento A, se representa por P(A), es un nmero que va del 0 al 1, y que indica cuan probable es la ocurrencia del evento A. Cuanto mas cerca se encuentre el nmero de uno (1), tanto mayor es la probabilidad de que dicho evento Aocurra; cuanto mas cercano sea el numero acero (0) menor es la probabilidad de que el evento A ocurra. A un evento imposible se le asigna una probabilidad 0, mientras que a un evento del cual se tiene la certezaque ocurrir se le asigna una probabilidad de 1.Espacio Muestral y EventosUno de los conceptos matemticos fundamentales, utilizados en el estudio de la probabilidadeselconjunto. Estees ungrupo deobjetos oelementos que tienenciertas caractersticascomunes. Por ejemplo, loshabitantesdeBarinas, losrosdel Municipio Pedraza, los estudiantes de la UBV-Barinas, entre otros.EspacioMuestral,eselconjunto detodos losresultadosposiblesde unexperimento o muestra. Vamos adenotaralEspacioMuestral conlaletraS. Tambinel espacio muestral se denota con la letragriega Omega().Evento, son los posibles resultados de un Experimento Aleatorio.Experimento Aleatorio, es todo aquel experimento que satisface los siguientes requerimientos: a. Puede repetirse un nmero ilimitado de veces bajo las mismas condiciones.b. Esposibleconocerporadelantado todoslos posibles resultados aquepuedadar origen.c. No puede predecirse con exactitud el resultado en una realizacin particular de ese experimento.Ejemplos: Si lanzamos una moneda al aire, el resultado puede ser cara o sello, pero no sabemosdeantemanocual deellovaasalir. El procesodelanzamientodela moneda es un experimento aleatorio.Su espacio muestrales S = { cara, sello} Lanzamiento de un dado y registrar el numero de puntos que aparecen en el ladodearriba. El espaciomuestral es: S={1,2,3,4,5,6}. El experimentoes: lanzamiento del dado.Si el dado es un cubo simtrico y balanceado, entonces todos sus lados tienen la misma posibilidad de ocurrencia, es decir, sus probabilidades son: P(1) = P(2) = P(3) = P(4) P(5) = P(6)=1/6. Seacualquier eventoAdeeseexperimento, porejemplo, A: nmeropar, entonces A = { 2,4,6}, obsrvese que A tiene tres puntos muestrales, en consecuencia su probabilidaddeAvienedadapor: numerodeelementosdeAdivididopor nmerode elementos del espacio muestral S, es decir: P(A) = 3/6 = = 0.5 Por su dimensin un espacio muestral puede ser: finito, infinito numerable, infinito no numerable.La estadstica tiene dos objetivos inmediatos, describir e inferir, cuya finalidad es satisfacer un objetivo mucho mas exigente: predecir.La prediccin est relacionada de una manera indisoluble con las probabilidades, y aquel que no estudia los postulados de probabilidades para comprender profundamente su significado, no podr interpretar cabalmente los resultados de la estadstica.Es por esta razn que categricamente afirmamos que con la estadstica no se puede mentir. Vincular a la estadstica, en tanto que disciplina matemtica, con la capacidad de manipulacin para engaar, es tan osado como acusar al espaol, como lenguaje verbal, de herramienta susceptible de ser usada para decir mentiras. Es slo la falta de informacin de un individuo lo que faculta a otro para engaarlo, con o sin intencin, tanto con letras como con nmeros.Operaciones con eventos:Tratndoseloseventos desubconjuntosdelespaciomuestral,esnatural que satisfagan todaslas caractersticas de los conjuntos. Sean A y B dos eventos pertenecientes a un espacio muestralS. La interseccin, que se denotaB A , es el evento que consta de todos los resultados en S que pertenecen tanto a A como a B. Por tanto, la interseccinB A ocurre si y slo si tanto A como B ocurren.De manera ms general, dados k eventos A1, A2, ..., Ak, su interseccin kA A A 2 1 es el conjunto de todos los resultados bsicos que pertenecen a todo Ai (i = 1, 2, ..., k) Launin,quese denota B A ,es elevento queconsta detodos losresultadosenS que pertenecen al menos a uno de estos eventos. Por lo tanto, la uninB Aocurre si y slo si A y/o B ocurren.Demaneramsgeneral, dadoskeventosA1,A2,..., Ak, suuninkA A A 2 1esel conjunto de todos los resultados que pertenecen al menos a uno de estos k eventos. ElcomplementodeA(conrespectoal espaciomuestralS), queserepresentaporcA(dependiendo de la literatura tambin se usa A A), es el evento que consta de todos los resultados pertenecientes aS pero no a A.Definiciones complementarias: Si A y B no tienen puntos muestrales en comn se denominan excluyentes y su interseccin A B es el conjunto vaco , lo que significa que A B no puede ocurrir.De manera ms general, dados k eventos A1, A2, ..., Ak, se dicen mutuamente excluyentes si cada par de estos eventos es excluyente, es decir j iA A para todo i j. Dados k eventos E1,E2,..., Ek en el espacio muestral S, si su unin E1 E2 ... Ek = S se dice que estos k eventos son colectivamente exhaustivos.Ejercicios1. Losartculosprovenientesdeunalneadeproduccinseclasificancomodefectuososono defectuosos. Se observan los artculos y se anota su condicin. Este proceso se contina hasta que se produzcan dos artculos defectuosos consecutivos o se verifiquen cuatro artculos, lo que ocurra primero. Describir el espacio muestral para este experimento aleatorio.2. Considrensecuatroobjetos, a, b, cyd. Supngasequeel ordenenel cual seanotanesos objetos representa el resultado de un experimento. Sean los eventos A = {a est en el primer lugar} y B = {b est en el segundo lugar}.a. Describir el espacio muestral.b. Describir todos los elementos de los eventosB AyB A .3. Considerando el espacio muestralS = {a, b, c}, construya todos los eventos posibles.4. Sean A, B y C tres eventos asociados con un experimento. Expresar las siguientes proposiciones verbales en notacin de conjuntos. Puede ayudarse con diagramas de Venn.a. Al menos uno de los eventos ocurre.b. Exactamente uno de los eventos ocurre.c. Exactamente dos de los eventos ocurren.Desarrollo Axiomtico de las ProbabilidadesEl desarrollo terico anterior se ha efectuado con la finalidad de plantear formalmente el siguiente problema: si A es un evento asociado con el experimento aleatorio E y el espacio muestralS , no podemos indicar con certeza, en principio, si A ocurrir o no.Surge entonces la siguiente pregunta: cmo podemos asociar un nmero con el evento A que mida de alguna manera la posibilidad de que A ocurra?Para ello vamos a estudiar a fondo un modelo de pensamiento que utilizamos constantemente sin importar nuestra cultura probabilstica.Supongaqueserepite nveces el experimentoaleatorioE. SeanAyBdos eventos relacionados con E. Sean nA y nB el nmero de veces que A y B ocurren respectivamente en las n repeticiones.Frecuencia Relativa: para el evento A se define como nnfAA .Propiedades de la frecuencia relativa:1. 1 0 Af2. 1 Afsi y slo si A ocurre en cada una de las n repeticiones de E.3. 0 Afsi y slo si A no ocurre nunca en las n repeticiones de E.4. Si A y B son eventos mutuamente excluyentes entonces B A B Af f f + 5. Regularidad estadstica: la frecuencia relativa Af tiende a estabilizarse en cierto valor (que luego bautizaremos como P(A)) a medida que el nmero de repeticiones de un experimento aumenta.Ejemplo: Lanzamiento de una moneda.Sea E = lanzamiento de una moneda. El espacio muestral es S = {C,S} y consideremos el evento A = {C}.Observemos esta realizacin particular del experimento, repetido varias veces:n 1 2 3 4 5 6 7 8 9 10 11 12 13 nA0 0 1 1 2 3 4 5 6 6 6 6 7 fA0 0 0.330.250.2 0.5 0.570.620.660.6 0.550.5 0.54Esta frecuencia relativa aparece graficada a continuacin:Frecuenciarelativaenel lanzamientodeunamoneda00,10,20,30,40,50,60,70,80,911 2 3 4 5 6 7 8 9 10 11 12 13LanzamientoFrecuencia relativaVamos a usar las propiedades de la frecuencia relativa como esquema para las condiciones que le exigiremos que cumpla a una medida de la posibilidad de que un evento ocurra.ProbabilidadConsideraremos la probabilidad como el lmite de la frecuencia relativa, de forma tal que se convierte en una funcin que va del espacio de todos los eventos posibles al conjunto de los nmeros reales en el intervalo entre 0 y 1 inclusive:Anf A Plim ) (SeaEunexperimentoaleatorioy S un espacio muestral asociado a ste.Considerado como el lmite anterior, la probabilidad es una funcin que asigna a cada evento A de Sun nmero real denotado por P(A) y llamado probabilidad de A, que satisface las siguientes propiedades:1.1 ) ( 0 A P2. P(S ) = 13. Si A y B son mutuamente excluyentes entonces P(A B) = P(A) + P(B)4. (terico) Si cada par de eventos de la secuencia infinita E1,E2,..., Ek,..., es mutuamente excluyente, entonces

,`

.|1 1) (ii iiA P A PLos anteriores se conocen como Postulados de Probabilidades, si bien, debido a que en la prctica slo aparecen los tres primeros, esos son los mas conocidos en la literatura bsica.Hastaahora hemospostulado laexistencia de P(A) y las propiedades que debe cumplir, pero no hemos indicado una forma de obtener en la prctica una funcin P que satisfaga las propiedades. A partir de este momento vamos a establecer suposiciones que conduzcan a un mtodo vlido para evaluar probabilidades.Vamos a iniciar el trabajo suponiendo que el experimento E tiene slo un nmero finito de elementos, y bajo supuestos adicionales muy simples (y verificables) vamos a construir una P(A) vlida.Caracterizacin deP(A) bajo un EspacioMuestralFinitoSuposicin: espacio muestral finito, es decir S = {a1,a2,..., ak}Definiremos como evento elemental ( simple, resultado elemental) al evento constituido por un slo resultado, es decir Ai = {ai} para i = 1,,k.Asignamos un nmero pi a cada Ai mediante P(Ai) = pi tal que:1.0 ip2.11 + +kp p Estosnmerossonconsistentes, por definicin,con los postulados de probabilidades,lo cual se puede verificar fcilmente.As, } , , {1 rj ja a A parak r 1entoncesr r rj j j j j j j j jp p p A P A P A P A A A P A P + + + + + + 2 1 2 1 2 1) ( ) ( ) ( ) ( ) (Ahora vamos a darle valores a los piSuposicin: resultados equiprobables o igualmente probables.Si los k resultados son equiprobables entoncesi i i i kkp p p p p p p + + + + + + 2 11Lo cual implica que kpi1 para i = 1,,k.As, si consideramos el evento A definido anteriormente, krA P ) (Estaformadepensarnosllevaalaconocidafrmuladecasosfavorablesentrecasos totales para calcular probabilidades. Formalmente se escribe:S de puntos de nmeroA en S de puntos de nmeroA P ) (Tcnicas de ConteoDefiniciones previas:Elnmero deposiblesordenacionesde x objetos es x! = x(x-1)(x-2)...(2)(1), es decir el producto de todos los nmeros inferiores a x. Este nmero se lee x factorial.Regla m x n:La regla del producto se aplica a situaciones en las que se busca un nmero de maneras distintas que las que se pueden formar pares de objetos, en donde los objetos se seleccionan de dos grupos distintos.Este principio se conoce tambin como regla de multiplicacin regla m por n.Permutaciones:Elnmerodepermutacionesdenobjetostomadosdekenkeselnmerodeposibles ordenaciones cuando k objetos han de ser seleccionados de un total de n y dispuestos en orden. Este nmero se calcula por la frmula )! (!k nnP Pk nnk y se lee permutaciones de n en k. En realidad se trata de una extensin de la regla m x n.Combinaciones:El nmero de combinaciones de n objetos tomados de k en k es el nmero de subconjuntos de tamao k que se pueden formar de un conjunto de n elementos. Este nmero se calcula por la frmula )! ( !!! k n knkPCk nk n y se lee combinaciones de n en k. Generalmente se aplica en situaciones en las que el orden no es importante.MuestreoMuestra al azar:Supongamos que tenemos n objetos. Escoger al azar k objetos entre los n objetos originales ( n k 0 ) significa que cada subconjunto de tamao k tiene la misma probabilidad de ser elegida que cualquier otro subconjunto.Muestreo con reemplazo ( o con reposicin):Consiste en seleccionar un objeto de una coleccin y devolverloa la misma despus de anotar su caracterstica de inters.Muestreo sin reemplazo (o sin reposicin):Consiste en seleccionar un objeto de una coleccin sin devolverlo a la misma despus de anotar su caracterstica de inters.Enprincipio, alefectuarunmuestreoconreemplazoelespaciomuestral nocambia, de forma que en caso de seleccionar otra muestra posteriormente, las probabilidades originales no cambian. En cambio en el muestreo sin reemplazo el espacio muestral se modifica, y con el se modifica tambin la probabilidad.Ejercicios1. Uncandadodecombinacinabreslocuandolacombinacincorrectadelos tres dgitosesseleccionada. Cadadgito puede sercualquiernmeroentre0 y9. Si una combinacin particular de dgitos representa a un punto muestral, cuntas puntos se estn utilizando para definirlo?2. El presidente,vicepresidente,secretario y tesorero de una determinada asociacin, se elegirn de entre 10 candidatos. Encuentre el nmero de maneras distintas en que estos puestos pueden ocuparse.3. Un experimento consiste en asignar 10 trabajadores para 10 tareas distintas (un trabajador por tarea y viceversa). De cuantas maneras se pueden asignar las 10 tareas a los 10 trabajadores?4. Si seseleccionunamuestrade10enfermeras deuntotal de90deunhospital, cuntas posibles muestras haba?5. Si se seleccionan cinco cartas con reposicin (esto es, se selecciona al azar la primera y seregresa alconjuntodecartas, etc.) de un mazo de 52 cartas, cuntas selecciones posibles hay?6. Para el ejercicio anterior suponga que no hay reposicin. Cuntas selecciones posibles hay?7. En un departamento con 18 empleados, se debe efectuar una reduccin de un tercio del personal. Si todos los empleados tienen igual desempeo, de cuntas formas se pueden elegir los grupos de despidos?8. Enunahabitacin25personastieneninsigniasnumeradasdel 1al 25. Seeligen5 personas al azar y se les pide que dejen la habitacin inmediatamente y se anotan los nmeros de sus insignias.a. Cul es la probabilidad de que el nmero menor de las insignias sea 7?b. Cul es la probabilidad de que el nmero mayor de las insignias sea 7?c. Cul es la probabilidad de que los nmeros de las cinco insignias estn comprendidas entre 9 y 21?Teorema de ProbabilidadSeanAyBdoseventos, yAcel complementario. Siempresesatisfacenlasfrmulas siguientes: P(Ac) = 1 P(A) P(B) = P(A B) + P(Ac B) P(A B) = P(A) + P(Ac B)Teorema de la suma de probabilidadesLa probabilidad de la unin de dos eventos cualesquiera A y B esP(A B) = P(A) + P(B) - P(A B)Probabilidad CondicionalDados dos eventos A y B, se define la probabilidad condicional de A dado B como) () () | (B PB A PB A P, siempre que P(B) > 0Similarmente se define ) () () | (A PB A PA B P, siempre que P(A) > 0Propiedades de la probabilidad condicional1. 1 ) | ( 0 B A P2. 1 ) | ( A S P3. A S A P ) | (4. ) | ( ) | (11B A P B A Pii iisi 0 j iA A para j i En general tenemos dos formas de calcular ) | ( B A P:a. Directamente, considerando la probabilidad de A respecto al espacio muestral S.b. Usandoladefinicin, donde) ( B A P yP(B) secalculanrespectoal espacio muestral original S.Regla del producto de probabilidadedsTambin conocido como Teorema de Multiplicacin, se puede ver como una consecuencia de la definicin de probabilidad condicional, indica que la probabilidad de la interseccin de dos eventos cualesquiera A y B es:P(A B) = P(A|B)P(B) = P(B|A)P(A)La generalizacin de esta regla para n eventos nos lleva a:) ( ) | ( ) | ( ) | ( ) | ( ) (1 1 2 2 1 3 2 1 1 1 1 1A P A A P A A A P A A A P A A A P A A Pn n n n n Independencia de EventosDados dos eventos A y B se dice que son independientes estadsticamente, o simplemente independientes, si y slo siP(A B) = P(A)P(B)En otras palabras, A y B son independientes si y solo si P(A|B) = P(A) siempre que P(A) sea diferente de 0 y tambin si P(B|A) = P(B) siempre que P(B) sea diferente de 0.En general n eventosnA A , ,1, se dicen independientes si y slo si P( nA A 1 ) = P(1A) P(2A) ... P( nA)Engeneralneventos nA A , ,1, se dicenmutuamente independientessi y slo si para cualquier valor k = 2, 3, 4, , n se tiene:P(ki iA A 1) = P(1iA) P(2iA) ... P(kiA)ParticinLos eventos nA A , ,1 conforman una particin del espacio muestral S si1. j iA A para j i 2. S Aini13.0 ) ( >iA P para todo iTeorema de BayesTeorema de Bayes para dos eventos:Dados los eventos A y B, entonces se cumple que ) () ( ) | () | (A PB P B A PA B P Teorema de Bayes para k eventos:Dados k eventos E1, E2, ..., Ek, mutuamente excluyentes y colectivamente exhaustivos, y otro evento A, entonces se cumple que) ( ) | ( ) ( ) | () ( ) | () () ( ) | () | (1 1 k ki i i iiE P E A P E P E A PE P E A PA PE P E A PA E P+ + ProbabilidadesBivariadasSupngase que al realizar un experimento los resultados puedan ser clasificados segn dos reglas de clasificacin diferentes. Por ejemplo, un grupo de personas puede ser clasificado por su edad y por su sexo.Sea un experimento aleatorio y A1, A2, ..., Ah y B1, B2, ..., Bk dos grupos de eventos donde los Aisonmutuamente excluyentes ycolectivamente exhaustivos, as comolos Bj. Estos grupos de eventos se denominan eventos bivariantes.Las probabilidades conjuntas son las que se obtienen mediante P(Ai Bj)Las probabilidades marginales son la que se obtienen mediante P(Ai) P(Bj)Los aspectos importantes deestaformadeclasificar los datos estenquefacilitael planteamiento de los problemas donde hay dos formas de clasificar los resultados.Las tablas de frecuencia que se arman previo al clculo de probabilidades se conocen como tablas de contingencia. Cuando las frecuencias son sustituidas por probabilidades se habla de las probabilidades bivariadas o bivariantes.Si a las reglas de clasificacin las llamamos atributos AyBrespectivamente como representantes de cada uno de sus grupos de eventos mutuamente excluyentes y colectivamente exhaustivos, decimos que dichos atributos sonindependientessi todo evento Ai es independiente de todo evento Bj.Ejercicios:1. Un estudio sobre los estudiantes de la Universidad X revel que el 20% fuma. La probabilidad de enfermedad pulmonar, si una persona fuma es diez veces mayor que la probabilidad de quese enferme del pulmn si nolohace. Si la probabilidad de enfermedad pulmonar es de 0.014 en nuestro pas, cul es la probabilidad de que un estudiante de la Universidad X sufra enfermedades pulmonares si fuma?2. Supongamos que lanzamos dos dados. Se definen los eventos de la manera siguiente:A = {el primer dado muestra un nmero par}B = {el segundo dado muestra un nmero impar}C = {ambos dados muestran nmeros pares nmeros impares}Halle la probabilidad de cada evento, de cada par de eventos y de la interseccin de todos los eventos. Los eventos son mutuamente independientes?3. Cada vez que se realiza un experimento, la ocurrencia de un evento particular A es igual a 0.2.Elexperimento se repite,independientemente,hasta que A ocurre. Calcular la probabilidad de que sea necesario ejecutar un cuarto experimento.4. Unconjunto electrnicoconsta de dos subsistemas, digamos A y B. A partir de una serie de pruebas previas, se presuponen las siguientes probabilidades:P(A falle) = 0.20 P(slo B falle) = 0.15P(A y B fallen) = 0.15Calcular las probabilidades siguientes:a. P(A falle | B haya fallado)b. P(A falle solamente)5. En la fabricacin de cierto artculo se presenta un tipo de defectos con una probabilidad de 0.1 y defectos de un segundo tipo con probabilidad de 0.05. Suponiendo independencia entre los tipos de defectos, calcule la probabilidad de:a. Un artculo no tenga ambas clases de defectos.b. Un artculo sea defectuosos.c. Suponiendo que un artculo sea defectuoso, tenga slo un tipo de defecto6. Tres componentes de un mecanismo, digamos C1, C2 y C3 estn colocados en serie (en una lnea recta). Supngase que estos mecanismos estn agrupados en orden aleatorio. Sea R el evento {C2 est a la derecha de C1}, y S el evento {C3 est a la derecha de C1}. Los eventos R y S son independientes?Ejercicios1. Suponga que se tira un dado no cargado una sola vez. A) Cul es la probabilidad de obtener un par?. B) Cul es la probabilidad de obtener un nmero mayor que 4?. Sol: (a) 3/6, (b) 2/6.2. Se lanza una vez un par de dados no cargados, a) cul es la probabilidad de que la suma de los dos nmeros sea 2 (b) sea 7?,(C) sea 11?. Sol: (a) 1/36, (b) 6/36, (c) 2/36.Endeterminadogrupohay20estudiantes, 7 son chicasrubias de ojosazules,4 tienen cabello castao y ojos azules, 5 son muchachos rubios de ojos azules y los 4 restantes son muchachos de cabello castao y ojos cafs. Si se selecciona un estudiante al azar: a) cul es la probabilidad de que el estudiante elegido sea una chica (b) que tenga ojos azules?, (c) que tenga cabello castao?, (d) que sea rubia y tenga ojos cafs?. Se supone que los 20 estudiantes estn numerados en algn orden especfico. Sol: (a) 11/20, (b) 16/20, (c) 8/20, (d) 0.3. Una caja contiene 7 fichas rojas y 3 blancas; si se sacan tres fichas de la caja una despus de la otra sin reemplazo, encontrar la probabilidad de que la dos primeras sean rojas y la otra blanca. Sol: 7/40.4. Trescartassonsacadasenformaaleatoriasinreemplazodeunjuegodecartas ordinarias. Cul es la probabilidad de que todas las cartas sean reyes?.Sol: 4/22.100.5. Cuntas manos diferentes de5naipes puedendarseconunjuegodebarajas ordinarias?. Sol: 2.598.960.6. Si de una caja se sacan al azar 4 bolas rojas y 2 blancas y se colocan en una hilera; (a) cul es la probabilidad de que la de los extremos sean blancas?. (B) de qu no sean blancas?. (C) de qu las dos blancas estn juntas?. Sol: (a) 1/15, (b) 14/15, (c) 240/720.7. Una ensambladora de partes elctricas usa motores de dos orgenes; de una compaa A, que le suministra el 90% de los motores y de una compaa B, que le suministra el otro 10% de los motores. Supngase que es conocido que, el 5% de los motores suministrados por la compaa A son detectados como defectuosos y 7% de lossuministradosporlacompaaBsondefectuosos. Laensambladoradepartes elctricas encontr un motor defectuoso. Cul es la probabilidad de que este motor sea suministrado por la compaa B?. Sol: 0,134653.8. Nos entregan tres cajas que contienen lo siguiente: Caja A contiene 3 bolas rojas y 5 blancasCaja B2 bolas rojas y 1 blancaCaja C2 bolas rojas y 3 blancas.Una caja es seleccionada aleatoriamente y se extrae una bola que resulta ser roja. Cul es la probabilidad de que provenga de la caja A?. Sol: 45/173.9. De cuntas maneras pueden ser colocados 10 automviles en u stock, si 3 de ellos son Fiat, 4 son Ford, 2 Toyota y 1 BMW?.Sol: 12.60010. De cuntas maneras pueden ser seleccionadas 4 personas provenientes de 5 parejas de casados, si la seleccin consiste de 2 damas y 2 caballeros?.Sol: 100.11. Se lanza un par de dados no cargados una vez, y se establece que los dos nmeros que aparecen no son los mismos. (A) Calcular la probabilidad de que la suma sea 7. (B) Calcular la probabilidad de que la suma sea 4. (C) Que la suma sea 12.Sol: (a) 1/5 (b) 1/15 (c) 0.12. Con base a su experiencia un mdico ha recabado la siguiente informacin relativa a las enfermedades de sus pacientes: 5% creen tener un virus infeccioso y lo tienen, 45% creentenerel virusynolotienen, 10%creennotenerel virusperoslotieneny finalmente 40% creen no tenerlo, lo cual es cierto. Hallar: (a) la probabilidad de que un paciente si cree tenerlo, (b) la probabilidad de que tenga virus si no cree tenerlo, (c) la probabilidad de que crea tener virus y no lo tenga y (d) la probabilidad de que crea tener el virus y s lo tiene.Sol: (a) 0,10 (b) 0,20(c) 0,53 (d) 0,3313. Cul es la probabilidad de encontrar solamente un 6 en el lanzamiento de un dado tres veces?.Sol: 75/216.Variables Aleatorias Discretas y ContinuasMuchas veces se desea resumir con un nmero el resultado de un experimento aleatorio. En muchos de los ejemplos relativos a experimentos aleatorios que han sido considerados hastaahora, el espaciomuestral esslounadescripcindelosposiblesresultados. En algunoscasostalesdescripcionessonsuficientes, peroenotrossehacetil asociar un nmero con cada resultado del espacio muestral. Es as como se llega a la definicin de variable aleatoria.Una variable aleatoria X es una funcin que asigna un nmero real a cada resultado en el espacio muestral S de un experimento aleatorio. El conjunto de los posibles valores de la variable aleatoria X se denomina rango. Diremos que la variable aleatoria es discreta si su rango es finito (o infinito contable).Variable aleatoria discretaUna variable aleatoria es discreta cuando puede tomar un nmero finito o infinito contable de valores, es decir que pueden ordenarse en secuencia.Ejemplos de variables aleatorias discretas: Nmero de hermanos de una persona seleccionada al azar Nmero de accidentes que ocurren en una autopista en un tiempo determinado Nmero de veces que se lanza una moneda hasta que aparezca la primera cara, etc.Variable aleatoria continuaUna variable aleatoria es continua cuando toma cualquier valor dentro de un intervalo de nmero reales.Ejemplos de variables aleatorias continuas: edad, estatura, peso, temperatura, ingreso, etc.Distribucin de probabilidad de una variable aleatoria discretaDiremos que la funcin p(x)=P(X=x) que va del conjunto de valores posibles de la variable aleatoria X al intervalo [0, 1] es la funcin distribucin de probabilidad para X si y slo si se satisfacen las siguientes propiedades:0 p(x) 1 , para todo x ( )x1 x p Se define la distribucin acumulada F(x) para la variable aleatoria X como F(x) = P(X x) = ( )x tt pEjemplo 1Experimento aleatorio: se lanza una moneda 3 vecesS = { ccc, ccs, csc, css, scc, scs, ssc, sss }Sea X :Nmero de caras observadasx 0 1 2 3p(x)81838381 La distribucin anterior es una distribucin de probabilidades para la variable aleatoria X, en efecto 0 p(x) 1 para todo x (x = 0, 1, 2 y 3) y adems ( )x1 x p. Para determinar la distribucin acumulada de probabilidad observe que P(X 0) = P(X = 0) = 81P(X 1) = P(X = 0) + P(X = 1) = 81 + 83 = 21P(X 2) = P(X = 0) + P(X = 1) + P(X = 2)= 81 + 83 + 83 = 87P(X 3) = P(X= 0) + P(X= 1) + P(X= 2) + P(X= 3) = 81 + 83 + 83 + 81 = 1 Se tiene entonces,x 0 1 2 3F(x)8121871Si X es una variable aleatoria, y el experimento aleatorio que determina el valor de X se repite muchas veces, entonces se obtiene una secuencia de valores para X. A partir de esta secuencia de valores se puede identificar el valor promedio o valor esperado de la variable aleatoria X, que denotamos ( ) X E, y se define en la forma siguiente:( ) X E = ( )xx xpPropiedades:a) E(k)=kb) E(kX)=kE(X)c) E(Xt Y)=E(X)t E(Y)d) E(g(X))=g(x)p(x) Para el ejemplo dado, ( ) X E=( )xx xp = ( ) ( ) ( ) ( ) 3 3 2 2 1 1 0 0 p p p p + + += 2381281. 383. 283. 181. 0 + + +A veces, el inters es determinar la variabilidad de la variable aleatoria. Definimos entonces la varianza de la variable aleatoria X, denotada ( ) X V, 2 mediante la siguiente ecuacin:V(X)=E[(X-E(X))2] y su forma reducida es:( ) X V = ( ) ( ) [ ]2E E X X2donde, ( )2X E = ( )x2x x pPara el ejemplo dado, ( )2X E = ( ) ( ) ( ) ( ) 3 3 2 2 1 1 0 02 2 2 2p p p p + + + =382481. 983. 483. 181. 0 + + + Entonces, ( ) X V = 4349 122332

,`

.|Propiedades de la Varianza:a) V(k)=0b) V(kX)=k2V(X)c) V(Xt Y)=V(X)+V(Y)si X y Y son independientesd)La desviacin estndar de la variable aleatoria X es la raz cuadrada positiva de la varianza, es decir, = ( ) X V.Modelos discretos de probabilidad:Distribucin BinomialUn ensayo Bernoulli, es un experimento aleatorio que slo admite dos posibles resultados, denotadosxitoyfracaso. Laprobabilidaddexitosedenotapylaprobabilidadde fracaso por q.Por lo tanto si denotamos el xito por 1 y el fracaso por 0 se tiene:P (1) = pP (0) = 1-p = qAdems se cumple:E (X) = p V(X) = pqUn proceso Bernoulli es un proceso en el cual se verifican las siguientes condiciones:El experimento aleatorio se repite n veces en idnticas condicionesHay slo dos posibles resultados en cada repeticin del experimento, llamados arbitrariamente xito y fracasoLa probabilidad de xito, denotada p, es la misma para cada repeticin (permanece constante entre repeticiones)lasn repeticiones del experimento aleatorio son independientes entre s.Consideremos ahora la variable aleatoriaX: Nmero de xitos observados enn repeticiones. Suponga que se quiere determinar la probabilidad de observarxxitos en n repeticiones; estoes, sedeseadeterminar P(X=x). Comoloimportanteesobservarx xitosennrepeticiones, el ordendeocurrenciadelosmismosesirrelevante; as, para contar decuntasformaspuedenobservarsexxitosennrepeticiones empleamos las combinaciones

,`

.|xn. Por otro lado, como lasnrepeticiones del experimento son independientesentres ycalcular P(X=x) equivaleacalcular laprobabilidaddeuna interseccin deeventos (en lasque cada evento corresponde a un xito o a un fracaso), tenemos que la probabilidad de un punto muestral cualquiera asociado al experimento es x n xq p; en definitiva:P(X = x) = n x q pxnx n x, ... , 2 , 1 , 0 para

,`

.| Dado que 1 0

,`

.| x n xq pxn y 1 q pxnx n x

,`

.|n0 x,resulta que unavariablealeatoriaXsedistribuyeBinomial conparmetrosnypsi sufuncionde probabilidad es: P(X = x) = n x q pxnx n x, ... , 2 , 1 , 0 para

,`

.|

En resumenX B ( n , p )se lee la variable aleatoria X se distribuye Binomial con parmetro n y p.O, la variable aleatoriaXtiene distribucin binomial si su funcin distribucin de probabilidad est dada por ( ) x p = '

,`

.|valores otrosx six n x0n q pxn, ... , 1 , 0Se puede demostrar que para una variable aleatoria con distribucin binomial ( ) X E = = n.p ( Valor esperado de X o esperanza matemtica de X ) ( ) X V = n.p.q ( Varianza de X )Ejemplo 1Una mquina fabrica una determinada pieza y se sabe que produce un 7 por 1000 de piezas defectuosas. Hallar la probabilidad de que al examinar 50 piezas slo haya una defectuosa.Solucin :Se trata de una distribucin binomial de parmetros B (50, 0'007) y debemos calcular la probabilidadp(X=1).Ejemplo 2La probabilidad de xito de una determinada vacuna es 0,72. Calcular la probabilidad de que una vez administrada a 15 pacientes:a) Ninguno sufra la enfermedadb) Todos sufran la enfermedadc) Dos de ellos contraigan la enfermedadSolucin :Se trata de una distribucin binomial de parmetros B(15, 0'72)Ejemplo 3La probabilidad de que el carburador de un coche salga de fbrica defectuoso es del 4 por 100. Hallar :a) El nmero de carburadores defectuosos esperados en un lote de 1000b) La varianza y la desviacin tpica.Solucin :Distribucin NormalSea una variable aleatoria X que toma todos los valores reales, y que posee una esperanza o mediayunadesviacinestndar . Esa variable tiene una Distribucin Normal o Gaussiana si su funcin de densidad de probabilidad es de la forma:( ) < <

,`

.| x , x21exp2 1f(x)22Los parmetrosy deben satisfacer las condiciones < < y0 > . Puesto que tendremos diversas ocasiones para referirnos a la distribucin anterior; utilizaremos la siguiente notacin: X tiene la distribucin N( )2 ,s y slo si su funcin de densidad est dada por la expresin anterior.El grfico de fse denomina Curva Normal, la cual es simtrica respecto a un eje vertical que pasa por el punto x = , donde ftoma su valor mximo. La forma de la curva es acampanada, positiva a lo largo del Eje X, creciente en( ) , y decreciente en ( ) ,. La curva no corta al Eje X, sino que es asinttica en ambos extremos.La posicin o localizacin de la curva vara con el valor de , y su forma cambia con el valor de .Mientras ms pequea sea la desviacin estndar (o dispersin con respecto a lamedia), ms altayesbeltaes lacurva; mientras ms pequeasealavarianzams achatada ser la curva.La denominacin que tiene esta distribucin viene del hecho de que al principio se consideraba que todos los fenmenos en su estado normal deban seguirla. Actualmente, esta se considera tan corriente como cualquier otro tipo de distribucin.reas bajo la Curva NormalLamayorpartedel readelacurvanormal seconcentraalrededor de. El grfico siguiente muestra que hay aproximadamente 68,26%del rea dentro del intervalo [ ] , + + , 95,45% del rea dentro del intervalo [ ] 2 , 2 + + , y 99,73% del readentrodel intervalo[ ] 3 , 3 + + . Nosepuedecalcularmsalldel ltimo intervalo ya que casi el 100% de los datos o valores est contenido all.El rea total bajo la curva normal y sobre el Eje X es la probabilidad total, la cual es igual a 1 o 100%.Estas consideracionesnumricasseconocenbajoel nombredelaReglaEmprica, lacual es mucho ms precisa que la Regla de Tchebyshev .Fig. 1Entre la media y una desviacin estndar por encima de la media, se encuentra el 34,13% detodos loscasos. Anlogamente, el 34,13% de todos los casos se encuentran entre la media y una desviacin estndar por debajo de la media.Dicho de otra manera, 34,13% del rea bajo la curva se encuentra entre la media y una desviacin estndar por encima de la media, y34,13%del rea est comprendida entre la media ymenos una desviacin estndar.Entre la media y dos desviaciones estndar por encima de la media, se encuentra el 47,72% de los casos. Anlogamente, por debajo de la media y menos dos desviaciones estndar se encuentran el 47,72% de los datos.Finalmente, entre la media y tres desviaciones estndar por encima de la media se encuentrael49,87%deloscasos.Anlogamente,el49,87% de los casos se encuentra entre la media y menos tres desviaciones estndar.Distribucin Normal Estndar y Estandarizacin de una Normal no estndarPara diferentes valores de ylos respectivos grficos son todos similares entre s ms alldesusparticularidadespropias. Lasrespectivasdistribucionesnormalessepueden reducir todas a una especial denominada Distribucin Normal Estndar.La funcin de densidad de esta distribucin asociada a cierta variable Z est dada por:( ) < <

,`

.| Z2Zexp21Z f2,Vemos que para esta distribucin la esperanza es = 0 y la varianza es= 1, por lo que la variable Z tiene la distribucin N(0,1).Unaporcindelasprobabilidadesquerepresentanreasdediferentestamaosbajola curva normal estndar se presentan en la siguiente tabla, donde aparecen los valores de Z a intervalos de 0,25 unidades de longitud, desde Z = 0 hasta z = 4.Funcin de Distribucin de una Curva Normal EstndarZ F(Z)0,00 0,000000,25 0,098710,50 0,191460.75 0,273371,00 0,341341,25 0,394351,50 0,433191,75 0,459942,00 0,477252,25 0,487782,50 0,493792,75 0,497023,00 0,498653,25 0,499423,50 0,499773,75 0,499914,00 0,49997Aqu F es la funcin de distribucin de f, y F(Z) es la probabilidad de que el resultado del experimento aleatorio sea mayor que cero (en este caso es la media = 0) y menor que Z.Para cualquier otra distribucin N( )2 ,de una variable X, con 0, 1 y funcin dedensidadXf, estasepuedeestandarizar si aplicamos el cambiodevariableZ= X , y por tanto:( )( )( ) z f12Zexp211 X21exp2 1X f222X

,`

.|

,`

.| Para cadavalorxqueasumeXse calcula el respectivo valorZque asumeZusando la esperanza y la desviacin estndar de X, se revisa la tabla de la curva normal estndar, y as se ubica el valor del rea del grfico de Xf que sea anterior a x.Ahora, al transformar los datosXde una variable normalmente distribuida en datos estandarizadosZ, enrealidadexpresamos estos datos enunidades delacurvanormal estndar.La importancia de esta transformacin radica en que podemos expresar cualquier dato que provenga de una distribucin normal como un valor porcentual.Adems, puesto que los datos estandarizadoszrepresentan nmeros abstractos (adimensionales) en oposicin a las unidades concretas de los datos, podemos comparar la posicin de un dato en una variable con su posicin en una segunda variable.Puesto que cualquier forma de curva normal puede ser convertida en la forma de la curva normal estndar, estaeslanicaqueserequiereparaencontrarlaprobabilidaddeuna cierta rea bajo la primera curva.La Distribucin Normal como aproximacin de una distribucin discreta o continuaGeneralmente, el grfico poligonal de una distribucin discreta de probabilidad tiende a ser parecido al de una curva normal.A cada distribucin discreta de cualquier variable X con parmetros conocidos y , se le puede asociar una distribucin normal N( )2 , , y la funcindeprobabilidadfdefinida con dichos parmetros se asemeja bastante a la lnea poligonal en cuestin.Habindose mostrado la manera como toda distribucin normal se puede representar por medio de la distribucin estndar N(0,1), se puede definir la forma como toda distribucin discreta se asocia con aquella.En ese sentido, cada valor Pj de la funcin de probabilidad P de la variable discreta X puede ser relativamente aproximado en cada valor Xj mediante la siguiente frmula:Yj = n , , j ), f(Znj 1 Al graficar la distribucin{(X1, Y1), (X2, Y2),, (Xn, Yn)}uniendo esos pares con trazos curvos y no lineales, se obtiene un grfico muy cercano al de la funcin de probabilidad de la distribucin N( )2 , .Con el fin de entender mejor la frmula y facilitar posteriores clculos, para cada j = 1,, n tenemos que:n Nmero de datos de la poblacin X dj j Distancia entre el dato y la mediajYAltura del punto Xj en la curva normalZj = dj Normalizacin de la distancia djf(zj) Funcin de probabilidad de ZjBsicamente, la curva normal se construye de acuerdo con las alturas Y. Para X = se alcanza la altura mxima en esa curva ya construida, y la cual esY0= ( )21n0 fn fn ,`

.| . As como a ambos lados de z = 0 se ubica el 50% del rea total de la curva fde la distribucin N(0,1), tambin a ambos lados de Y0 se ubica el 50% del rea total de la curva normal de la distribucin N( )2 , .Ejemplo 1:Supongamos que Xindica el monto de ingresos de 10.000 trabajadores de PDVSA, cuyo promedio mensual de ingreso es $500 y la desviacin estndar es $100.Vamos a construir una curva normal.Aqu n = 10.000, = 500,= 100 y 100000 . 10 n= 100.Consideremos el intervalo [ ] 3 , + = [500, 800], y nos moveremos en este con pasos de tamao 50.As obtenemos un conjunto de puntos Xj, j = 1,, 7, el cual es {500, 550, 600, 650, 700, 750, 800} [500, 800]Usando los valores de la funcin de distribucin de la curva normal, y aplicando la frmula para hallar los valores de las ordenadas de la curva normal, obtenemos la siguiente tabla.X d = X Z = df(Z)f(Z)nY 500 0 0.0 0,39894 39,894550 50 0.5 0,35207 35,207600 100 1.0 0,24197 24,197650 150 1.5 0,12952 12,952700 200 2.0 0,05399 5,399750 250 2.5 0,01753 1,753800 300 3.0 0,00443 0,443Puesto que la curva normal es simtrica, la altura de la ordenada hacia el lado izquierdo de la media debe ser la misma que la del lado derecho de ese valor.Definimos RXj como aquel punto que est a la misma distancia de la media pero en direccin opuesta a Xj.Por ejemplo, para X2= 550 y RX2= 450, tenemos d2= RX2 = 450 500 = 50, Z2 = 10050 = 0,5 y f(Z2) = f(0,5) = f(0,5) = 0,35207, por lo que RY2 = 32,207 = Y2.As, los valores de las ordenadas para RX2= 450 y X2= 550, son los mismos puesto que ambos datos se encuentran a la misma distancia de la media.Ahora procedemos a dibujar la curva normal correspondiente.Fig. 2Comopuedeobservarse, estacurvatiene formaacampanada adems deser simtrica respecto a la media , es decir, es como si el segmento punteado fuese un espejo.Ejercicio:construyamos una curva normal igual que en el ejemplo anterior pero tomando la media en $600.Ejemplo 2:Supongamos que el ingreso mensual promedio de 10.000 trabajadores de PDVSA es $500 y la desviacin estndar es $100.Si la distribucin es normal, encontraremos el nmero de trabajadores que tiene un ingreso mensuala) Inferior a $500.b) Superior a $500 pero inferior a $600.c) Superior a $600.Antesdeusarlatabladereas de la curva normal, el valor de X debe ser transformado en Z = X .En este ejemplo, = 500 y= 100.Por otro lado, tengamos en cuenta queel100%delreadeladistribucinN(500, 100) est asociada al ingreso de 10.000 trabajadores, por lo que un rea menor representa menos trabajadores.a) El rea requerida es la inferior a X= 500, la cual es equivalente al punto z =100500 500 = 0.Debido a que la mxima ordenada Y0est localizada en el punto X= donde Z= 0, la regin ubicada a la izquierda de Y0 tiene un rea que representa el 0,5 o 50% del total del rea de la distribucin. Por lo tanto, el nmero aproximado de trabajadores que tiene un ingreso mensual inferior a $500 es 10.000 (0,5) = 5.000.b) Cuando X = 500 entonces Z = 0, y para X = 600 se tiene que Z = 1.El rea o probabilidad entre Z = 0 y Z = 1 es F(1) = 0,34134 o 34,134%.Por lo tanto, el nmero aproximado de trabajadores que tienen un ingreso mensual superior a $500 pero inferior a $600 es n F(1)= 10.000 (0,34134) = 3.413,4 3.414. Grficamente, el rea est representada por la regin sombreada.Fig. 3c) Para X = 600 tenemos Z = 1.La zona de inters es un intervalo donde z > 1, y esa rea est representada por la regin sombreada en el siguiente grfico.Fig. 4Para calcular esa rea procedemos de la siguiente manera: el rea por encima de Z = 0 es 0,5 o 50%, y el rea por debajo de Z= 1 es F(1)= 0,34134 o 34,134 %. Luego, el rea sombreada se obtiene de la diferencia 0,5 0,34134 = 0,15866 o 15.866%.As, el nmero aproximado de trabajadores que perciben un sueldo por encima de $600 es 10.000 (0,15866) =1.586,6 1.587.Ejemplo 3:Siguiendo con el ejemplo anterior, si = $400 y= $100, hallaremos la probabilidad (rea) de que los 10.000 trabajadores ganen entre $250 y $500. Dicha probabilidad es la suma del rea entre $250 y = $400 ms el rea entre = $400 y $500.El rea entre 250 y 400 se calcula como sigue:Cuando X = 250 entonces Z = 100400 250 = 1,5, y para X = 400 queda Z = 100400 400 = 0. Luego, el rea entre Z= 1,5 y z= 0 es la misma que el rea entre Z= 0 y Z= 1,5 debidoaque la curva normales perfectamente simtrica, y usando la tabla se tiene que parte del rea buscada es A1 = F(1,5) = F(1,5) = 0,43319.El rea entre 400 y 500 se calcula como sigue:Cuando X = 400 entonces Z = 100400 400 = 0, y para X = 500 queda z = 100400 500 = 1,0. Por la tabla, parte del rea buscada es A2 = F(1,0) = 0,34134.En consecuencia, el rea total buscada entre 250 y 500 es A1 + A2 = 0,43319 + 0,34134 = 0,77453 o 77,453%.Esto quiere decir que hay un 77,453% de que los 10.000 trabajadores de PDVSA ganen entre $250 y $500.Fig. 5Ejercicios :1) Hallar el rea bajo la curva normal tipificada:a) Entre Z = 0 y Z = 1,2 Sol: 0,3849b) Entre Z = -0,68 y Z = 0 Sol: 0,2517c) Entre Z = -0,46 y Z = 2,21 Sol: 0,6636d) Entre Z = 0,81 y Z = 1,94 Sol: 0,1828e) A la derecha de Z = -1,28 Sol: 0,89972) Si "rea" se refiere al rea bajo la curva normal tipificada, hallar el valor o los valores de Ztales que:a) El rea entre 0 y Z sea 0,3770 Sol: Z = 1,16b) El rea a la izquierda de Z sea 0,8621 Sol: Z = 1,09c) El rea entre -1,5 y Z sea 0,0217 Sol: Z = -1,695 y Z = -1,353) El pesomediode500estudiantes varonesdeunauniversidadesde68,5Kg. yla desviacintpicaesde10Kg. Suponiendoquelospesosestndistribuidosnormalmente, hallarel nmero de estudiantes que pesan:a) Entre 48 y 71 kg. Sol: entre 289 y 290 estudiantes.b) Ms de 91 kg. Sol: entre 6 o 7 estudiantes.4)Lamediadeldimetrointeriordeunamuestrade200lavadorasproducidasporuna mquina es 1,275 cm. y la desviacin tpica de 0,0125 cm. El propsito para el cual se han diseado laslavadoras permiteuna tolerancia mxima en el dimetro de 1,26cm. a 1,29 cm., deotraformalaslavadorasse consideran defectuosas.Determinar el porcentaje de lavadoras defectuosas producidas por lamquina, suponiendoquelos dimetros estn distribuidos normalmente.Sol: 23,02%5) Si X est distribuida normalmente con media 5 y desviacin tpica 2, hallar P (X > 8).Sol: 0,06686) Setieneunprogramador deentrenamientodiseadoparamejorar lacalidaddelas habilidades de los supervisores de la lnea de produccin. Debido a que el programa es auto administrativo, los supervisores requieren un nmero diferente de horas para terminarlo. Un estudio de los participantes anteriores indica que el tiempo medio que se lleva completar el programaesde500h. yqueestavariablealeatorianormalmentedistribuidatieneuna desviacin estndar de 100 h.a) Cul es la probabilidad de que un participante elegido al azar requiera ms de 500 h. paracompletar el programa?. Sol: 0,5b) Cul es la probabilidad de que un candidato elegido al azar se tome entre 500 h. y 650 h. para completar el programa de entrenamiento?. Sol: 0,4332c) Cul es la probabilidad de que un candidato elegido al azar se tome ms de 700 h. en completar el programa?. Sol: 0,0228d) Suponga que el director del programa de entrenamiento desea saber la probabilidad de que un participante escogido al azar requiera entre 550 y 650 h. para completar el trabajo requerido en el programa. Cunto ha de ser ese valor? Sol: 0,2417e) Cul es la probabilidad de que un candidato elegido al azar se tomar menos de 580 h. para completar el programa? Sol; 0,7881Teora de la Estimacin EstadsticaLa inferencia estadstica es el proceso de usar resultados muestrales para obtener conclusiones respecto a las caractersticas de una poblacin. En esta seccin estudiaremos los procedimientos estadsticos que permitan estimar dos parmetros de una poblacin: la media y la proporcin.Razn para estimarLos administradores utilizan las estimaciones porque se deben tomar decisiones racionales, sin que tengan la informacin pertinente completa y con una gran incertidumbre acerca de lo que pueda deparar el futuro, pero con la intencin de que las estimaciones constituyan una buena aproximacin de los parmetros desconocidos de la poblacin.EstimadorEs la regla o procedimiento, expresado en general por medio de una frmula, que se utiliza para deducir la estimacin.EstimacinEs un valor especfico observado de un estimador, por lo que asigna uno o varios valores numricos a un parmetro de una poblacin sobre la base de datos de muestra.Tipos de estimacina) Estimacin puntual: consiste en un solo estadstico muestral que se usa para estimar el valor verdadero de un parmetro de una poblacin que es desconocido.Por ejemplo, la media muestrales una estimador puntual de la media poblacional y la proporcin muestrales un estimador puntual de la verdadera proporcin poblacional p .Cuando usamos una estimacin puntual, sabemos que aunque usemos un mtodo bueno de estimacines prcticamenteimprobablequeel valor delaestimacincoincidaconel verdadero valor del parmetro, as que sera conveniente acompaar nuestra estimacin con algunamedidaquenospermitieraexpresarlacercanadelestimadoralparmetro. Una solucin a ello no los brindan los estimadores por Intervalos de Confianza.b) Estimacin por intervalo: es la estimacin de un parmetro de la poblacin dado por dos nmeros que forman un intervalo que contiene al parmetro con una cierta probabilidad.Conceptos bsicos.Nivel de ConfianzaEst asociado con la probabilidad de que el intervalo de confianza contenga al parmetro de la poblacin y es expresado en porcentaje. Los niveles de confianza que ms se utilizan son 90%, 95% y 99%.Interpretacin de los intervalos de confianzaUn intervalo de confianza se puede interpretar de dos maneras diferentes.Ejemplo: una directora de tiendas cree que el gasto medio de sus clientes en el ltimo ao se encuentra en el intervalo de 35 a 38 dlares y concede una confianza del 95% a ese intervalo.Intervalos de confianza para la media poblacional y la proporcin (muestras grandes)Con el objeto de mostrar cmo se construyen los intervalos de confianza, realizaremos la deduccin de uno de ellos. Para el resto de los intervalos el procedimiento es similar as que se darn slo las expresiones para el clculo de los mismos.Para la construccin de los Intervalos es necesario tener en cuenta la distribucin muestral de los estimadores de inters, as que diferenciaremos los casos de manera anloga a como lo hicimos para estudiar las distribuciones en el muestreo.I ) Intervalos de Confianza para la Media de una poblacin con varianza conocida.__________ ___________Ejemplo.1Se encuentra que la concentracin promedio de zinc que se saca del agua a partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro.Encuentre los intervalos de confianza de 95% y 99% para la concentracin media de zinc en el ro. Suponga que los datos siguen una distribucin normal con una desviacinestndar de 0.3.Comosepuedeobservarenlosresultadosdel ejerciciosetieneunerrordeestimacin mayor cuando el nivel de confianza es del 99% y ms pequeo cuando se reduce a un nivel de confianza del 95%Ejemplo 2Ejemplo 3Una empresa elctrica fabrica 3000 focos con una duracin aproximadamente distribuida de forma normal con una desviacin estndar de 40 horas. Si una muestra de 300 focos tieneunaduracinpromediode780 horas, encuentre un intervalo de confianza de 96% para la media de la poblacin de todos los focos que produce esta empresa.Solucin:En este caso la varianza de la poblacin es conocida, la poblacin es finita, as que:Ejemplo 4Un bilogo quiere estimar el peso promedio de los capibaras cazados en el estado Apure. Unestudioanteriordediezcapibaras cazados mostr que la desviacinestndardesus pesos es de 12.2 libras. Qu tan grande debe ser una muestra para que el bilogo tenga el 95% de confianza de que el error de estimacin es a lo ms de 4 libras?En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza en que m difiere en menos de 4 librasde.Ejemplo 5Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normalcon una desviacin estndar de 40 horas. De qu tamao se necesita una muestra si sedesea tener 95% de confianza que la media real est dentro de 10 horas de la media real?Ejemplo 3.61.Una legisladora estatal desea encuestar a los residentes de su municipio para conocer qu proporcin del electorado conoce la opinin de ella, respecto al uso de fondos estatales para pagar abortos, ella supone que el 50% del electorado conoce su opinin.Qu tamao de muestra se necesita si se requiere una confianza del 95% y un error mximo de estimacin de 0.10?Solucin:La proporcin de residentes que conoce la opinin de la legisladora es de 0.5, asque:Se requiere un tamao de muestra de 97 residentes para que con una confianza del 95% la estimacin tenga un error mximo de 0.10.Control de la anchura del intervaloEs evidente que si se estrecha el intervalo, se suministrar al investigador una estimacin ms exacta del valor del parmetro. Hay dos mtodos corrientes para estrechar un intervalo, pero para ambos se debe hacer un sacrificio adicional. Estos procedimientosson:a) Ajuste del nivel de confianza: por la propia naturaleza de los intervalos de confianza, si seaceptaunnivel deconfianzamsbajo, sepodragenerar unintervalomspreciso, menos amplio, pero eso aumenta la probabilidad de error.b) Ajuste del tamao de la muestra: el aumentar el tamao de la muestra disminuye el error esperado y es ms probable que se d una estimacin ms ajustada del valor verdadero del parmetro, conellosepuedeconservar unnivel deconfianzadeterminadoyal mismo tiempodisminuir laanchuradel intervalo; peroel sacrificioesunaumentoyaseade tiempo, del gasto, etc.; que se exige para recoger los datos para una muestra mayor.Contraste de Hiptesis1 La prueba de hiptesisy la estimacin son dos de las ramas principales de la inferencia estadstica2 El objetivo de la estimacin es obtener una aproximacin al valor de cierto parmetro de la poblacin y la finalidad de la prueba de hiptesis es decidir si una afirmacin acerca de una caracterstica de la poblacin es verdadera. 1Otros nombres de contraste de hiptesis utilizados en la bibliografa estadstica son: Prueba de hiptesis, docimasia de hiptesis, test de hiptesis, prueba de significacin. 2Estos Apuntes estnbasados principalmente en: Newbold, Paul.Estadsticaparalos Negocios y la Economa. Y en Stevenson,. W. Estadstica para Administracin y Economa. Ejemplo 1: Es posible desear determinar si afirmaciones como las siguientes son ciertas: 3 1. Un fabricante que produce cereales de desayuno afirma que, en promedio, el contenido de cada caja pesa al menos 200 gramos. Para verificar esta afirmacin, se pesa el contenido de una muestra aleatoria y se infiere el resultado a partir de la informacin muestral. 2. Una compaa recibe un gran cargamento de piezas. Slo puede aceptar el envo si no hay ms de un 5% de piezas defectuosas. La decisin de aceptar la remesa puede basarse en el examen de una muestra aleatoria de piezas. 3. Un profesor est interesado en valorar la utilidad de realizar regularmente pruebas cortas enuncursodeestadstica. Laasignaturaconsta de dospartes y elprofesorrealizaesta pruebasloenunadeellas. Cuandoacabael curso, comparalosconocimientosdelos estudiantes en las dos partes de la materia mediante un examen final y analiza su hiptesis de que las pruebas cortas aumentan el nivel medio de conocimientos. Los ejemplos propuestos tienen algo en comn. La hiptesis se formula sobre la poblacin, y las conclusiones sobre la validez de esta hiptesis se basan en la informacin muestral. Hiptesis Estadstica Es cualquier enunciado, teora, conjetura, tentativa, afirmacin que se haga sobre una o ms caractersticaspoblacionalescomounparmetro, ladistribucindeprobabilidaddeuna poblacin, etc. ____________________3 Newbold, Paul. Estadstica para los Negocios y la Economa. Pg. 281. Nunca se sabe con absoluta certeza la verdad o falsedad de una hiptesis estadstica, a no ser que se examine toda la poblacin. Esto, por supuesto, sera imprctico en la mayora de las situaciones. En su lugar, se toma una muestra aleatoria de la poblacin de inters y se utilizan los datos que contiene tal muestra para proporcionar evidencias que confirmen o no la hiptesis. La evidencia de la muestra que es inconsistente con la hiptesis planteada conduce a un rechazodelamisma, mientras quelaevidenciaqueapoyalahiptesis conduceasu aceptacin. De ah que el aspecto principal de la prueba de hiptesis sea determinar si la diferencia entre un valor propuesto de un parmetro poblacional y el valor estadstico de la muestra se debe razonablemente a la variabilidad del muestreo. O si la discrepancia es demasiadograndeparaserconsiderada de esa manera, lo cual en el argot estadstico es conocido como que la diferencia es significativa. Considrese la siguiente situacin: Se inspecciona una muestra de 150 productos de un enorme lote y se observa que el 7% de ellos est defectuoso. El proveedor de dichos productos garantiz que un porcentaje igual al 5%decualquier cargamentotendra defectos. La preguntaque sehabrdecontestar mediantelapruebadehiptesisessilainformacinproporcionadaporelproveedores verdadera. Si la proposicin realmente es cierta, Cul sera la causa del hecho de que una muestra sealara un 7% de partes defectuosas? Una posibilidad es que la causa sea la variabilidad delmuestreo.Siladecisindespus de efectuar el anlisis esaceptarla afirmacin del proveedor, significa que la discrepancia entre el porcentaje de productos defectuosos observadoenlamuestrayel porcentaje deelementos defectuosos propuestosedebe razonablementealavariabilidaddelmuestreo(alazar). Porelcontrario, ladecisinde rechazar la afirmacin del proveedor, significa que la diferencia entre el valor observado y el propuesto es demasiado grande como para deberse nicamente al azar. Hiptesis Nula (H0) Eslahiptesisqueseconsideracierta a no ser que se produzca suficiente evidenciaen contra, lo cual puede entenderse como mantener la hiptesis. Es la hiptesis que se plantea para juzgar si puede ser o no rechazada. En general, se enuncia como hiptesis nula lo que sevieneaceptando, creyendooasumiendocomoloquees ciertoconanterioridadal estudio. Hiptesis Alternativa (H1) Es la hiptesis que se plantea para oponerla a la hiptesis nula. Es un enunciado que ofrece una alternativa a la proposicin en H0, es decir, afirma que la proposicin en la hiptesis nula es falsa. Engeneral, se enuncia enH1lo que se presume que est sucediendo (actualmente) yque ha cambiado con respecto a loque se supona como verdadero (anteriormente). En la prctica, esta es la hiptesis de inters para el investigador debido a que representa generalmente la proposicin hipottica que l desea probar. Ejemplo 2: Supngase que una persona es llevada a juicio en un tribunal de justicia. Las hiptesis nula y alternativa son: H0: Es inocente H1: Es culpable Cuando la persona acusada es llevada ante un tribunal de justicia, en principio, goza de la presuncin de inocencia (toda persona es inocente hasta que se demuestre lo contrario). Como en la hiptesis nula se enuncia lo que se asume como cierto, en este caso H0:Es inocente. Por otra parte, en la hiptesis alternativa se plantea lo que se presume o se cree que es la situacin actual y que ha cambiado con respecto a lo enunciado en H0 y es lo que se quiere probar. De esta manera, debe plantearse bajo esta circunstancia que H1: Es culpable. Por lotanto, la acusacin debe presentar evidencia suficientemente clara como para conseguir un veredicto de culpabilidad. Puede darse el caso de que no se rechace que el enjuiciado sea inocente dado que no se han presentado suficientes evidencias. Enel contextodel contrastedehiptesis clsico, lahiptesis nulaseconsideracierta inicialmente. La tarea de persuadirnos de lo contrario corresponde a los datos de la muestra. Laaceptacindeunahiptesis nulaimplicatansloquelos datos delamuestrano proporcionan evidencia suficiente para rechazarla. Por otro lado, el rechazo implica que la evidencia muestral la refuta. Tipos de Hiptesis Nula y Alternativa Para hacer ms general la exposicin, se denotar por al parmetro poblacional de inters (por ejemplo, la media poblacional, la varianza o una proporcin) y por 0 para designar un valor que puede tomar el parmetro . Una hiptesis nula oalternativa, puede designar unnicovalor, llamado0, para el parmetropoblacional. Enestecaso, sedicequelahiptesisessimple. Lanotacin simblica para una hiptesis de este tipo esH0: = 0 que se lee La hiptesis nula es que el parmetro poblacional es igual al valor especfico 0. Por ejemplo, en la situacin de los productos defectuosos de un gran lote, el investigadorpodracomenzarelestudio con la hiptesis simple de que el porcentajede artculos defectuosos es igual a 5%. Una hiptesis tambin puede designar un rango de valores para el parmetro poblacional desconocido. Una hiptesis de este tipo se denomina compuesta y ser cierta para ms de un valor del parmetro poblacional. Por ejemplo, la hiptesis nula de que el peso medio de lascajasdecerealesesalmenos200gramosescompuesta. Lahiptesisesciertapara cualquier peso medio poblacional mayor o igual que 200 gramos. En muchas situaciones, se contrasta una hiptesis nula simple, digamos, H0: = 0, frente a una alternativa compuesta. En algunos casos, slo interesan alternativas a un lado de la hiptesis nula. Por ejemplo, podra quererse contrastar esta hiptesis nula frente a la hiptesis alternativa de que el verdadero valor de es mayor que 0, lo cual puede escribirse como:H1: > 0 Por el contrario, la alternativa de inters puede ser: H1: < 0 Las hiptesis alternativas de este tipo se denominanalternativas unilaterales. Otra posibilidadesquesequieracontrastar estahiptesisnulasimplefrentealaalternativa general de que el valor de es cualquiera distinto de 0, es decir: H1: 0 sta se conoce como alternativa bilateral. En resumen, se pueden tener las siguientes combinaciones de hiptesis nulas y alternativas: 1 1. H0: = 0 vs. H1: > 0 2 2. H0: = 0 vs. H1: < 0 3 3. H0: = 0 vs. H1: 0 4 4. H0: 0 vs. H1: > 0 5 5. H0: 0 vs. H1: < 0 6Obsrvese que en la hiptesis nula siempre se encuentra la posibilidad de la igualdad del planteamiento. Estosedebeaque, comosemencionanteriormente, lahiptesisnula inicialmente se considera cierta. Nota 1: La especificacin de las hiptesis nula y alternativa apropiadas depende del problema. Ejemplo 3: Para ilustrar estos conceptos, se considerarn los ejemplos enunciados al principio de estas notas: 1.Sea el peso medio poblacional (en gramos) de cereales por caja. La hiptesis nula es que esta media es al menos 200 gramos, luego se tiene la hiptesis nula compuesta: H0: 200 La alternativa obvia es que el verdadero peso medio es inferior a 200 gramos, es decir, H1: < 200 1 2. La compaa resuelve aceptar envos de piezas siempre que no tenga evidencia para sospechar que ms del 5% son defectuosas. Denotando por la proporcin poblacional de piezas defectuosas. La hiptesis nula aqu es que esta proporcin es como mucho 0.05, es decir,H0: 0,05.2Basndose en la informacin muestral, se contrasta esta hiptesis frente a la alternativa H1: > 0,05.La hiptesis nula, entonces, es que el cargamento de piezas tiene una calidad adecuada, mientras que la hiptesis alternativa es que no la tiene. 1 3. Supngasequelaconjeturadel profesor esquelarealizacindepruebascortas regularmente noproducediferencias en el promedio de las puntuaciones del examen final. Denotando por la diferencia entre las puntuaciones medias poblacionales para las dos partes del curso, conysinpruebas cortas regulares. Lahiptesis nulaes, entonces, una hiptesis simple:H0: = 0 Sin embargo, el profesor puede sospechar que posiblemente los controles produzcan un incremento en el promedio y, en consecuencia, querr contrastar la hiptesis nula frente a la hiptesis alternativa: H1: > 0 Despus de especificar las hiptesis nula y alternativa, y de recoger informacin muestral, debe tomarse una decisin sobre la hiptesis nula. Las dos posibilidades son no rechazar (aceptar) la hiptesis nula o rechazarla en favor de la alternativa. Con el fin de llegar a una deestas conclusiones,seadopta unaregla de decisin basada en la evidencia muestral. Ms adelante se estudiaran reglas de decisin concretas. Tipos de Errores que se pueden cometer en un Contraste de Hiptesis Si slo se dispone de una muestra de la poblacin, entonces el parmetro poblacional no se conocer con exactitud (Por qu?). Por consiguiente, no se puede saber con seguridad si la hiptesis nula es cierta o falsa. Por tanto, cualquier regla de decisin adoptada tiene cierta probabilidad de llegar a una conclusin errnea sobre el parmetro poblacional de inters. Existen dos tipos de errores que son inherentes al proceso de contraste de hiptesis: Error Tipo I: Consiste en rechazar la hiptesis nula (H0) cuando realmente es cierta Error Tipo II: Consiste en aceptar la hiptesis nula (H0) cuando realmente es falsa Si la regla de decisin es tal que P(cometer Error Tipo I ) = , es decir, la probabilidad de rechazar la hiptesis nula cuando es cierta es , entonces se llama nivel de significacin del contraste. Ntese que es una probabilidad condicional, P(Rechazar H0 / H0 es cierta) = Puesto que la hiptesis nula tiene que ser aceptada o rechazada, la probabilidad de aceptar la hiptesis nula cuando es cierta es (1 ), es decir, P(Aceptar H0 / H0 es cierta) = 1. Porotrolado, laP(cometerError Tipo II)= , es decir,la probabilidad de aceptar una hiptesis nula falsa se denota por . Tambin puede verse como, P(Aceptar H0 / H0 es falsa) = Entonces, laprobabilidadderechazar unahiptesisnulafalsaes(1), ysedenomina potencia del contraste. Visto como una probabilidad condicional, P(Rechaza H0 / H0 es falsa) = 1. En la Tabla 1 se resumen las situaciones posibles en un contraste de hiptesis al tomar la decisin sobre la hiptesis nula. Tabla 1.Situacin Real y decisiones sobre la hiptesis nula, con las probabilidades Asociadasa cada decisin, dada una determinado situacin real DECISIONES SOBRE LA HIPTESIS NULA SITUACIN REAL H0 VERDADERAH0 FALSA ACEPTAR H0 Decisin correcta Probabilidad = 1 Error Tipo II Probabilidad = RECHAZAR H0 Error Tipo I Probabilidad = Decisin correcta Probabilidad = 1 Ejemplo 4: Haciendo referencia al ejemplo del juicio, se aclararn estas ideas. Se tiene que determinar silapersonallevadaajuicioauntribunal dejusticiaesinocenteoculpable. Comose establecimsatrs, seconsidercomohiptesisnulael queestapersonaesinocente contrastndoseconlahiptesis alternativa dequees culpable. Cuandoladecisines tomada se est en presencia de las situaciones expuestas en la Tabla 1. Si el veredicto es que el acusado es declarado culpable, es decir, se rechaza H0, entonces estadecisinpuedeserlacorrectasi efectivamenteestapersonaesculpable. Oporel contrario, se puede estar ante la presencia de un Error Tipo I que en este caso significa que se est condenando a una persona inocente! Pero, si el veredicto declara que el acusado es inocente, en otras palabras, se acepta H0, esta puede ser la decisin correcta si ciertamente esta persona no cometi el delito. O se puede estar cometiendo un Error Tipo II, lo cual implica que se est declarando inocente a una persona que realmente es culpable! Ejercicio Cul de los dos errores anteriores es ms grave? Justifique su respuesta. Influencia de las Probabilidades y sobre una Prueba de Hiptesis Evidentemente, lo ideal sera que las probabilidades de los dos tipos de error fuesen lo ms pequeas posible. Sin embargo, hay una clara compensacin entre las dos. Cuando se ha tomadounamuestra, cualquier modificacindelaregladedecisinquehagamenos probable rechazar una hiptesis nula cierta, inevitablemente, se traducir en mayor probabilidad de aceptar esta hiptesis cuando es falsa. En otras palabras, cuando decrece, aumenta y viceversa. Supngase que se quiere contrastar, basndose en una muestra aleatoria, la hiptesis nula de que el verdadero peso medio del contenido de las cajas de cereales es al menos de 200 gramos: H0: 200. Dado un tamao muestral especfico, digamos n = 30 observaciones, se puede adoptar la regla de decisin de rechazar la hiptesis nula si el peso medio en la muestra es inferior a 185 gramos. Ahora, es fcil encontrar otra regla de decisin para la cual, la probabilidad de cometer un error de Tipo I es menor. Si se modifica la regla de decisin anterior para rechazar la hiptesis nula si el peso medio en la muestra es inferior a 180 gramos, se conseguir este objetivo. Sin embargo, hay que pagar un precio. Si se usa la regla de decisin modificada, ser ms probable aceptar la hiptesis nula, tanto si es cierta como si es falsa (Por qu?) Por tanto, al disminuir la probabilidad de cometer un error de Tipo I, se ha aumentado la probabilidad decometerunerrordeTipoII. La nica manera de disminuir simultneamente lasdos probabilidades deerror serobtener ms informacinsobrelaverdaderamediadela poblacin, tomando una muestra mayor. Habitualmente, lo que se hace en la prctica, es fijar la probabilidad de cometer un error de Tipo I a un nivel deseado, es decir, se fija el nivel de significacin . Esto determina, entonces, la regla de decisin adecuada, que a su vez determina la probabilidad de un error de Tipo II. Este procedimiento se ilustra en la Figura 2. Para ilustrar este procedimiento, considrese de nuevo el problema de contrastar, a partir de una muestra de 30 observaciones, si el verdadero peso medio de las cajas de cereales es al menos de 200 gramos. Dada una regla de decisin, se pueden determinar las probabilidades de los errores de Tipo I y de Tipo II asociadas al contraste. Sin embargo, en realidad, se procede fijando primero la probabilidad de error de Tipo I. Supngase, por ejemplo, que se quiere asegurar que la probabilidad de rechazar la hiptesis nula cuando es cierta sea como mucho0,05. Estosepuedeconseguir eligiendounnmero,k, apropiadoalareglade decisinrechazar lahiptesisnulasi lamediamuestral esinferior akgramos(ms adelanteseexplicarcmosepuedehaceresto). Unavezelegidoelnmerok, pueden calcularse las probabilidades del error de Tipo II usando los procedimientos que se expondrn ms adelante. As se puede observar que la regla de decisin queda determinada por el nivel de significacin elegido.4 1Nota 2: Al usar el criterio de fijar la probabilidad de error Tipo I, , para encontrar una regla de decisin; implcitamente se est considerando a este error ms grave que el error Tipo II. As, al fijar enunvalor pequeo, el investigador estcontrolando directamente la probabilidad de cometer un error Tipo I. Por tal razn, al plantear las hiptesis siempre hay que hacerlo tomando en cuenta esto ltimo, es decir, que rechazar la hiptesis nula cuando es cierta es un error ms grave que aceptar la hiptesis nula cuando es falsa. Terminologa adicional en el contraste de hiptesis Estadstico de Contraste (o de Prueba) Es aquella funcinde las observaciones muestrales que se usa para determinar si la hiptesis nula debe ser aceptada o rechazada. Regla de Decisin Unaregladedecisindefine lascondiciones que llevan a la aceptacin o rechazo de la hiptesis nula. Regin de Aceptacin Es un rango de valores, tal que si el estadstico de prueba queda dentro, la hiptesis nula se declara aceptable. Regin de Rechazo Es unrangoseparadodevalores, tal quesi el estadsticodepruebaquedadentro, la hiptesis nula se rechaza. Valor(es) Crtico(s) Los valores crticos son los nmeros que definen las fronteras de la regin de rechazo. Cmo establecer los valores crticos? Va a depender del: 1 1. nivel de significacin, . 2 2. tipo de distribucin de probabilidad del estadstico de contraste 3 3. tipo de hiptesis alternativa que se est contrastando (bilateral o unilateral) Los valores crticos pertenecen a la regin de rechazo. En la Figura 3 de forma ilustrativa se pueden apreciarlasregiones deaceptacin y rechazo, como tambin los valores crticos para las diferentes hiptesis alternativas. Nota 3: Los trminos aceptar (no rechazar) y rechazar son comnmente usados para las posibles decisiones sobrelahiptesis nulaenlos resmenes formales delos resultados deun contraste particular. Sin embargo, estos trminos no reflejan adecuadamente las consecuenciasdeunprocedimientoenel quesefijael nivel designificacinynose controla la probabilidad de un error de Tipo II. Como ya se ha sealado, la hiptesis nula tieneestatus dehiptesis mantenida,una hiptesis que se considera ciertasalvo que los datos contengan suficiente evidencia en contra. Adems, al fijar el nivel de significacin, generalmente en alguna probabilidad pequea, se est asegurando que el riesgo de rechazar una hiptesis nula cierta sea pequeo. Con esta estructura, una pequea cantidad de datos no ser suficiente para poderse colocar enposicinderechazarunahiptesisnula, aunqueseacompletamenteerrnea. Cuando aumenta el nmero de observaciones, es decir, aumenta el tamao de la muestra, tambin lo hace la capacidad de la tcnica de contraste para detectar una hiptesis nula falsa. Por tanto, al aceptar una hiptesis nula, no se est asegurando necesariamente, que haya mucho en sufavor. Unaafirmacinms precisasobrelasituacines los datos disponibles no proporcionan suficiente evidencia para rechazar la hiptesis nula en lugar de se acepta la hiptesis nula. Seseguirusandoaceptarcomounamaneraeficientedeexpresar estaidea, peroes importante tener en cuenta la interpretacin de la frase. La situacin es muy similar a la de un tribunal de justicia, donde el acusado, al principio, goza de la presuncin de inocencia, y la acusacin debe presentar evidencia contraria lo suficientemente clara como para conseguir un veredicto de culpabilidad. En el contexto del contraste de hiptesis clsico, la hiptesis nula se considera cierta inicialmente. La tarea de persuadir de lo contrario corresponde a los datos de la muestra.5 Casos Particulares A continuacin se introducir la metodologa del contraste de hiptesis clsico. Supngase que se dispone de una muestra aleatoria de n observaciones,X1,X2, ,Xn, proveniente de una poblacin con media y varianza 2. ( Tambinla varianza se denotaS2 )1. Contrastes para la Media Poblacional El objetivo es contrastar una hiptesis sobre la media poblacional desconocida. Asumiendo: Poblacin con distribucin normal Varianza poblacional, 2, conocida Se comenzar con el problema de contrastar la hiptesis nula de que la media poblacional es igual a cierto valor, 0. Esta hiptesis se representa: H0: = 0 Supngase que la hiptesis alternativa de inters es que la media poblacional supera este valor especfico, es decir,H1: > 0 Es natural que el contraste sobre la media poblacional, se base en la media muestral. En este caso particular, el investigador desconfiar de la veracidad de una hiptesis nula, frente a esta alternativa, si la media muestral observada fuese mucho mayor que 0. Laideaesbuscarla forma de uncontrasteconunnivel de significacin prefijado.digamosrepresentadaporlav. a. X, sedistribuye normalmente,X ~ N(,2).Por tal razn, la variablealeatoria ( v . a).

Cuando la hiptesis nula es cierta, es igual 0, y en consecuencia, la variable aleatoria

La variable Z de la ecuacin (1) es lo que se llamar Estadstico de Contraste en este caso particular. Ahora, se rechazar la hiptesis nula si la media muestral es mucho mayor que el va