estadis_2

140
 UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE CONTADURÍA Y ADMINISTRACIÓ N COORDINACIÓN DE MATEMÁTICAS ESTADISTICA II -- GUÍA DE ESTUDIO -- Tema: 1 Teoría elemental de l muestreo Presentación e introducción 1. Introducción al muestreo 2. Diferentes tipos de muestreo 3. Estimación de parámetro s Tema II. Distribuciones muestrales e intervalos de confianza para la media poblacional. 1. Distribución de muestreo de la media 2. Medición de la precisión de un estimado a través de la muestra. 3. Distribución de las dif erencias de las medias de dos muestras independientes. 4. Intervalos de confianza para la proporción. 5. Distribución de las diferencias de las proporciones de dos muestras independientes. 6. Determinación del tamaño de la muestra. Tema III. Prueb as de hipó tesis . 1. Etapas básicas en pruebas de hipótesis. 2. Pruebas de hipótesis según el tamaño de la muestra. 3. Pruebas de hipótesis para la media de una y dos poblaciones. Tema IV. Estadística no paramétrica. 1. Características de las pruebas no paramétricas. 2. La distribución JI cuadrada. 3. Pruebas de bondad de ajuste. 4. Tablas de contingencia. 5. Pruebas de los signos. 6. Prueba de rachas. Tema V. Análisis de regresión lineal.

Upload: ariadna-ortega

Post on 02-Nov-2015

19 views

Category:

Documents


0 download

DESCRIPTION

estadistica

TRANSCRIPT

  • UNIVERSIDAD NACIONAL AUTNOMA DE MXICOFACULTAD DE CONTADURA Y ADMINISTRACIN

    COORDINACIN DE MATEMTICAS

    ESTADISTICA II

    -- GUA DE ESTUDIO --

    Tema: 1 Teora elemental del muestreoPresentacin e introduccin1. Introduccin al muestreo2. Diferentes tipos de muestreo3. Estimacin de parmetros

    Tema II. Distribuciones muestrales e intervalos de confianza para la mediapoblacional.

    1. Distribucin de muestreo de la media2. Medicin de la precisin de un estimado a travs de la muestra.3. Distribucin de las diferencias de las medias de dos muestrasindependientes.4. Intervalos de confianza para la proporcin.5. Distribucin de las diferencias de las proporciones de dos muestras

    independientes.6. Determinacin del tamao de la muestra.

    Tema III. Pruebas de hiptesis.

    1. Etapas bsicas en pruebas de hiptesis.2. Pruebas de hiptesis segn el tamao de la muestra.3. Pruebas de hiptesis para la media de una y dos poblaciones.

    Tema IV. Estadstica no paramtrica .

    1. Caractersticas de las pruebas no paramtricas.2. La distribucin JI cuadrada.3. Pruebas de bondad de ajuste.4. Tablas de contingencia.5. Pruebas de los signos.6. Prueba de rachas.

    Tema V. Anlisis de regresin lineal.

  • 1. Anlisis de regresin simple.2. Mtodo de mnimos cuadrados.3. Inferencias relativas a la pendiente de la recta de regresin.4. Prediccin de un valor particular de y para un valor dado de x.5. Coeficiente de correlacin y coeficiente de determinacin.6. Examen

    Tema VI. series de tiempo.

    1. Anlisis de tendencia.2. Variacin cclica.3. Variacin temporal.4. Variacin irregular.5. Anlisis en predicciones.

    Introduccin.Prediccin1:

    El deseo de predecir el futuro es una caracterstica inherente al ser humano.No obstante, la necesidad de hacer predicciones fiables2 en los negocios vams all de la curiosidad. As por ejemplo:

    Las decisiones de inversin deben tomarse mucho antes de que unnuevo

    producto salga al mercado, por tanto es muy deseable tenerpredicciones sobre cmo ser la situacin del mercado en el futuroprximo.

    Para productos ya establecidos, hacer predicciones sobre las ventas acorto plazo es importante para establecer los niveles ptimos deacumulacin de inventarios y produccin.

    Para tomar una decisin sobre aumentar o no el nivel de pasivos de unaempresa, es importante predecir los tipos de inters en el futuro.

    1 Paul Newbold. Estadstica para los negocios y la economa. Editorial: Prentice Hall. P.p 42 fiable.1. adj. Dcese de la persona a quien se puede fiar, o de quien se puede responder; por ext., se aplica tambin a las cosas que ofrecenseguridad. (DRAE)

  • Para formular una poltica econmica razonable, los gobiernos necesitanpredicciones sobre cul sera el producto interno bruto (PIB) eldesempleo y la inflacin bajo varias polticas diferentes.

    Bsicamente, las predicciones de valores futuros suelen obtenerse a partir deldescubrimiento de regularidades en el comportamiento en el pasado. Por estarazn, es necesario disponer de datos sobre el comportamiento, tanto de lavariable a predecir, como de otras variables relacionadas. El anlisis de estainformacin puede sugerir tendencias en el futuro.

  • Toma de decisiones en un entorno de incertidumbre3.

    En cualquier tipo de negocio, deben tomarse constantemente decisionesen un entorno en el que la persona que debe decidir no conoce con seguridadel comportamiento futuro de los factores que podran afectar el resultado quese obtendra bajo varias opciones posibles a considerar. Por ejemplo:

    Cuando un fabricante presenta una oferta para un contrato, no estcompletamente seguro de los costos futuros que le ocasionar hacerfrente a su oferta. Es ms, tampoco conocer las ofertas de suscompetidores. A pesar de esta incertidumbre4, la decisin debe tomarse.Y

    Cuando un inversor decide cmo equilibrar su cartera de acciones,bonos y otros instrumentos financieros, no conoce los movimientosfuturos del mercado. Puede tener alguna idea sobre futuros desarrollos,pero no puede predecir con exactitud qu ocurrir.

    Estos ejemplos demuestran que, en los negocios, en el momento de decidirentre diferentes opciones, resultan de vital importancia las tcnicas para tratarla incertidumbre.

    En las presentes notas, veremos una serie de tcnicas tiles a la hora deanalizar informacin numrica. Su objetivo es ayudar a comprender losentornos con incertidumbre, de forma que puedan tomarse mejores decisiones.

    Por tanto, a pesar de que un anlisis tcnico profundo de la informacinnumrica ser, en ocasiones, de mucho valor, no se aprovechar al mximo sino se utiliza en combinacin con la experiencia que se obtiene de estudiar lascaracterstica del entorno en el que se trabaja. De hecho, los mtodosestadsticos resultan de mayor utilidad en la gestin5 cuando se combinan conla experiencia en el entorno de los negocios.

    3 Paul Newbold. Estadstica para los negocios y la economa. Editorial: Prentice Hall. P.p 44 incertidumbre.1. f. Falta de certidumbre; duda, perplejidad. (DRAE)5 gestin. (DRAE)Del lat. gestio, -onis.1. f. Accin y efecto de gestionar.2. [f.]Accin y efecto de administrar.de negocios.1. Der. Cuasi contrato que se origina por el cuidado de intereses ajenos sin mandato de su dueo.

    Hay que hacer hincapi, no obstante, en que estastcnicas son nicamente herramientas tiles parael administrador. No pretenden ser sustitutos dela familiaridad con el entorno que se consigue conaos de trabajo y experiencia, sino ms bienayudas para agudizar dicha familiaridad.

  • Captulo 1 Teora elemental del Muestreo.Presentacin e introduccin1. introduccin al muestreo2. diferentes tipos de muestreo3. estimacin de parmetros

  • Teora del muestreo6.

    La teora del Muestreo es de gran utilidad en muchos campos. Por ejemplo,hoy por hoy, todos sabemos que Vivimos7 en un mundo en el que la mayorade los pases hacen enrgicos esfuerzos para aumentar el nivel de vida de suspoblaciones, con el fin de lograr el desarrollo equilibrado se elaboran planesdetallados y se ejecutan en la medida de los posible. Para elaborar esos planesde una manera cientfica es necesario disponer de los hechos bsicos entrminos numricos para las diferentes regiones del pas y para ste como untodo.

    Los recursos de los pases pequeos no bastan para recopilar datos, ao trasao de cada persona, empresa o institucin. Por fortuna como sabemos ahora,no es indispensable incluir cada una de las unidades del universo para llegar auna cifra aceptable para el total.

    As, tenemos la aplicacin de los mtodos de muestreo a problemas prcticosque enfrentan los pases en desarrollo, lo que ha sido de igual importancia parala creacin de sistemas nacionales de Estadstica. Por lo general, esos pasesno tienen una tradicin larga de censos o de recopilaciones peridicas similaresque puedan usar como contexto de su muestreo. Por lo tanto, en esascondiciones la aplicacin de mtodos de muestreo que produzcan resultadosaceptables requiere de gran ingenio.

    Una muestra cuidadosamente diseada puede proporcionar la informacinnecesaria para establecer los lineamientos que requiere un pas8, a un costoque este ltimo podra muy posiblemente absorber.

    Es decir, la teora del muestreo se utiliza para estimar magnitudesdesconocidas de una poblacin, tales como la media y la varianza, llamadas amenudo parmetros de la poblacin o simplemente parmetros, a partir delconocimiento de esas magnitudes sobre muestras, que se llaman estadsticosde la muestra o simplemente estadsticos.

    La teora del muestreo es til tambin para determinar si las diferenciasobservadas entre dos muestras son debidas a variaciones fortuitas o si son

    6 Murray R. Spiegel. Estadstica serie Schaum. Editorial McGraw-Hill. P.p 1867 Raj, Des. Teora del Muestreo. Fondo de cultura econmica. P.p 98 NOTA: La oficina de Estadstica de las Naciones Unidas se dedica entre otras funciones a encontrar la forma y losmedios de ayudar a los gobiernos nacionales en la obtencin de los datos estadsticos tan indispensables para laplanificacin del desarrollo econmico y social, controlar la ejecucin real de los programas y evaluar los resultados.

    La teora del muestreo estudia la relacin entre unapoblacin y las muestras tomadas de ella.

  • realmente significativas. Tales cuestiones aparecen, por ejemplo, al probar unnuevo suero como tratamiento de una enfermedad o al decidir si un proceso deproduccin es mejor que otro. Las respuestas implican el uso de los llamadoscontrastes (o tests) de hiptesis y de significacin, que son importantes enla teora de las decisiones.

    En general, un estudio de las inferencias hechas sobre una poblacin a partirde muestras suyas, con indicacin de la precisin de tales inferencias, se llamaInferencia Estadstica.

  • FUNDAMENTOS DE LA TEORA DEL MUESTREO9.La teora de las probabilidades es el fundamento de los mtodos de muestreo yno oculto este hecho. Un buen conocimiento de:

    lgebra Clculo y Probabilidades

    Desde el punto de vista de la matemtica y de:

    Los mtodos generales de estadstica y de la Teora bsica de las estimaciones

    Desde el punto de vista estadstico es esencial para un entendimientoadecuado del desarrollo riguroso de la Teora del Muestreo.

    Variables aleatorias10.

    Supongamos que hay un experimento aleatorio que genera un espaciomuestral con sus puntos muestrales E1, E2,... y probabilidades asociadas Pr (E1), Pr (E2 ),...ahora se definir una funcin en este espacio muestral.

    Supongamos que hay una regla por la cual un nmero U est asociado concada punto del espacio muestral. De conformidad con dicha regla, asignamoslos nmeros reales: U1, U2, ... a los puntos E1, E2,..., respectivamente.Reuniendo todos los puntos con los cuales est asociado el numero U i formamos el evento U = ui que interpretamos como: la variable aleatoria Utoma el valor de u i .

    El conjunto de relaciones:

    Pr (U = ui ) = g (ui ), g (ui ) = 1, (i = 1, 2,...)

    Define la distribucin de probabilidad de la variable aleatoria U.

    9 Raj, Des. Teora del Muestreo. Fondo de cultura econmica. P.p 1110 Raj, Des. Teora del Muestreo. Fondo de cultura econmica. P.p 16

  • El teorema del lmite central11:

    La aplicacin del teorema del lmite central o teorema central del lmite ala distribucin muestral de las medias de muestras, que vimos con anterioridad,permite utilizar la distribucin de probabilidad normal para crear intervalos deconfianza para la media de la poblacin.

    El teorema del lmite central afirma que, para grandes muestras aleatorias, ladistribucin muestral de las medias de muestras est ms prxima a unadistribucin de probabilidad normal. La aproximacin es ms precisa paramuestras grandes. sta es una de las conclusiones ms tiles en Estadstica.Es posible razonar sobre la distribucin muestral de las medias de muestras sincontar con informacin alguna sobre la forma de la distribucin original de laque se toma la muestra. En otras palabras, el teorema del lmite central esvlido para todas las distribuciones.

    El enunciado formal del teorema del lmite central es el siguiente:

    ley de los grandes nmeros12:la ley de los grandes nmeros sugiere que la probabilidad de una desviacinsignificativa de un valor de probabilidad determinado empricamente13, a partirde una determinado tericamente, es menor cuanto ms grande sea el nmerode repeticiones del experimento14.

    Muestreo15.Es el proceso para obtener informacin acerca del conjunto de una

    poblacin o universo examinando solo una parte del mismo.

    11 Douglas A. Lind., et al. Estadstica para administracin y economa editorial: Irwin-McGraw-Hill. P.p 23412 Kohler, Heinz. Estadstica para negocios y economa. Editorial: CECSA primera reimpresin, Mxico 1998. p.p 15813 emprico, ca. Del lat. empiricus, y este del gr. mpeirikj, que se rige por la experiencia.1. adj. Relativo a la experiencia o fundado en ella. (DRAE)14 Jacob Bernoulli (1654-1705) fue uno de los primeros que estudiaron la probabilidad matemtica. En su libro Ars Conjectandi(1713) apareceri la primera proposicin de la ley de los grandes nmeros. En su honor, su nombre va asociado a varios conceptosmatemticos, como los experimentos de Bernoulli en probabilidad, los nmeros de Bernoulli en la teora de los nmeros y lalemniscata de Bernoulli en clculo. (nota tomada del libro: Probabilidad y Estadstica de Stephen S. Willoughby. Publicacionesculturales , s.a. p.p 100.15 Notas tomadas durante el curso: El muestreo Estadstico aplicado a la Auditoria; impartido por el M.C Jos Refugio Ruiz Pia.(direccin general de asuntos del personal acadmico. Programa de actualizacin acadmica para profesores de licenciatura. Octubredel 2001)

    Teorema del lmite central.

    Si en cualquier poblacin se seleccionan muestras de un tamaoespecfico, la distribucin muestral de las medias de muestras esaproximadamente un distribucin normal. Esta aproximacin mejora conmuestras de mayor tamao.

  • ENCUESTA POR MUESTREO16.LA FUNCIN DEL MTODO DE MUESTREO17.

    En la actualidad se ha llegado a considerar la encuesta por muestreocomo un instrumento organizado para encontrar hechos. Su importancia para lacivilizacin moderna radica en que puede utilizarse para resumir, a fin deorientar a la administracin, hechos que de otra manera seran inaccesiblesdebido: a la lejana y oscuridad de las personas o de las otras unidades de quese trate, o a su gran nmero. La encuesta por muestreo permite que se tomendecisiones que tienen en cuenta los factores significativos de los problemasque se procura resolver.

    Como instrumento para descubrir hechos, la encuesta por muestreono se ocupa principalmente de la interpretacin econmica o sociolgicade los hechos que demuestra, aunque debiera proporcionar informacinadecuada para esas interpretaciones. Ms bien se ocupa de la adecuadarepresentacin de los hechos individuales registrados y de su recopilacin yresumen.

    Un muestreo18 aleatorio simple es un proceso en el cual cada muestra posiblede un tamao dado tiene la misma probabilidad de ser seleccionada. Obteneruna muestra verdaderamente aleatoria, o al menos aproximadamente aleatoria,requiere de cierto raciocinio y esfuerzo. Una muestra aleatoria no es unamuestra casual o desordenada. La poblacin objetivo se debe identificar. Enprincipio, se debera elaborar una lista de todos los elementos de la poblacin yseleccionar aleatoriamente aquellos que estarn incluidos en la muestra,utilizando una tabla de nmeros aleatorios.

    El muestreo19 se debe considerar siempre que se quiera tener informacin y elcosto (en dinero, en trabajo o en tiempo) de obtener la informacin completa esexcesivo.

    Metodologa de muestreo20.

    16Raj, Des. Teora del Muestreo. Fondo de cultura econmica. P.p 36

    17 Raj, Des. Teora del Muestreo. Fondo de cultura econmica. P.p 3618 Hildebrand David. K y Lyman Ott R. Estadstica aplicada a la administracin y a la economa editorial: Addison WesleyLongman. P.p. 23019 ibid. P.p. 23120 Notas tomadas durante el curso: El muestreo estadstico aplicado a la auditoria impartido por el Maestro en Ciencias: JosRefugio Ruiz Pia. Octubre del 2001.

    Es importante hacer notar que la Metodologa demuestreo debe quedar plasmada en los papeles detrabajo correspondientes.

  • 1. definir el objetivo.

    2. seleccionar el plan de muestreo adecuado.a) Muestreo de atributos.b) Muestreo de suspensin o continuacin.c) Muestreo de variables.d) Muestreo de descubrimiento.e) Muestreo dirigido.

    3. definir el nivel de confianza y precisin deseada.a) Determinar el tamao de la muestra.

    4. seleccionar la muestra.a) Aleatoria.b) Sistemtica o intervalos.c) Estratificada.d) Conglomerados.e) Automatizada.

    5. realizar las pruebas.

    6. determinar estadsticos.

    7. evaluar resultados.

    Ejemplo de Muestreo de Atributos21:

    La funcin del muestreo de atributos, es determinar cuantos elementosexisten. Y se utiliza para estimar la frecuencia probable con la cual ocurre undeterminado evento.Donde este evento puede ser una clase de error u otro atributo de la poblacin.Es aplicable cundo el propsito de una auditoria puede lograrse mediante unarespuesta de s o no, bueno o malo, blanco o negro, etc.

    21 Tomado del curso: el muestreo estadstico aplicado a la auditoria. Impartido por el M.C Jos Refugio Ruiz Pia. Octuble del2001. pag. 25

    Ejemplo:

    Supngase que el propsito de la prueba de auditoria estriba en determinarcuntos errores se cometieron en nmeros de identificacin asignados a lafacturacin corriente de la empresa en la que laboramos.

    El auditor determina que el tamao de la poblacin es de 10 000 facturas y quela tasa de error esperada no deber ser mayor del 5%. Desea contar con unnivel de confianza del 90% de que los resultados de sus pruebas se hallan

  • En este caso particular, el tamao de la muestra resulta de 140, i.e n = 140,obtenido de la tabla correspondiente al cuadro A5 (pagina 55). Por lo tanto esnecesario revisar de acuerdo con este criterio, un total de 140 facturas, lo cualnecesariamente implica la obtencin mediante el procedimiento necesario delos 140 elementos que forman la muestra.

    5. realizar las pruebas.Los datos del problema son:N = 10 000 facturasM.e = 10%N.C = 90%P = 0.5Q = 0.5

    Y dado que la muestra debe ser aleatoria, entonces, la frmula a utilizar es1:

    EnteroANLiLsLiFN ).)((. en donde:N.F = nmero o folio de la factura a revisarLi = lmite inferior de la poblacin (en este caso es 1)Ls = lmite superior de la poblacin (en este caso es 10 000)N.A = nmero aleatorio comprendido entre 0 y 1Entero = significa que de toda la operacin, lo nico que nos interesa es laparte entera, desdeando la parte decimal.

    El N.A (nmero aleatorio) lo podemos elegir de una tabla de nmerosaleatorios. Para su eleccin podemos utilizar el criterio de:

    los nmeros de serie de un billete cualquier denominacin. Los nmeros de serie de un boleto del sistema de transporte colectivo

    metro Los nmeros que vienen en una tarjeta de crdito o dbito, etc.

    Por lo tanto, de las 10 paginas que forman la tabla de nmeros aleatorios,elegimos una al azar. (pag. 83) y de ella en base a los nmero obtenidos delbillete, del boleto o de la tarjeta, elegimos una fila y una columna, en nuestrocaso podra ser por ejemplo, la fila 133 columna 4 de donde obtenemos elnmero aleatorio: 09244, que al ser considerado decimal nos queda como:0.09244

    1 sta frmula se basa en una distribucin de tipo uniforme (discreta)

    Recuerda que el muestreo de atributosnos sirve para determinar si las cosas seestn haciendo bien de acuerdo a ciertocriterio establecido.

  • Una vez elegido el nmero aleatorio de inicio (tambin llamado semilla)podemos elegir continuar hacia:

    Arriba Abajo En diagonal derecha En diagonal izquierda, etc.

    De la semilla. Hasta completar el nmero de facturas que sea necesario revisarde acuerdo al tamao de la muestra.

    Y procedemos a sustituir datos en la frmula. As:

    EnteroFN )09244.0)(110000(1. N.F = 925.31

    Por lo tanto, teniendo en consideracin slo la parte entera, debemos revisar lafactura nmero: 925

    6. determinar estadsticos.A continuacin hacemos una tabla para poder visualizar mejor cules sern lasfacturas a revisar: (continuando hacia debajo de la semilla plantada)

    # de experimento # aleatorio # de factura a revisar

    01 0.09244 925

    02 0.11592 1160

    03 0.32402 324

    04 0.12021 1202

    05 . .

    06 . .

    . . .

    . . .

    .

    .

  • 7. evaluar resultados. Si una vez que hemos obtenido la muestracompleta (las 140 facturas) revisamos la misma y encontramos 8facturas mal elaboradas, entonces, este nmero de facturas representade acuerdo a una regla de tres:

    140------------------100%8------------------X %

    de donde podemos observar que: X = 5.71%

    y si este valor lo graficamos en el intervalo de precisin, podemos ver que estevalor (x=5.7%) se encuentra dentro de dicho intervalo de precisin construido

    90%

    2% 5% 8%

    luego entonces, el auditor estar seguro de que 90 veces de cada 100 la tasade error se encuentra entre el 2% y el 8%; i.e que no es necesario tomaralguna medida correctiva.

    Nota:Si revisamos la tabla del cuadro F.3 (pag. 93) de los lmites de precisin

    revisados con base en la tasa de error hallada en la muestra, tendramos quelos lmites de la precisin son:

    Si n = 140, N = 10 000 y la tasa de error de la muestra es de 5.7% 5%

    Li(prec)= 2.4%Ls(prec)=9.3%

    O bien del cuadro F.4 (pag. 94) para n = 140, N = 10 000 y una tasa de errorde la muestra de 5.7%10%, los lmites del intervalo de precisin son:

    Li(prec)= 6.2%Ls(prec)=15.2%

    1 si la tasa encontrada en la muestra es mayor del 5% y esta fuera de los lmites de la precisin, es comn reevaluar la precisin orecalcular el tamao de muestra (aumentarlo), utilizando para ambos casos los cuadros F. (nota: esto incluso es aplicable par a unatasa encontrada de 0%). Por lo tanto si usted desea verse conservador y no andar recalculando el tamao de la muestra o laprecisin, puede utilizar como alternativa el calculo del tamao de la muestra mediante la frmula genrica. Cuyo resultado casisiempre es mayor que el de las tablas.

  • Por lo cual, lo ms que podemos decir es que: contablemente hablando, unintervalo de precisin de 2% a 8% es razonable1. Y que despus del estudiorealizado, la facturacin actual se encuentra dentro de los lmites razonablesde la tasa de error estipulada.

  • Pero, si el tamao de la muestra lo determinamos de acuerdo con la frmulagenrica para este caso, tendremos que:

    Para la determinacin del tamao de la muestra se requiere22:

    1. tamao del universo.2. tasa de error esperada.3. homogeneidad-heterogeneidad del fenmeno.4. precisin o margen de error.5. exactitud o nivel de confianza.6. nmero de estratos.7. etapas de muestreo.8. conglomeracin de unidades.9. estado del marco muestral.10.efectividad de la muestra.11. tcnica de recoleccin de datos. Y12. recursos disponibles.

    Dentro de la teora del muestreo y probabilidad existen diversos procedimientospara el clculo de los tamaos de la muestra: todos ellos consideran loselementos que hemos enumerado. A continuacin se presenta una frmulagenrica para el clculo del tamao de muestra. Las variables que considera lafrmula son los siguientes:

    Variable Descripcinn Tamao de la muestraN Tamao del universoP Probabilidad de ocurrencia (homogeneidad del fenmeno)Q Probabilidad de no ocurrencia (1-p)Me Margen de error o precisin. Expresado como probabilidad.Nc Nivel de confianza o exactitud. Expresado como valor z que

    determina el rea de probabilidad buscada.

    La frmula utilizada es la siguiente:

    PQNNcMe

    NPQn

    )1(22

    22 Galindo, Caceres. Jess. Tcnicas de Investigacin en sociedad, cultura y comunicacin editorial: Addison Wesley Longman(Pearson) p.p 49-62

    por ejemplo: supongamos que queremos calcular el tamao de una muestrapara el siguiente caso:

    Variable Descripcinn ?N 3,000,000P Desconocemos la probabilidad de ocurrencia. Por esta razn

    asumimos el mayor punto de incertidumbre, que es de 50%, que alser expresada como probabilidad queda como: 0.5

    q 1 0.5 = 0.5Me +/- 5% de margen de error. Que expresado como probabilidad queda

  • As, para nuestro ejemplo en cuestin tendramos que

    N = 10 000 facturasM.e10%N.C = 90%

    P = 0.5Q = 0.5

    que sustituidos en la frmula correspondiente nos daran:

    )5.0)(5.0()1000,10()96.1()05.0(

    )5.0)(5.0)(000,10(

    2

    2

    n

    de donde finalmente vemos que es necesario revisar un total de: 369.98facturas.

    Finalmente podemos observar que utilizando las tablas para determinar eltamao de la muestra, esta resulta ser ms pequea que la que resulta decalcularla utilizando la frmula genrica; ambos procedimientos son vlidos ysu uso se restringe a las condiciones imperantes al momento de realizar elestudio.

    Cabe mencionar que en la actualidad existen numerosos paquetes de softwareque son utilizados principalmente por los despachos contables para determinartanto el tamao de la muestra como los elementos a revisar dependiendo deltipo de muestreo seleccionado.

  • Ejercicio propuesto1:

    Supngase una prueba en la cual el auditor espere una tasa de error no mayordel 5% en una poblacin de 20 000 artculos, una precisin de3% y un nivel deconfianza del 95%. Determine el tamao de la muestra y todos los elementosmuestrales.

    1Tomado del curso: el muestreo estadstico aplicado a la auditoria. Impartido por el M.C Jos Refugio Ruiz Pia.

    Octuble del 2001. pag. 26

  • TIPOS DE MUESTREO:MUESTREO APLICANDO CRITERIO23.

    Para la obtencin de informacin sobre la base de una muestra, elestadstico (persona que estudia la estadstica) de encuestas rechaza deantemano ciertos procedimientos. Esto ocurre cuando no es posible encontrarun mtodo objetivo para diferenciar un procedimiento de otro. Por ejemplo:

    Se podra obtener informacin sin mucho gasto preguntando a personasexpertas en un determinado campo. Sin duda esos expertos tendrnopiniones diferentes, y no hay ningn mtodo objetivo para diferenciarentre sus opiniones. Otro procedimiento que pertenece a esta categora consiste en limitar el

    muestreo a unidades que parecen ser representativas de la poblacinque se considera24. Se obtiene informacin sobre esas unidades y conbase en la misma se hacen estimaciones sobre las caractersticas de lapoblacin. Tambin en este caso el criterio de la persona que seleccionala muestra es importante, porque personas diferentes tendrn criteriosdiferentes.

    No hay un mtodo objetivo para preferir un criterio u otro. No podemos predecirel tipo de distribuciones de los resultados producidos por un gran nmero deseleccionadores de muestra que aplican su criterio, ni podemos predecir cmodiferirn del denominado verdadero valor que se busca. No conocemosningn mtodo objetivo para medir la confianza que debe tenerse en losresultados cuando la muestra es seleccionada por criterio. La razn es quecon esos mtodos nos e conoce la probabilidad de que una determinadaunidad sea seleccionada en el muestreo. Por lo tanto, no podemos estimar ladistribucin de frecuencia de las estimaciones de este procedimiento (muestreopor criterio). En ausencia de informacin sobre cmo diferirn las diferentesmuestras entre si, el error de muestreo no puede determinarse objetivamente.

    23Raj, Des. Teora del Muestreo. Fondo de cultura econmica. P.p 36

    24 un ejemplo es el muestreo por cuotas, en el que los entrevistadores quedan en libertad de seleccionar sus informantes siempreque la muestra se refiera a x nmero de hombres y x nmero de mujeres, a determinado nmero de personas con elevadosingresos y otro tanto de bajos ingresos, etc.)

  • MUESTREO PROBABILISTICO25.

    El panorama cambia tan pronto como empezamos a utilizar unprocedimiento de muestreo en el que todas las unidades pertenecientes a unapoblacin tienen una probabilidad conocida (que no es igual a cero) de serseleccionadas en la muestra. Con la ayuda de la teora de las probabilidadesestamos entonces en la posicin de determinar la distribucin de frecuencia delas estimaciones derivables del procedimiento de muestreo y de estimacin.Podemos calcular la proporcin de estimaciones dentro de un intervaloespecificado en torno al llamado valor verdadero buscado. Sabemos losresultados que producir la repeticin de un determinado procedimiento demuestreo, y esto nos permite diferenciar entre los diversos procedimientos.Adems, lo que es muy importante, puede obtenerse una medida de lavariacin muestral (la medida en que las estimaciones de la muestra diferirndel promedio) de una manera objetiva a partir de la muestra misma. Todo elcorpus de la Teora de la Probabilidad y la Inferencia Estadstica (basada enla primera) estn disponibles para desprender conclusiones vlidas a partir dela muestra.

    25 Raj, Des. Teora del Muestreo. Fondo de cultura econmica. P.p 41

  • Muestreo aleatorio simple26:

    El tipo que ms se utiliza es un muestreo aleatorio simple.

    Para ilustrar el muestreo aleatorio simple, suponga que una poblacin constade 845 empleados y se ha de seleccionar una muestra de 52 empleados deesa poblacin.

    Una forma de asegurar que todos los empleados tengan la misma oportunidadde ser elegidos es escribir primero el nombre de cada no de ellos en un papel ycolocar todos los papeles en una urna. Luego de haberlos revuelto en formaminuciosa, se hace la primera seleccin tomando un papel de la caja sinmirarla. Este proceso se repite hasta haber seleccionado la muestra de 52personas.

    Un mtodo ms conveniente de seleccionar una muestra aleatoria es usar elnmero de identificacin de cada empleado y una tabla de nmerosaleatorios.

    Un muestreo27 aleatorio simple es un proceso en el cual cada muestra posiblede un tamao dado tiene la misma probabilidad de ser seleccionada. Obteneruna muestra verdaderamente aleatoria, o al menos aproximadamente aleatoria,requiere de cierto raciocinio y esfuerzo. Una muestra aleatoria no es unamuestra casual o desordenada. La poblacin objetivo se debe identificar. Enprincipio, se debera elaborar una lista de todos los elementos de la poblacin yseleccionar aleatoriamente aquellos que estarn incluidos en la muestra,utilizando una tabla de nmeros aleatorios. Ejemplo 6.1 pag. 230 (delHildebrand)

    26 Douglas A. Lind., et al. Estadstica para administracin y economa editorial: Irwin-McGraw-Hill. P.p 22327 Hildebrand, David, K. & Lyman Ott. R. Estadstica aplicada a la administracin y a la economa.Editorial: Addison wesley Longman. P.p. 230

    Muestreo aleatorio simple:

    Consiste en una muestra seleccionada de modo que cada uno de loselementos o personas en la poblacin tengan las mismas probabilidadesde ser incluidos.

  • Muestreo28 aleatorio Sistemtico29:

    El procedimiento del muestreo aleatorio simple puede ser difcil enciertos casos. Por ejemplo, suponga que la poblacin que nos interesa consistede 2000 facturas que se localizan en cajones. Tomar una muestra aleatoriasencilla requerira primero numerar las facturas, del 0001 al 1999. utilizandouna tabla de nmeros aleatorios, se seleccionara luego una muestra de, porejemplo 100 nmeros, luego, en los cajones deber localizarse una factura queconcuerde con cada uno de estos 100 nmeros. Esta tarea puede requerirmucho tiempo. En lugar de ello, se podra seleccionar una muestra aleatoriasistemtica30 recorriendo simplemente los cajones, contando las facturas ytomando todas las que hagan el nmero 20 del grupo, para su estudio. As, laprimera factura debera elegirse utilizando un proceso aleatorio: por ejemplo,una tabla de nmeros aleatorios. Si se eligi la dcima factura como punto departida, la muestra consistira en las facturas: dcima, trigsima,quincuagsima, septuagsima, etc

    Debido a que el primer nmero se elige al azar, todos tienen la mismaprobabilidad de seleccionarse para la muestra. Por lo tanto, se trata de unmuestreo probabilstico.

    En resumen:

    28 Douglas A. Lind., et al. Estadstica para administracin y economa editorial: Irwin-McGraw-Hill. P.p 22529 En un mestreo sistemtico, el primer artculo se elige al azar.30 En ciertas circunstancias, una muestra sistemtica podr producir resultados sesgados.

    Para un muestreo aleatorio sistemtico.

    Se acomodan los elementos o personas de la poblacin en ciertaforma. Se selecciona un punto de partida aleatorio y luego se tomacada K-simo miembro para formar la muestra.

  • Muestreo aleatorio estratificado31:Otro tipo de muestreo probabilstico es el muestreo aleatorio estratificado32.

    Una vez que la poblacin se divide en estratos, es posible seleccionar unamuestra proporcional o no proporcional. Como el nombre lo implica, unprocedimiento de muestreo proporcional requiere que el nmero de artculos decada estrato est en la misma proporcin que en la poblacin.

    Por ejemplo, el problema podra ser estudiar los gastos de publicidad de las352 empresas Mexicanas ms grandes. Suponga que el objetivo des estudioconsiste en determinar si las empresas con altos rendimientos sobre suinversin (una medicin de la rentabilidad) han gastado una mayor proporcinde su presupuesto de ventas en publicidad que las empresas que tienen unmenor rendimiento o incluso un dficit.

    Suponga que las 352 empresas se dividieron en 5 estratos y si seleccionamosuna muestra de 50 empresas, entonces se deberan incluir:

    Estrato Rentabilidad # empresas # muestreado ?1 30% y ms 8 1 (8/352)(50)2 De 20 a 30% 35 5 (35/352)(50)3 De 10 a 20% 189 27 (189/352)(50)4 De 0 a 10% 115 16 (115/352)(50)5 Dficit 5 1 (5/352)(50)

    Total 352 50

    En una muestra estratificada no proporcional, la cantidad de artculos que seseleccionan en cada estrato no guarda proporcin con los nmeros respectivosen la poblacin.

    En algunos casos, el muestreo estratificado tiene la ventaja de poder reflejarcon mayor precisin las caractersticas de la poblacin que un muestreoaleatorio simple o sistemtico.

    Muestreo por Conglomerados33:

    31 Una muestra estratificada garantiza la representacin de cada subgrupo.32 Douglas A. Lind., et al. Estadstica para administracin y economa editorial: Irwin-McGraw-Hill. P.p 22633 Douglas A. Lind., et al. Estadstica para administracin y economa editorial: Irwin-McGraw-Hill. P.p 227

    Muestreo aleatorio estratificado.

    Se divide una poblacin en subgrupos llamados estratos, y seselecciona una muestra de cada uno de ellos.

  • Otro tipo de muestreo que es comn, es el muestreo porconglomerados34. Muchas veces se le emplea para reducir el costo de realizarun muestreo de una poblacin dispersa en una gran rea geogrfica. Supongaque se desea determinar el punto de vista de los industriales de toda laRepblica Mexicana con respecto a las reformas fiscales del ao 2002. laseleccin de una muestra aleatoria de los industriales de toda la RepblicaMexicana y el contacto personal con cada uno de ellos seran muy onerosos encuanto a tiempo y dinero. En lugar de ello, se podra emplear un muestreo porconglomerados subdividiendo la Repblica Mexicana en unidades pequeas,ya fueran estados o regiones. Muchas veces, stas se conocen comounidades primarias. suponga que se subdividi a la Repblica Mexicana en12 unidades primarias y luego se escogi a cuatro de ellas, de esta forma, losesfuerzos se concentran en estas cuatro unidades, tomando una muestraaleatoria de los industriales de cada una de estas regiones y entrevistarlos(observe que se trata de una combinacin del muestreo por conglomerados y elmuestreo aleatorio simple).

    34 el muestreo por conglomerados reduce el costo del muestreo.

  • Muestreo con medidas estadsticas35.Un mtodo eficaz de muestreo necesita, al menudo, algo ms que

    objetividad: requiere de algn medio para establecer tamaos de muestra yevaluar matemticamente los resultados obtenidos de ella. Esto se logra conuna muestra estadstica o muestra probabilstica. Este tipo de muestratendr un comportamiento mensurable en funcin de las reglas de la teora dela probabilidad.

    Con una muestra estadstica, es posible afirmar, con un determinado grado deconfianza, que el resultado de la muestra no se aleja de las condiciones realesdel universo, ms all de cierto lmite especificado.

    Ventajas36. Los resultados de la muestra pueden ser justificados objetivamente. Proporciona un medio para conocer con anticipacin el tamao mximo

    necesario de la muestra. Suministra una estimacin de la magnitud del riesgo de que la muestra

    pueda no ser representativa de toda la poblacin. Puede ser ms exacto que el que se realiza examinando cada uno de

    los elementos de una poblacin grande. Las muestras estadsticas suelen ser ms econmicas que los tamaos

    de muestra tradicionales. Proporciona un medio de proyectar los resultados de las pruebas dentro

    de lmites conocidos de confianza.

    35 Notas tomadas durante el curso: El muestreo estadstico aplicado a la auditoria impartido por el Maestro en Ciencias: JosRefugio Ruiz Pia. Octubre del 2001.

    36 Notas tomadas durante el curso: El muestreo estadstico aplicado a la auditoria impartido por el Maestro en Ciencias: JosRefugio Ruiz Pia. Octubre del 2001.

  • Conceptos bsicos37.

    Nivel de confianza. Es el grado en el que se justifica estimar que una muestraaleatoria indica el verdadero valor del universo (dentro de una amplitudestipulada).

    Por ejemplo: un 95% de N.C (nivel de confianza) quiere decir que hay 95posibilidades entre 100 de que los resultados de la muestra representen lascondiciones verdaderas del universo.

    Precisin. Es la amplitud (expresada como ms o menos un porcentajedeterminado) dentro de la cual debe encontrarse la respuesta verdaderaconcerniente a las caractersticas (errores por ejemplo) de la poblacin que seestudia, con un determinado nivel de confianza.

    En otras palabras, es el grado de exactitud del supuesto de que el nmero deerrores de la muestra se aplica proporcionalmente a la parte no muestreada dela poblacin.

    Por ejemplo. S con base en una prueba se afirma que la tasa de errorproyectada en un universo dado es 5%, +-2%, se est diciendo que la tasa deerror en la muestra examinada fue exactamente de 5%, en tanto que laprecisin en la muestra (con un nivel de confianza especificado) era de +-2%.Es decir, la tasa puede ser tan pequea como el 3% o tan grande como el 7%.

    37 Notas tomadas durante el curso: El muestreo estadstico aplicado a la auditoria impartido por el Maestro en Ciencias: JosRefugio Ruiz Pia. Octubre del 2001.

  • Tipos de muestras38:En general podemos decir que existes dos tipos de muestras, a saber:

    Muestras probabilsticas y Muestras no probabilsticas.

    De ambas, aquellas que nos interesan son las muestras probabilsticas, pueslos resultados de un muestreo no probabilstico pueden estar sesgados. Por lotanto, nos surge la pregunta: Qu es una muestra probabilstica?

    No existe un mtodo mejor para seleccionar una muestra probabilsticade una poblacin de inters. Quiz el mtodo que se utiliz para seleccionaruna muestra de facturas de un cajn no sea el idneo para elegir una muestranacional de votantes. Sin embargo, todos los mtodos de muestreoprobabilistico tiene similar finalidad: permitir que el azar determine losartculos o personas que incluye la muestra.

    Muestras aleatorias y nmeros aleatorios39.Para que las conclusiones de la teora del muestreo y de la inferencia

    estadstica sean vlidas, las muestras deben ser representativas de lapoblacin. El anlisis de los mtodos de muestreo y problemas relacionados sellama el diseo del experimento.

    Una forma de obtener una muestra representativa es mediante un muestreoaleatorio, de acuerdo con el cual, cada miembro de la poblacin tiene la mismaprobabilidad de ser incluido en la muestra. Existen al menos dos mtodos paralograr obtener una muestra representativa; a saber

    1. El primer mtodo consiste en asignar un nmero a cada elemento de lapoblacin, escribir dicho nmero en una papeleta, y realizar un sorteojusto con ellas en una urna.

    2. Un mtodo alternativo consiste en recurrir a una tabla de nmerosaleatorios.

    38 Douglas A. Lind., et al. Estadstica para administracin y economa editorial: Irwin-McGraw-Hill. P.p 22239 Murray R. Spiegel. Estadstica serie Schaum. Editorial: Mc Graw-Hill. P.p 186

    Muestra probabilstica:

    Es una muestra seleccionada de tal forma que cada artculo opersona dentro de la poblacin tiene la misma probabilidad (distinta decero) de ser incluida en la muestra.

  • Error en el muestreo40:

    En el anlisis anterior se acentu la importancia de seleccionar unamuestra a fin de que todos los artculos de la muestra tengan la mismaoportunidad de ser elegidos. Para lograr esto, se puede seleccionar:

    una muestra aleatoria simple; una muestra sistemtica; una muestra estratificada; una muestra por conglomerados o una combinacin de estos mtodos.

    Sin embargo, es improbable que la media de la muestra fuera idntica a lamedia de la poblacin. As mismo, tal vez la desviacin estndar u otramedicin que se calcule con base en la muestra no sea exactamente igual alvalor correspondiente de la poblacin. As, es posible que existan diferenciasentre las estadsticas de la muestra, como la media o la desviacin estndar dela muestra, y los parmetros de la poblacin correspondientes. La diferenciaentre un estadstico de la muestra y un parmetro de la poblacin se conocecomo error de muestreo.

    40 Douglas A. Lind., et al. Estadstica para administracin y economa editorial: Irwin-McGraw-Hill. P.p 229

    Error de muestreo.

    Es la diferencia entre un estadstico y el parmetrocorrespondiente.

  • CAPITULO II. DISTRIBUCIONES MUESTRALES YTEOREMA DEL LIMITE CENTRAL

    II.1. DISTRIBUCIONES MUESTRALES.

    Consideremos todas las muestras posibles de tamao N en una poblacindada (con o sin reposicin). Para cada muestra podemos calcular unestadstico (tal como la media o la desviacin tpica) que variar de muestra amuestra. De esta manera obtenemos una distribucin del estadstico que sellama su distribucin de muestreo.

    Si por ejemplo, el estadstico utilizado es la media muestral, entonces ladistribucin se llamara la distribucin de muestreo de medias, odistribucin de muestreo de la media. Anlogamente, podramos tenerdistribuciones de muestreo de la desviacin tpica, de la varianza, de lamediana, de las proporciones, etctera.

    Para cada distribucin de muestreo podemos calcular la media, la desviacintpica, etc. As pues, podremos hablar de la media y la desviacin tpica de ladistribucin del muestreo de medias, etctera.

    II.2. DISTRIBUCIN MUESTRAL DE LAS MEDIAS DE LAS MUESTRAS1:

    Una vez que se descubri la posibilidad del error de muestreo cuando seutilizan los resultados de la muestra para estimar el parmetro de unapoblacin:

    Cmo es posible hacer una prediccin precisa sobre el xito de unapasta de dientes de reciente desarrollo con base slo en los resultadosde la muestra? De qu manera puede el departamento de control de calidad de una

    empresa que se dedica a la produccin masiva liberar un embarque demicroprocesadores, con base en una muestra de slo diez unidades? Cmo puede Gallup o Harris hacer una prediccin precisa de una

    votacin presidencial con base en una muestra de slo 2000 votantesregistrados, de una poblacin de casi 90 millones de votantes?

    Para responder a estas preguntas, se examina la distribucin muestral de lasmedias de la muestra.

    Al organizar las medias de todas las muestras posibles de un cierto tamao enuna distribucin de probabilidad, se obtiene una distribucin muestral de lasmedias de las muestras.

    1 Douglas A. Lind., et al. Estadstica para administracin y economa editorial: Irwin-McGraw-Hill. P.p 230

  • Por ejemplo2:

    2 problema tomado con ligeros cambios del libro: Probabilidad y Estadstica de Stephen S. Willoughby. Editorial: Publicacionescultural s.a. p.p 126

    Distribucin muestral de las medias de las muestras.

    Es la distribucin de probabilidad de todas la medias posibles delas muestras de un tamao de muestra dado.

    El nmero de unidades producidas por un obrero que trabaja de lunes asbado en una fbrica que produce latas para refresco es la siguiente: 80, 80,76, 70, 70 y 68. Suponga que estos nmeros constituyen la poblacin de lacual se desea tomar una muestra de tamao 3.

    a) determine la media aritmtica de estos nmeros.b) Determine la desviacin estndar de los nmeros.c) Calcule el nmero de muestras de tamao 3d) Liste cada una de las muestrase) Calcule la media de cada una de las muestras.f) Encuentre la media de la distribucin de las medias de las muestras.g) Calcule la desviacin estndar de las medias de las muestras.h) Compare los resultados de los incisos a y fi) Compare los resultados de los incisos b y g.

    Problema tomado con ligeros cambios del libro: Probabilidad y Estadstica de stephen S. Willoughby. Editorial: Publicacionescultural s.a. p.p 126

  • Solucin al problema propuesto:a) para encontrar la media aritmtica de los numero solicitada, procedemos

    a utilizar la frmula correspondiente, tomando en consideracin de quesi se trata de una poblacin, entonces el smbolo a utilizar es: , por lotanto:

    n

    ixN 1

    1

    de donde sustituyendo datos tenemos que:

    68707076808061

    74 solucin al a)

    b) para el inciso b, es recomendable elaborar la tabla indicada acontinuacin:

    # deexperimento Datos

    mediaaritmtica

    Dato -media

    (dato - media)elevado alcuadrado

    i xi (xi -) (xi -)2

    1 80 74 6 362 80 74 6 363 76 74 2 44 70 74 -4 165 70 74 -4 166 68 74 -6 36

    Sumatoria 444 0 144

    En esta tabla podemos observar que la sumatoria de la columnacorrespondiente a la diferencia del dato menos la media, es cero, por lo tanto,hasta ese punto nuestro proceso es correcto.

    Finalmente para este inciso, aplicamos la frmula correspondiente:

    2

    1

    )(1

    N

    ixN

    de donde sustituyendo valores tenemos que:

    14461

    = 4.9 respuesta al b)

    c) para dar respuesta a este inciso, debemos aplicar la frmulacorrespondiente al clculo de combinaciones. Es decir:

  • )!(!!

    rnrn

    C nr

    de donde sustituyendo valores tenemos que:

    )!36(!3!6nrC

    )123(!3!3456

    xxxxx

    C nr

    de donde fcilmente vemos que el nmero de combinaciones de 6objetos tomados de 3 en 3 es:

    20nrC respuesta al c)

    d) para dar respuesta a este inciso, es necesario realizar los siguientespasos:

    1. identificar cada uno de los datos. En nuestro caso, en virtud deque algunos datos se repiten se procede a identificarlos de lassiguiente manera: 801, 802, 76, 701, 702, 68.

    2. a continuacin, se colocan estos datos en forma horizontal, esdecir de la siguiente forma:

    801, 802, 76, 701, 702, 68.

    3. como siguiente punto, se elabora una tabla donde se colocarantodas las combinaciones obtenidas siguiendo el orden indicado acontinuacin: la primera terna o combinacin se obtiene de lostres primero datos, es decir:

    Si los datos son: 801, 802, 76, 701, 702, 68.

    Entonces, la primera terna es: 801, 802, 76,

    para la segunda terna, se toman los dos primeros datos junto conel cuarto dato (es decir, no saltamos el tercer dato), por lo tanto:

    recordemos que los datos son: 801, 802, 76, 701, 702, 68.Entonces, la segunda terna sera: 801, 802, 701.

  • Para la tercera terna se hace lo mismo, slo que en este casoutilizamos los dos primeros datos ms el quinto dato, y assucesivamente hasta que cubrimos todos los datos que seencuentran a la derecha de los dos primeros datos. Mediante esteprocedimiento, obtenemos las siguientes ternas:

    Para este caso tambin recordemos que los datos son:

    801, 802, 76, 701, 702, 68.

    801 802 76801 802 701801 802 702801 802 68

    Continuando con este procedimiento, nos saltamos el segundodato, continuando con el tercero y cuarto dato; es decir, lasiguiente terna tendra la forma siguiente:

    Recordemos que los datos son: 801, 802, 76, 701, 702, 68.

    801, 76, 701

    siguiendo este procedimiento, podemos encontrar fcilmente lassiguientes ternas:

    tengamos siempre presente los datos: 801, 802, 76, 701, 702, 68.

    801 76 701801 76 702801 76 68801 701 702801 701 68801 702 68

  • Una vez que hemos terminado con todas las posiblescombinaciones que empiezan con el primer dato, noscontinuamos de la misma forma para el segundo dato; medianteeste procedimiento podemos encontrar todas las restantescombinaciones, que son:

    En este caso tambin y por comodidad recordemos los datos:801, 802, 76, 701, 702, 68.

    802 76 701802 76 702802 76 68802 701 702802 701 68802 702 6876 701 70276 701 6876 702 68701 702 68

    e) para calcular la media de cada una de las muestras, conviene elaboraruna tabla donde estn incluidas todas las muestras de tamao 3encontradas, por lo tanto elaboramos la siguiente tabla, dondefcilmente podemos calcular la media de cada una de las muestrasrequerida.

    M U E S T R A S Media1 801 802 76 78 2/32 801 802 701 76 2/33 801 802 702 76 2/34 801 802 68 765 801 76 701 75 1/36 801 76 702 75 1/37 801 76 68 74 2/38 801 701 702 73 1/39 801 701 68 72 2/310 801 702 68 72 2/311 802 76 701 75 1/312 802 76 702 75 1/313 802 76 68 74 2/314 802 701 702 73 1/315 802 701 68 72 2/316 802 702 68 72 2/317 76 701 702 7218 76 701 68 71 1/319 76 702 68 71 1/320 701 702 68 69 1/3

  • f) si ahora consideramos el conjunto de todas las medias de las muestrascomo un nuevo conjunto al que podemos llamar distribucin de lasmedias de las muestras, fcilmente podemos calcular la media de ladistribucin de las medias de las muestras, para lo cual procedemos aaplicar la formula correspondiente:

    n

    ix xN 11

    de donde sustituyendo datos tenemos que:

    x= 69

    g) Calcule la desviacin estndar de las medias de las muestras.

    Continuar con el ejercicio sobre el clculo de la media de las medias.Willoughby Pg. 128 x= x

    a) Compare los resultados de los incisos a y fb) Compare los resultados de los incisos b y g.

    Al desarrollar el ejercicio en el que calculamos la media de las medias,podemos observar en trminos generales que:

    La media de las medias de la muestra es igual a la media de lapoblacin. La dispersin de la distribucin de las medias de la muestra es menor a

    la dispersin en los valores de la poblacin. La forma de la distribucin muestral de las medias de muestras y la

    forma de la distribucin de frecuencia de los valores de la poblacin esdiferente. La distribucin de las medias de las muestra tiende a teneruna forma de campana y a aproximarse a la distribucin de probabilidadnormal.

    En resumen se tomaron todas las muestras aleatorias posibles de unapoblacin y para cada muestra se calcul un estadstico de muestra (la media).Debido a que cada muestra posible tiene la misma posibilidad de serseleccionada, se puede determinar la probabilidad de que la media obtenidatenga un valor comprendido en un rango. La distribucin de los valores de lasmedias obtenidas se conoce como distribucin muestral de las medias demuestras.

    Aunque en la prctica slo se ve una muestra aleatoria especfica, en teorapodra surgir cualquiera de las muestras. En consecuencia, el proceso demuestreo repetido genera la distribucin muestral. Luego, la distribucinmuestral se utiliza para medir lo probable que podra ser obtener un resultadoespecfico.

  • En este caso debemos tomar en consideracin lo siguiente: Supongamos quese toman todas las posibles muestras de tamao n sin reposicin, de unapoblacin finita de tamao nN . Si denotamos la media y la desviacin tpicade la distribucin de muestreo de medias por: x y x y las de la poblacin por

    y , respectivamente, entonces:

    x = y

    1

    NnN

    nx

    si la poblacin es infinita o si el muestreo es con reposicin, los resultadosanteriores se reducen a:

    x= y

    nx

    para valores grandes de n ( 30n ), la distribucin de muestreo de medias esaproximadamente normal con media

    x y desviacin tpica

    x

    independientemente de la poblacin (en tanto en cuanto la media poblacional yla varianza sean finitas y el tamao de la poblacin sea al menos el doble queel de la muestra). Este resultado para una poblacin infinita es un caso especialdel teorema central del lmite de la teora avanzada de probabilidades, queafirma que la precisin de la aproximacin mejora al crecer n. Esto se indicaen ocasiones diciendo que la distribucin de muestreo es asintticamentenormal.

    En caso de que la poblacin est normalmente distribuida, la distribucin demuestreo de medias tambin lo est, incluso para pequeos valores de n (osea, n

  • En este caso, la proporcin de la poblacin P que comprara el producto, se puede

    estimar con_

    p (proporcin de la muestra que lo comprara), cuyo valor esperado sera

    PpE _

    )( , y el error de_

    p al estimar P es:

    nPP

    NnN

    p

    )1(1

    si la poblacin es finita, y si la poblacin es infinita o si el muestreo es conreposicin, los resultados anteriores se reducen a:

    nPP

    p

    )1(

    Es decir, de acuerdo al teorema del lmite central,_

    p muestral se comportar comouna normal con media P (la verdadera proporcin poblacional) y desviacin estndar

    p .

    En el ejemplo de la comercializadora se tiene que 40.03012_ p .

    Pero suponiendo que el verdadero parmetro de la poblacin es P = 0.30, es decir slo

    el 30% de la poblacin lo comprara, entonces el promedio_

    p estimar a P poblacionalpero con un error igual a p que en este caso es:

    30)70.0(30.0

    p = 0.1195

    Y en este caso_

    p muestral tendr distribucin normal con media P=0.30 y desviacinestndar 1195.0p .

    II.4. DISTRIBUCIN t de Student, X2 Ji-Cuadrada y F de Fisher.

    Cuando se hace inferencia estadstica, muchas de las veces es necesariodeterminar la distribucin de los estadsticos muestrales como x o como S2

    (la varianza muestral):

    2

    1

    2 )(1

    1

    n

    ii xxn

    S

    Pues conociendo la distribucin podremos hacer algunas estimaciones de losparmetros poblacionales como media, varianza, proporcin, etc..

    En este sentido la teora de la estadstica, as como la ley de los grandesnmeros que nos dice que al sumar un nmero considerable de variablesaleatorias, la suma se aproxima a una distribucin normal, ambas nos dan una

  • respuesta respecto del modelo de distribucin. As que es necesario mencionarcomo es que se obtienen los modelo de distribucin t , X 2 y F.

    Los tres modelos de distribucin anteriores, se infieren a partir de la distribucinnormal estndar (de media cero y varianza uno).

    Distribucin X 2

    Considere X1, X2,, Xn n-variables aleatorias normales estndar, las cualestienen distribucin particular y totalmente conocida. Entonces la variable Y:

    Y = X12 + X2

    2 ++ Xn2

    Tendr distribucin X 2 (Ji-Cuadrada) con n-grados de libertad.

    Como se interpreta esto?.

    Lo anterior equivale a un resultado probabilistico que nos dice que si se extraeuna muestra aleatoria de tamao n de una distribucin normal estndar y conella obtenemos la suma de sus cuadrados , el resultado tendr una distribucintotalmente conocida llamada X 2.

    Los grados de libertad indican el nmero de variables que se estn sumando yque se refiere a que tanta libertad tiene la variable Y para tomar valores, porejemplo si n=20 y Y=10 entonces este ltimo nmero puede provenir deinfinidad de valores por ejemplo: X1

    2= X22 =X3

    2 ==X202=1, o tantas

    combinaciones de las Xi las cuales pueden considerarse de 20 posibles valoresdistintos.

    A saber la grfica de un modelo X 2 es:

    As que un estadstico comnmente utilizado para estimar la varianza de unapoblacin es:

    2

    2)1(

    Sn

    El cual tiene una distribucin X 2 con n-1 grados de libertad.

  • Este estadstico es til porque su expresin nicamente tiene como parmetrodesconocido a la varianza poblacional 2 por lo cual si se desear determinarun intervalo de estimacin para 2 se podr hacer a travs de dicho estadstico,como se ver en el siguiente captulo.

    Distribucin t-Student

    Esta distribucin se deduce tambin a partir de la distribucin normal estndar,como se indica a continuacin:

    Considere que se extrae una muestra aleatoria de una distribucin normalestndar, obtenindose X y X1, X2,,Xn. Entonces la variables resultado Y:

    nXXXX

    Yn /...21

    tendr distribucin t de student con n-grados de libertad.

    As, para un valor particular de tamao de muestra n, la distribucin t presentauna grfica en particular, que es:

    0.05

    0

    Sin embargo si el tamao de muestra es mayor a 30 entonces la distribucin tes casi una normal estndar.

    En este caso, un estadstico comnmente utilizado para estimar la media deuna poblacin es:

    nSX

    /

    El cual tiene una distribucin t con n-1 grados de libertad.

    Este estadstico es til porque su expresin nicamente tiene como parmetrodesconocido a la media poblacional.

    La demostracin se hace a partir del hecho que:

    nX

    /

    tiene distribucin normal estndar.

    Y el estadstico

  • 22)1(

    Sntiene distribucin Ji-cuadrada con n-1 g.l.

    Por lo cual el estadstico

    1/)1(/

    2

    2

    nSn

    nX

    tendr distribucin t-student (por frmula de la t-student). Pero la ecuacinanterior es igual a:

    nSX

    Sn

    X

    //

    Que es a lo que queramos llegar.

    Distribucin F-Fisher.

    El caso de la distribucin F tambin se deduce a partir del modelo dedistribucin normal estndar, como sigue:

    Sea X1, X2,, Xn una muestra aleatoria de n-valores provenientes de unanormal estndar y Y1, Y2, ,Ym m-variables valores tambin de una normalestndar, entonces el resultado aleatorio F como sigue:

    mYYYnXXX

    Fm

    n

    /)...(/)...(

    222

    21

    222

    21

    F tendr una distribucin F con n-grados de libertad en el numerador y m-grados de libertad en el denominador.

    En este caso, si se desea hacer inferencias respecto a las varianzas de dospoblaciones (por ejemplo quin produce con menos error de manufactura, laempresa A o la empresa B). Para ello se calcula las varianzas muestralesextradas de dos poblaciones distintas y el estadstico S12 / S22 se comportarcomo un modelo F, lo anterior se cumple siempre y cuando la varianza de laprimera poblacin (12) sea igual a la varianza de la segunda poblacin (22),ya que el estadstico:

  • 22

    21

    22

    22

    12

    21

    )1(

    )1(

    SS

    Sm

    Sn

    se comporta como una distribucin F con n-grados de libertad en el numeradory m-grados de libertad en el denominador.

  • 1CAPITULO III. ESTIMACIN DE PARMETROS EINTERVALOS DE CONFIANZA

    La accin directiva tiene en las crisis su campo natural de trabajo, pues esatributo del director el enfrentamiento de ellas, sea para prevenirlas, sea pararesolverlas o bien sea para amortiguar sus consecuencias, pero sea cual fuerela situacin de la alta direccin, el uso de los mtodos cuantitativos esinnegable; y entre ellos, la Estadstica no es precisamente el de menor uso. Yclaro est, que el anlisis e interpretacin de los estados financierosprovenientes de la contabilidad es el terreno del cual parten las accionesdirectivas.

    Los modelos estratgicos para el manejo de las empresas suelen estudiarsepara su aplicacin en situaciones de normalidad, siendo muy pocos losestudios que se refieren precisamente a las coyunturas1 de turbulencia,complejidad e incluso caos indomeable2, siendo aqu, donde la maximizacinde los recursos de la empresa y la minimizacin de los costos, requiere conmayor fuerza de los mtodos cuantitativos y en particular de la investigacin deoperaciones junto con la Estadstica.

    El estudio o tratamiento de empresas en crisis, es ahora inevitable, ya que losmomentos de crisis son ahora ms comunes y frecuentes que los momentos denormalidad, provocando que en nuestros tiempos la accin directiva puederesumirse sucintamente as: Accin de sntesis sobre las situaciones criticas.

    El trabajo de direccin se caracteriza por no contar con reglas fijas conocidas, ycuyos resultados son inciertos (aunque implique la obligacin de acertar).

    III.1. Estimacin de parmetros

    En el ltimo tema vimos como se puede emplear la teora del muestreo pararecabar informacin acerca de muestras aleatorias tomadas -de una poblacinconocida3. Desde un punto de vista prctico, no obstante, suele resultar msimportante ser capaz de inferir informacin sobre la poblacin a partir demuestras suyas. Con tal situacin trata la inferencia estadstica, que usa losprincipios de la teora del muestreo.Un problema importante de la inferencia estadstica es la estimacin deparmetros de la poblacin, o brevemente parmetros (tales como la mediao la varianza de la poblacin), de los correspondientes estadsticosmuestrales, o simplemente estadsticos (tales como la media y la varianza dela muestra).

    Consideremos este problema en nuestro presente tema.

    1 Combinacin de factores y circunstancias que, para la decisin de un asunto importante, se presenta en una nacin. (diccionario dela real academia espaola)2 indomable. (DRAE)3

    Cuando la poblacin de inters no es muy grande y se tiene acceso a ella, se puede calcular fcilmente los parmetros de lamisma; sin embargo, en la mayora de los casos es necesario estimar la media de la poblacin y algunos otros parmetros. (DouglasA. Lind., et al. Estadstica para administracin y economa editorial: Irwin-McGraw-Hill. P.p 242)

  • 2Demos una definicin tcnica para poder continuar con el anlisis. Utilicemosa como un smbolo genrico de un parmetro poblacional y, para indicaruna estimacin de a basada en datos de la muestra. Una vez acordado estopodemos decir que:

    Estimador.

    En donde se llama estimador puntual4 al nmero (punto sobre la recta real),que se calcula a partir de una muestra dada y que sirve como unaaproximacin (estimacin) del valor exacto desconocido del parmetro de lapoblacin. Es decir:

    4 Kreyszig. Erwin. Matemticas avanzadas para ingeniera. Editorial: Limusa. Vol. 2. p.p 958

    Un estimador de un parmetro a es una funcin de los valoresmuestrales aleatorios, que proporciona una estimacin puntual de a. Unestimador es en s una variable aleatoria y por consiguiente tiene unadistribucin muestral terica.

    Estimador puntual:

    Valor que se calcula a partir de la informacin de la muestra, y quese usa para estimar el parmetro de la poblacin.

  • 3Existe una distincin tcnica entre un estimador como una funcin de variablesaleatorias y una estimacin como un nico nmero. Tal distincin se refiere alproceso en s (estimador) y el resultado de dicho proceso (la estimacin.) Loque en realidad importa de esta definicin es que: nosotros solo podemosdefinir buenos procesos (estimadores), mas no garantizar buenos resultados(estimaciones).

  • 4Por ejemplo:

    Como una aproximacin5 de la media de una poblacin, puede tomarse lamedia 6 de una muestra correspondiente, lo cual da la estimacin: = ,para , es decir:

    ==

    ni

    iixn 1

    1----------------(1)

    donde n= tamao de la muestra.Del mismo modo, una estimacin para la varianza de una poblacin, es lavarianza de una muestra correspondiente; es decir:

    ni

    ii xxn

    s1

    22 )(1

    1-------------(2)

    evidentemente estos casos 1 y 2 son estimaciones de los parmetros paradistribuciones en las que o bien la varianza aparecen explcitamente comoparmetros, tales como las distribuciones Normal y de Poisson. Aqu, podemosmencionar que (1) es un caso muy especial del llamado Mtodo de losmomentos. En este mtodo, los parmetros que van a estimarse se expresanen trminos de los momentos de la distribucin7, en las frmulas resultantes,esos momentos se reemplazan por los momentos correspondientes de lamuestra. Esto proporciona las estimaciones deseadas. Aqu, el k-simomomento de una muestra x1, x2,...xn, es:

    ni

    i

    kik xn

    m1

    )(1

    5 Kreyszig. Erwin. Matemticas avanzadas para ingeniera vol. 2. editorial: limusa. P.p 9586 considerse a este smbolo como la media aritmtica de la muestra.7 Para mayor informacin consulte la seccin 19.8 del libro: Matemticas avanzadas para ingeniera de Erwin Kreyszig. Editorial:Limusa. Vol. 2.

    la media muestral ()* es el mejor estimador de una poblacin normal (), sinembargo no podemos garantizar que el resultado sea ptimo todas las veces.Es decir, no podemos garantizar que, para cada muestra, la media muestralest siempre ms cerca de la media poblacional, que, digamos, la medianamuestral. As, lo ms que podemos hacer es encontrar estimadores que denbuenos resultados en el lmite.

    * en realidad debe ser una x barra.

  • 5Estimador insesgadoUn estimador que es una funcin de datos muestrales, se conoce

    como: Estimador insesgado del parmetro poblacional a si su valor esperadoes igual a e. Dicho de otra manera, es un estimador insesgado del parmetroa s:

    E() = a

    La condicin de que el estimador es insesgado supone que el valorpromedio de es exactamente correcto.Cuando es estimador es sesgado, la magnitud del sesgo viene dada por:

    Sesgo () = E () a

    Si la media de las distribuciones de muestreo de un estadstico es igual que ladel correspondiente parmetro de la poblacin, el estadstico se llama unestimador sin sesgo del parmetro; si no, se llama un estimador sesgado. Loscorrespondientes valores de tales estadsticos se Llaman estimaciones sinsesgo y sesgadas, respectivamente.

    Por ejemplo:

    En trminos de Esperanzas, podramos decir que un estadstico es insesgadosi su esperanza es igual al correspondiente parmetro de poblacin.

    Estimador Eficiente

    Se dice que un estimador es el ms eficiente para un problema particularcuando tiene el error estndar ms pequeo de todos los estimadoresinsesgados posibles.

    Se utiliza la palabra eficiente porque, en una situacin dada, el estimador haceel mejor uso posible de los datos muestrales. Y de acuerdo con la teoraestadstica clsica, en trminos generales se debe preferir el estimadorinsesgado ms eficiente sobre cualquier otro. De aqu, ms adelante veremosque las Hiptesis nos dicen cual es el estimador ms eficiente de un ciertoparmetro en un momento dado.

    As por ejemplo

    La media de las distribuciones de muestreo de medias xy, la mediade la poblacin. Por tanto, la media muestral xes una estimacin sinsesgo de la media de la poblacin .

    si las distribuciones de muestreo de dos estadsticos tienen la misma media (oesperanza), el de menor varianza se llama un Estimador eficiente de la media,mientras que el otro se llama un estimador ineficiente. Los valorescorrespondientes de los estadsticos se llaman estimacin eficiente yestimacin ineficiente, respectivamente.

  • 6Si consideramos todos los posibles estadsticos cuyas distribuciones demuestreo tienen la misma media, aquel de varianza mnima se llama a veces elestimador de mxima eficiencia, o sea, el mejor estimador.

    Ejemplo

    En la prctica, las estimaciones ineficientes se usan con frecuencia a causa dela relativa sencillez con que se obtienen algunas de ellas.

    De manera desafortunada, las declaraciones de eficiencia dependenfuertemente de algunos supuestos. Por ejemplo, cuando la distribucin de lapoblacin no es normal, la media muestral no es siempre el estimador mseficiente. Con lo cual surge un tema de investigacin en la teora estadstica, esel de los llamados estimadores robustos: estadsticos casi insesgados y casieficientes para una gran variedad de distribuciones poblacionales. Semejantesestimadores todava son motivo de estudio en la teora estadstica.

    Estimador consistente

    Por ejemplo:

    Un estimador inconsistente es a todas luces un mal estimador y no esaconsejable dar una estimacin imprecisa basada en una infinidad de datos,cosa que puede suceder si el sesgo de un estimador se aproxima a cero amedida que n tiende a infinito. Por ejemplo, utilizar el 25 percentil para estimarla mediana poblacional producira un estimador inconsistente. Tambin habrainconsistencia si el error estndar de un estimador no tiende a cero a medidaque el tamao muestral crece.

    Las distribuciones de muestreo de media y mediana tienen ambas la mismamedia, a saber, la media de la poblacin. Sin embargo, la varianza de ladistribucin de muestreo de medias es menor que la varianza de ladistribucin de muestreo de medianas. Por tanto, la media muestral da unaestimacin eficiente de la media de la poblacin, mientras la mediana de lamuestra da una estimacin ineficiente de ella.

    Un estimador es consistente si se aproxima al parmetro poblacional conprobabilidad uno a medida que el tamao de la muestra tiende a infinito.

    la media muestral xde una muestra aleatoria tiene valor esperado y unerror estndar que se aproxima a cero a medida que n tiende a infinito. Porlo tanto, cuando el tamao de la muestra tiende a infinito, la media muestral

    x se aproxima a tanto como se quiera. Y de acuerdo con la definicin,la media muestral x es consistente.

  • 7Mtodo de mxima verosimilitud8

    Para responder a la pregunta: Cmo se procede en cualquier situacin demuestreo para encontrar un estimador de un parmetro?, la Estadstica dice:Con el mtodo de mxima verosimilitud de R. A. Fisher9. el cual es unprocedimiento general para la seleccin de estimadores.

    Hay varias razones por las que se quiere utilizar un estimador de mximaverosimilitud para un parmetro; aunque dichos estimadores no siempre soneficientes e insesgados, por lo general son la mejor opcin que se tiene debidoa las siguientes propiedades:

    A medida que se incrementa el tamao muestral, el sesgo del estimadorde mxima verosimilitud tiende a cero.

    Su error estndar se aproxima al mnimo error estndar posible. Y

    Su distribucin muestral se aproxima a la normal.

    Debido a estas propiedades, muchos investigadores estn a favor del uso delos estimadores de mxima verosimilitud en gran cantidad de situaciones demuestreo.

    Pero veamos con ms detalle cmo podemos encontrar un estimador demxima verosimilitud.

    Por lo tanto, empecemos por entender qu es la funcin de verosimilitud.

    FUNCIN DE VEROSIMILITUD10

    Para explicarla11, sea una variable aleatoria12 discreta (o continua) Y cuyafuncin de probabilidad (o densidad) fY(y) depende de un solo parmetro a ytmese una muestra correspondiente de n valores independientes: y1,y2,,yn. Entonces, en el caso discreto la funcin de verosimilitud L es la

    8 Hildebrand, David, K. & Lyman Ott. R. Estadstica aplicada a la administracin y a la economa. Editorial: Addison WesleyLongman. P.p 2859 Sir Ronald Alyner Fisher (1890-1962) fue un especialista ingls en gentica y estadstica, experimento la necesidad de precisar losmtodos estadsticos para interpretar datos cualitativos. En sus trabajos sobre pruebas de hiptesis, desarrollo aplicaciones de ladistribucin F, por lo que lleva su nombre. Esta distribucin se utiliza para probar la varianza de pequeas muestras de unapoblacin. (nota tomada del libro: probabilidad y Estadstica de Stephen S. Willoughby. Editorial: Publicaciones cultural S.A. p.p122)10 Hildebrand, David, K. & Lyman Ott. R. Estadstica aplicada a la administracin y a la economa. Editorial: Addison WesleyLongman. P.p 28611 Kreyszig. Erwin. Matemticas avanzadas para ingeniera. Editorial: Limusa. Vol. 2. p.p 95812 ver anexo 1

    Por lo general, los estimadores inconsistentes son el resultado de algunaequivocacin o, lo que es ms probable, resultan del fracaso de unahiptesis clave.

  • 8probabilidad de observar los datos que de hecho se estn observando, esdecir:

    L(y1,y2,,yn,a) = P(y1,y2,yn)

    Que consideramos como una funcin del parmetro desconocido de lapoblacin a. Y si los datos se toman de una distribucin continua, la distribucinde probabilidad P se reemplaza por la funcin de densidad f, es decir:

    L (y1,y2,yn, a) = f(y1,y2,,yn)

    Suponiendo que los valores muestrales se toman independientemente,podemos obtener la probabilidad P o la densidad f como un producto, tal comose indica a continuacin:

    La probabilidad en el caso discreto de que una muestra de tamao n consistade esos n valores es:

    L(y1,y2,,yn, a) = P(y1)P(y2)P(yn)

    Y en el caso continuo, la probabilidad de que la muestra consista de valores, enpequeos intervalos pertenecientes a la muestra es:

    L(y1,y2,,yn, a) = f(y1)f(y2)f(yn)

    Ya que f(yi) depende de a, la funcin L depende de y1, y2,,yn y a. Siconsideramos adems que: y1, y2,,yn son dados y fijos; entonces L es unafuncin de a, que se llama funcin de verosimilitud.

    Es decir, que si, en un experimento binomial con n=5, obtenemos y=2,entonces la verosimilitud es simplemente la probabilidad de dos xitos en cincoensayos tomada como una funcin de la probabilidad de xito desconocida dela poblacin, P.

    Por ejemplo13:suponga que independientemente de lo que sucede el resto de los das, elnmero de trabajos que llegan en un da a un despacho contable tiene unadistribucin de Poisson con media desconocida . Suponga adems que elprimer da de la muestra llega slo un trabajo y que el segundo (y ltimo) dallegan cuatro. Escriba la funcin de verosimilitud.

    Para resolver este problema, la metodologa es la siguiente:

    Primer paso: debemos escribir la frmula bsica de la cual estamospartiendo, identificando exhaustivamente todas sus variables; en estecaso, la frmula corresponde a una distribucin de Poisson, por lo tanto,recordando que la distribucin de Poisson es discreta con:

    13 Hildebrand, David, K. & Lyman Ott. R. Estadstica aplicada a la administracin y a la economa.Editorial: Addison Wesley Longman. P.p 287

  • 9!y

    eyPy

    en donde: es el nmero esperado de eventos que suceden en unperiodo y

    e = 2.71828....

    Segundo paso: sustituir los valores o datos dados por el problema en lafrmula original, teniendo en cuenta la teora de la funcin deverosimilitud. Los valores observados son: y1=1 e y2=4. por lo tanto, lafuncin de verosimilitud estar formada por el producto para cada uno de losdatos de la frmula misma. Es decir:

    L(1,4, ) = )!4

    )(!1

    (41 ee

    Tercer paso: realizar las operaciones algebraicas correspondientes a lareduccin de la frmula; lo cual quiere decir que finalmente la frmulaanterior se puede reducir a:

    L(1,4,) =)!4)(!1(

    52 e

    Siendo este ltimo resultado la funcin de verosimilitud solicitada en elproblema.A continuacin es necesario entender qu es una estimacin de mximaverosimilitud.

    En el ejemplo anterior podemos encontrar a travs de las tablascorrespondientes que el valor de que maximiza la funcin de verosimilitud es2.5, as la estimacin mximo verosmil es = 2.5

    En un principio siempre es posible encontrar estimadores de mximaverosimilitud calculando numricamente la funcin de verosimilitud. Noobstante, el utilizar el clculo diferencial simplifica el trabajo de encontrar talesestimadores.

    y2=4y1=1

    Estimacin mximo verosmil.

    Para valores observados en una muestra y1, y2,...,yn, la estimacinmximo verosmil de un parmetro e es el valor que maximiza la funcinde verosimilitud L (y1,,y2, e).

  • 10

    La idea bsica14 del mtodo de mxima verosimilitud es muy sencilla y es comosigue:

    Se elige aquella aproximacin para el valor desconocido de a para el cual Lsea tan grande como sea posible. Si L es una funcin diferenciable de a, unacondicin necesaria para que L tenga un mximo (no en la frontera) es:

    0L

    ----------------------6

    se escribe una derivada parcial, debido a que L tambin depende de:y1, y2,...,yn y una estimacin de (6) que depende de y1, y2,...,yn, se llamaestimacin de mxima verosimilitud para a.

    Recordemos que para determinar el mximo de una funcin se iguala a cero laprimera derivada y se resuelve la ecuacin que de ello resulta.

    En los problemas de mxima verosimilitud con frecuencia es msconveniente trabajar con el logaritmo natural de la verosimilitud que conla verosimilitud misma. Por lo tanto, podemos reemplazar (6) por:

    0)ln( L

    -----------------7

    debido a que 0f , un mximo de f en general es positivo y ln (L) esuna funcin montona creciente15 de L. Esto a menudo simplifica losclculos.

    En principio se debera utilizar el criterio de la segunda derivada paraasegurarse que lo que se obtiene es un mximo y no un mnimo. No obstantees muy claro que la solucin de la ecuacin correspondiente a la primeraderivada produce un estimador de mxima verosimilitud y no un mnimo.

    Finalmente, si la distribucin de Y contiene r parmetros: a1, a2,...,ar,entonces en lugar de (6) se tiene las r condiciones:

    01

    L

    , 02

    L

    ,..., 0

    r

    L

    y en lugar de (7) tenemos:

    0)ln(

    1

    L

    , 0)ln(

    2

    L

    ,..., 0)ln(

    r

    L

    14 Kreyszig, Erwin. Matemticas avanzadas para Ingeniera. Editorial: Limusa. Vol. 2. p.p 95915 En virtud de que el logaritmo natural es una funcin creciente, a medida que la verosimilitud seincrementa hacia su mximo, tambin lo hace su logaritmo.

  • 11

    Por lo tanto, continuando con el ejemplo anterior tenemos que:

    la funcin de verosimilitud era:

    L(1,4,) =)!4)(!1(

    52 e

    De modo que continuando con el proceso, el logaritmo natural de laverosimilitud es:

    L(1,4, ) = 2ln e +)!4)(!1(

    ln5

    de donde por leyes de los logaritmos, esta ecuacin queda de la siguientemanera:

    L(1,4, ) = -2(ln e)+ )!4)(!1(lnln 5 continuando con las leyes de los logaritmos, la expresin toma la formasiguiente:

    L(1,4, ) = -2+ 5 ln- ln [(1!)(4!)[

    y extrayendo la primera derivada a esta ecuacin tenemos que sta cobra lasiguiente forma:

    )!4)(!1ln()ln5()2(),4,1(

    dd

    dd

    dd

    ddL

    de donde aplicando leyes de la derivacin matemtica tenemos que estaexpresin se convierte en:

    5

    2),4,1(

    ddL

    continuando con el proceso, igualamos a cero esta primera derivada,quedando la expresin como se indica a continuacin:

    05

    2),4,1(

    ddL

    que es lo mismo que:

    05

    2

    de donde resolviendo esta ecuacin de primer grado con una incgnitatenemos que:

  • 12

    = 2.5

    de modo que la estimacin de mximo verosmil o de mxima verosimilitud de, es = 2.5, es decir, el promedio de trabajos que llegan al despacho es 2.5por da, o bien 5 cada dos das.

    en resumen, la metodologa para encontrar una estimacin de mximoverosmil es:

    Metodologa para encontrar un estimador de mxima verosimilitud:

    Ejercicios propuestos:

    1. Considere un experimento binomial que consiste de saber laaceptacin de un producto en el mercado y suponga con fines

    Este smbolo llevaacento circunflejopara indicar que esuna estimacin.

    Primer paso: identificar la frmula bsica a que se refiere el problema juntocon todas sus variables de manera exhaustiva.

    Segundo paso: encontrar la funcin de verosimilitud correspondiente(sustituyendo los datos dados en la formula original,teniendo en cuenta la teora de la funcin de verosimilitud).

    Tercer paso: aplicar la funcin Logaritmo natural a la funcin deverosimilitud.

    Cuarto paso: realizar las operaciones propias de los logaritmos paradesglosar la funcin en sumas y restas,(dentro de las cualeses comn que queden comprendidas: multiplicaciones ydivisiones).

    Quinto paso: aplicar la primera derivada a la funcin logaritmo natural.

    Sexto paso: realizar operaciones correspondientes a la teora dederivacin.

    Sptimo paso: igualar el resultado reducido de la primera derivada a cero.

    Octavo paso: resolver la ecuacin de primer grado resultante, con lo cualobtenemos el resultado del estimador de mximaverosimilitud.

  • 13

    ilustrativos que n = 5 Y y = 2. Encuentre el estimador de mximoverosmil correspondiente.

    Como primer paso para resolver este problema, identificamos que setrata de una distribucin de tipo binomial, cuya frmula es la siguiente:

    ynynyY qpCyP

    )()()(

    en donde: n = nmero de experimentosy = nmero de evento en el cual queremos tener xito.p = probabilidad de xitoq = probabilidad de fracaso. (q = 1 p)

    nyC = nmero de combinaciones de n elementos tomados

    de y en y.

    Por lo tanto, la frmula anterior, tambin la podemos escribir de lasiguiente forma:

    ynyY ppyny

    nyP

    )1()(

    )!(!!

    )(

    como segundo paso tenemos que sustituir los datos dados por el problemaen la frmula para encontrar la funcin de verosimilitud correspondiente.

    Por lo tanto:252 )1()(

    )!25(!2!5

    ),2( pppL

    de donde realizando algunas operaciones tenemos que:32 )1()(

    )!3)(!2(!5

    ),2( pppL

    siendo esta la verosimilitud del problema (note que debido a la continuacindel problema, no es necesario resolver el nmero de combinacionespresentada)

    como tercer paso, aplicamos la funcin logaritmo natural a la funcin deverosimilitud, quedando esta como se indica a continuacin:

    32 )1ln()ln())!3)(!2(

    !5ln(),2( pppl

    de donde aplicando leyes de los logaritmos -como cuarto paso-, setransforma en:

    )1ln(3)ln(2)[!3)(!2ln()!5[ln(),2( pppl

    de donde como quinto paso procedemos a calcular la primera derivadade esta expresin matemtica:

  • 14

    )1)(1

    1(3

    1200),2(

    pp

    plp

    es decir, al realizar las operaciones correspondientes como sexto paso,queda de la siguiente manera:

    pppl

    p

    1

    32),2(

    de donde, igualando esta primera derivada a cero como sptimo paso-la expresin se transforma en:

    pp

    132

    0

    o bien:

    01

    32

    pp

    finalmente como octavo paso, procedemos a resolver esta ecuacin deprimer grado con una incgnita.

    01

    32

    pppasando el segundo trmino al segundo miembro tenemos:

    pp

    132

    pasando el denominador del primer miembro al segundo miembro, y eldenominador del segundo miembro al primer miembro tenemos:

    )(3)1(2 pp

    eliminando parntesis, la expresin toma la forma:

    pp 322

    y pasando el segundo miembro al primer miembro:

    0322 pp

    efectuando reduccin de trminos:

    052 p

    pasando el segundo trmino del primer miembro al segundo miembro:

    2do.trmino1er.

    trmino

  • 15

    p52

    y finalmente despejando el valor de p tenemos que:

    p52

    52p

    siendo esta la respuesta al problema propuesto, es decir, que laprobabilidad de xito en el segundo intento de un experimento binomialcon n=5 es de: P=0.40 (40% del mercado aceptan el producto).

    ESTIMACIN POR EL MTODO DE MOMENTOS.

    El caso de la estimacin por momentos es otra metodologa que estima el parmetropoblacional igualando los momentos muestrales con los momentos poblacionales.

    Como se mencion en la seccin III.2. el primer momento poblacional es E(X) (valoresperado de X), el segundo momento poblacional es E(X2), as sucesivamente. Mientras

    que el primer momento muestral es xxn

    n

    ii1

    1 (el promedio de la muestra), el segundo

    momento muestral es

    n

    iixn 121 , as sucesivamente.

    Considere el caso de una poblacin cuya funcin densidad de probabilidad es fx(x) yparmetro desconocido, como sigue:

    0.C.0

    101

    Xfx x

    Entonces si quisiramos estimar el parmetro, entonces debemos calcular el primermomento poblacional e igualarlo con el primer momento muestral, a saber:

  • 16

    momentos.porpuntualestimando

    112

    121

    :21

    :,21

    :tenemosmuestral,momentoprimerelconlpoblacionamomentoprimerelIgualando21

    21

    11

    )(xE

    momentos.demetodoelporEstimar

    1

    10

    2110

    10

    xxxx

    deciresx

    tenemosdespejandoY

    xnX

    xdxxdxxxE

    dxxxfx

    As por ejemplo si la variables estudiada X es el porcentaje de agrado de un producto ydicho porcentaje (de 0 a 100) se distribuye de a cuerdo a la funcin de densidad fx(x)(que para asumir cierto modelo se puede utilizar una prueba de bondad de ajuste),entonces para estimarse determina una muestra aleatoria en la cual consideramos quearroja un promedio 39.0x (es decir 39% de satisfaccin). Por lo cual en este caso el

    estimador dees: 36.039.01

    1)39.0(21

    12 x

    x , valor que no tiene significado

    prctico pero que a partir del cual se describe le comportamiento de la poblacin y en la

    cual el promedio es 39.0236.0136.0

    21

    )(

    XE y as mismo se puede calcular la

    mediana, moda, varianza, entre otras caractersticas.

    ESTIMACIN DE MEDIAS Y DESVIACIONES ESTNDAR16.

    En estadstica, numerosos problemas estn relacionados con laestimacin de la media o la desviacin estndar de una poblacin dada, a partirdel estudio de una muestra de tamao n.

    Por ejemplo:

    A una empresa le puede interesar el nmero promedio de piezasdefectuosas producidas por una cierta mquina; A un ingeniero especialista en vehculo le puede interesar la

    variabilidad en el funcionamiento de un tipo vehculo.

    En las secciones anteriores se vio que si se supone que cada muestra detamao n tiene la misma probabilidad de ser seleccionada, entonces la mediade la distribucin de las medias de la muestra es la misma que la de la

    16 Stephen S. Willoughby. Probabilidad y Estadstica. Editorial: Publicaciones cultural, s.a. p.p 138-140

  • 17

    poblacin original,x=. An ms, para poblaciones suficientemente

    grandes, o para muestreos con reemplazo, la desviacin estndar de ladistribucin de las medias de la muestra,

    x , est relacionada con la

    desviacin estndar de la poblacin , por la ecuacin:

    nx

    si en una aplicacin particular fuera prctico seleccionar todas lasposibles muestras de tamao n, para determinar la media de cada una deellas y, despus, calcular la media y la desviacin estndar de la distribucin delas medias de las muestras, las frmulas anteriores permitiran calcular y directamente. Por lo general, este procedimiento no es prctico. Lo quecomnmente se hace es no estudiar todas las muestras de tamao n sino

    nicamente una de ellas. La media_

    x y la desviacin estndar s, de esamuestra nicamente se toman como estimaciones de y , la media y ladesviacin estndar que corresponden a la poblacin original. Puesto que

    x= y nx , las estimaciones para x y x , son

    _

    x yn

    s

    respectivamente. Enseguida se ilustra el procedimiento de estimacin con unejemplo:Ejemplo17:

    17 Stephen S. Willoughby. Probabilidad y Estadstica. Editorial: Publicaciones cultural, s.a. p.p 139-140

    Se escoge una muestra aleatoria de 36 recin egresados en la carrera decontadura de cierta universidad y al aplicarles un examen de aptitudes, seobtuvieron las siguientes puntuaciones:

    63 64 64 65 65 6666 66 67 67 67 6767 68 68 68 69 6969 69 69 70 70 7071 72 72 72 72 7373 74 74 76 76 77

    La media de la muestra_

    x es de 69, (al punto ms prximo), y la desviacin

    estndar s, es de 3.5. utilizando_

    x y s como estimaciones de y , podemosafirmar que la puntuacin media de todos los recin egresados de dichauniversidad es de alrededor de 69 puntos. An ms, podemos decir que ladesviacin estndar de las puntuaciones de los recin egresados respecto a lamedia es, aproximadamente, 3.5 puntos.

  • 18

    el procedimiento anterior es satisfactorio tal como se ha presentado. Elproblema estriba en el contenido de las palabras alrededor de yaproximadamente. Cuando decimos que la altura promedio de los nios es dealrededor de 69 cm, queremos significar que esta altura tiene cuando mucho1 o 10 cm. De diferencia con respecto al verdadero promedio?. Por supuesto,la exactitud de nuestra estimacin depende de la muestra escogida.Afortunadamente, en el caso de muestras aleatorias, es posible dar apoyoprobabilstico al significado de las palabras alrededor de y aproximadamente.

    Un hecho importante que se debe tener en cuenta en la distribucin de lasmedias de las muestras, cuando sta es grande y se seleccionaaleatoriamente, es que se puede aproximar a una distribucin normal quetenga la misma media x y la misma desviacin estndar x . La demostracindel hecho anterior algunas veces se llama teorema central del lmite- va msall del alcance de estas notas.Puesto que la distribucin de las medias de las muestras es aproximadamentenormal, se puede utilizar ventajosamente el conocimiento sobre este tipo dedistribucin,

    III.3. ESTIMACIONES POR INTERVALO y FIABILIDAD

    Una estimacin de un parmetro de la poblacin dada por un solo nmero sellama una estimacin de punto del parmetro. No obstante18, un estimadorpuntual slo refiere una parte de la historia. Si bien se espera que el estimadorpuntual est prximo al parmetro de la poblacin, se deseara expresar qutan cerca est. Un intervalo de confianza sirve a este propsito.

    Es decir, Una estimacin de un parmetro de la poblacin dada por dosnmeros, entre los cuales se puede considerar encajado al parmetro, se llamauna estimacin de intervalo del parmetro.

    18 Douglas A. Lind., et al. Estadstica para administracin y economa editorial: Irwin-McGraw-Hill. P.p 242

    Intervalo de confianza:

    Un rango de valores que se construye a partir de datos de lamuestra de modo que el parmetro ocurre dentro de dicho rango con unaprobabilidad especfica. La probabilidad especfica se conoce como: nivelde confianza.

    Las estimaciones de intervalo indican la precisin de una estimacin yson por tanto preferibles a las estimaciones de punto.

  • 19

    Por ejemplo:

    El margen de error (o la precisin) de una estimacin nos informa de sufiabilidad.

    III.4. INTERVALO PARA ESTIMAR LA MEDIA

    De acuerdo a tablas de la distribucin normal estndar el rea bajo la curva,entre x= -