monografia apa

44
UNIVERSIDAD NACIONAL DEL CENTRO DEL PERÚ FACULTAD DE ADMINISTRACIÓN DE EMPRESAS LIMITE DE CONFIANZA, TAMAÑO MUESTRAL EN DATOS CONTINUOS Y FIJACIONES POR BALTAZAR INGA THALI CASTRO CUÑAS YURICO CHANCO SANCHEZ JOSE GAVINO ROJAS LUIS GONZALES VENEGAS JAZMÍN HUANCAYO - PERÚ 2012 1

Upload: elimaverickquisperamos

Post on 06-Nov-2015

3 views

Category:

Documents


0 download

DESCRIPTION

Monografia APA

TRANSCRIPT

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER

FACULTAD DE ADMINISTRACIN DE EMPRESAS

LIMITE DE CONFIANZA, TAMAO MUESTRAL EN DATOS CONTINUOS Y FIJACIONES

PORBALTAZAR INGA THALICASTRO CUAS YURICOCHANCO SANCHEZ JOSEGAVINO ROJAS LUISGONZALES VENEGAS JAZMN

HUANCAYO - PER2012

Dedicatoria

Este trabajo se lo dedicamos a nuestros padres quienes da a da nos brindan lo mejor de s y se esfuerzan por sacarnos adelante para lograr ser personas de bien para la sociedad con una profesin.

Agradecimientos

En esta oportunidad expresamos nuestro ms sincero agradecimiento a nuestros padres quienes nos han brindado su apoyo en todo momento para realizar el presente trabajo.

Asimismo, de una manera muy especial nuestra mayor consideracin al Lic. Carlos Berrocal Gutarra por cada una de las enseanzas que nos brinda.

Por ltimo nuestro sincero agradecimiento a todas aquellas personas quienes nos la informacin para la realizacin de la presente monografa.

ResumenYa vimos que la primera gran clasificacin de los diferentes mtodos de muestreo depende del conocimiento o desconocimiento de las probabilidades de seleccin de cada muestra posible. De all que a un grupo de estos mtodos se los denomine, segn los autores, muestreo con probabilidad conocida, muestreo con probabilidad o muestreo probabilstico, mientras que al otro se lo conoce como muestreo sin probabilidad conocida, muestreo sin probabilidad o muestreo no probabilstico. El muestreo probabilstico, a partir del conocimiento de la probabilidad de seleccin, es la nica tcnica de muestreo que brinda una medida de la confianza de las estimaciones de parmetros(1).El muestreo al azar simple es el mtodo probabilstico ms sencillo. Se caracteriza porque todas las muestra posibles de un universo determinado cuentan con la misma oportunidad de ser seleccionadas. Pero la importancia del muestreo al azar simple radica ms en su utilidad terica y como elemento introductorio de los conceptos bsicos de muestreo que en su aplicacin prctica, ya que, pese a su sencillez, solo puede ser utilizado bajo determinadas condiciones, lo que lo hace poco recomendable en la mayora de las investigaciones.El muestreo al azar simple solo es aplicable cuando se dispone de un listado satisfactoriamente completo de los elementos de la poblacin.El muestreo al azar simple no es aconsejable cuando el costo de recoleccin del dato difiere en forma importante dependiendo de cuales sean los elementos seleccionados (a partirde la dispersin geogrfica o dificultades para su ubicacin).El muestreo al azar simple solo debera usarse cuando no se dispone de otra informacin sobre la poblacin que la lista de sus componentes.

Abstract

INDICECartulaIDedicatoriaIIAgradecimientosIIIResumenIVAbstractVndiceVIIntroduccinVII

CAPTULO I: LIMITE DE CONFIANZA, TAMAO MUESTRAL EN DATOS CONTINUOS Y FIJACIONES1. La varianza estimada y lmites de confianza 81.1. Clculo del tamao de muestra en MAE101.2. Estimacin de medias y proporciones en MAE12

2. Estimacin del tamao de la muestra con datos continuos132.1. Estimacin de la media de poblacin142.2. Estimacin total de la poblacin15

3. Afijacin153.1. Estimadores y errores de muestreo163.2. Afijacin proporcional173.3. Afijacin ptima21

CAPTULO II: APLICACIN PRCTICA

Conclusiones 29Referencias 30

IntroduccinPara aplicar este diseo, se precisa que la poblacin est dividida en subpoblaciones, estratos, que no se solapen. Se selecciona una muestra probabilstica en cada estrato y se trabaja de manera independiente entre estratos.Razones de la popularidad de este mtodo:Permite realizar estimaciones de precisin expecifica en cada estrato;En un experimento, los aspectos prcticos relacionados con la respuesta, la medida o la informacin auxiliar pueden diferir considerablemente de una subpoblacin a otra.Cuestiones tcnicas que plantea este muestreo:i) Construccin de Estratos: Los objetivos del estudio y los recursos disponibles contestarn las siguientes cuestiones Qu caractersticas utilizar para dividir la poblacin en estratos?; Cmo se identificarn los estratos?; Cuntos estratos debehaber?.En particular, los estratos deben estar constituidos por unidades lo ms homogneas posibles; En el caso lmite de estricta homogeneidad bastara seleccionar una sola unidad en cada estratoii) Eleccin de una muestra y mtodos de estimacin en cada estrato; El proceso de muestreo se realizar de manera independiente en cada estratoVentajas de este diseo:i) Si las mediciones dentro de cada estrato son homognes, la estratificacin producir un lmite ms pequeo para el error de estimacin que el m.a.ii) Se puede reducir el costo por observacin al estratificar la poblacin en grupos convenientes.iii) Permite obtener estimaciones de parmetros poblacionales para subgrupos de la poblacin.

Los autores.

CAPTULO I

LIMITE DE CONFIANZA, TAMAO MUESTRAL EN DATOS CONTINUOS Y AFIJACIONES

1. La varianza estimada y lmites de confianza Segn G. Cochran: Si se toma una muestra simple dentro de cada estrato, una estimacin insesgada de(2000, p. 132)

Por lo tanto, obtenemos el siguiente teorema:Teorema: Con muestreo aleatorio estratificado, una estimacin insesgada de la varianza de:

Una forma alternativa para propsitos de clculo es:

De acuerdo con G. Cochran El segundo trmino del lado derecho de la expresin anterior representa la reduccin debida a la cpf.

Para calcular esta estimacin, debe haber cuando menos dos unidades provenientes de todos y cada uno de los estratos. La estimacin de la varianza cuando la estratificacin se lleva al punto en el cual slo se escoge una unidad por estrato.(2000, p. 132)

Las frmulas para los lrnites de confianza son:

Estas frmulas suponen que (Yst) "est normalmente distribuida y que (Yst) est bien determinada, de modo que el multiplicador pueda encontrarse en las tablas de la distribucin normal.

Si slo se dan algunos grados de libertad para cada estrato, el procedimiento usual para tomar en cuenta el error de muestreo inherentea una cantidad como (Yst) consiste en leer el valor en las tablas de la de Student, en lugar de la tabla normal. La distribucin de (Yst) es en general demasiado compleja, para permitir una aplicacin etricta de este mtodo. El siguiente es un mtodo aproximado de asignacin de un numero efectivo de grados de libertad a s(Yst).

El nmero efectivo de grados de libertad ne es:

El valor de n, siempre est entre el ms pequeo de los valores (nh- 1) y su suma. La aproximacin toma en cuenta el hecho de que Spuede variar de un estrato al otro y supone que Y sea normal, pues depende del resultado de que Ia varianza de S sea 2, (nh - 1). Si la distribucin de Y tiene una curtosis positiva, la varianza de Ssermayor que esto y la Frmula 5.16 sobreestima los grados efectivos de libertad.

1.1. Clculo del tamao de muestra en MAESegn C. Kinnear en este caso se puede calcular el tamao de la muestra si lo que se va a estimar es la media o la proporcin. Cuando sea un total bastara con utilizar el caso de media y de proporcin correspondiente y ajustar el error.

En el muestreo aleatorio estratificado la poblacin est dividida en k sub-poblaciones o estratos de tamaos , donde , es el tamao de la poblacin. Cada estrato es homogneo dentro de s y heterogneo con los dems. Para cada uno se extraen muestras de tamaos , respectivamente, donde , es el tamao de la muestra total. (1993, p. 379)

A la forma de hacer ese reparto se le conoce por afijacin; es decir, la forma de asignar en cada estrato la muestra. Se utilizan tres tipos Uniforme: (todos los estratos tendrn un tamao de muestra igual).

Proporcional: , donde . ptima: minimiza el coste o el error dependiendo del caso.

Figura 1.Clculo del tamao de muestra para estimar medias en MAE

;

Costo fijo, error mnimo:Error fijo, costo mnimo:

Fuente:

i es la desviacin tpica para el estrato i, ci es el coste para obtener una observacin en el estrato i y C es el coste total.

pi es la proporcin para el estrato i, qi = 1 - pi. CALnYES 2.0 calcula la afijacin por estratos la cual resulta un tamao n de muestra total. A partir de este valor es de donde se obtienen los diferentes ni, los que sern nmeros reales (Calculado), tras lo que se ejecuta un proceso de redondeo mediante optimizacin que busca reducir el error/coste segn se haya elegido (Observaciones). Al mismo tiempo, proporciona el error cometido con esa afijacin y el coste.(1993, p. 379)

1.2. Estimacin de medias y proporciones en MAEUna vez recogidos los datos, se desea estimar cul es la media o la proporcin en la poblacin de la que se han extrado, lo cual se hace de la forma siguiente:

Figura 2. Estimacin de medias en MAEMedia

;;

Fuente:

es la media de la muestra global, la estimacin puntual de la media global de la poblacin y es para cada , la media muestral en cada estrato. es la varianza estimada de la estimacin de la media y cada es la estimacin de la varianza de la media estimada en cada uno de los estratos.

Se han de dar los datos recogidos en cada una de las muestras para cada uno de los estratos, cada una de ellas ocupar una columna. Tambin se ha de especificar el mximo tamao de muestra, as como el nmero de estratos. Los resultados muestran: la media y la cuasivarianza en cada uno de los estratos; adems, la media global (Media), la varianza estimada de la estimacin de la media (Varianza de la Media), el error cometido con la confianza elegida y los lmites inferior y superior del intervalo de confianza.

Figura 2. Estimacin de proporciones en MAEProporcin

;;

es la proporcin de la muestra global, la estimacin puntual de la proporcin global de la poblacin y es para cada , la proporcin muestral en cada estrato. es la varianza estimada de la estimacin de la proporcin y cada es la estimacin de la varianza de la proporcin estimada en cada uno de los estratos.Se han de dar los casos favorables en cada una de las muestras para cada uno de los estratos, as como el tamao de cada muestra y de cada poblacin, respectivamente. Se ha de especificar el nmero de estratos.Los resultados son: la proporcin muestral, el producto de cada proporcin por su complementaria (p*q) y la varianza estimada de la estimacin de la proporcin (Varianza Prop.) en cada uno de los estratos. Adems, presenta la proporcin global estimada (Proporcin), la estimacin de la varianza de la proporcin global estimada (Varianza de la Proporcin), el error de estimacin y el intervalo de confianza para la proporcin en la poblacin.

2. Estimacin del tamao de la muestra con datos continuosEsta seccin presenta las frmulas para cualquier asignacin con algunos casos especiales de utilidad. Se supone que la estimacin se ha especificado con varianza. Si en lugar de ello se especifica el margen de error (d/t)" donde es el desvo correspondiente a la probabilidad que podemos conceder de que el error exceda el margen deseado.

2.1. Estimacin de la media de poblacion YSea la estirnacin desea = donde los han sido elegidos. En estos trminos, laV()anticipada .

conWn= No/N. Esto da como frmulageneral pera n:

Si se ignora la cpf tenemos, corno primera aproximacin:

in0/N no es despreciable, podemos calcular n como:

En casos particulares, las formulas frmulas toman varias formas que pueden ser convenientes para el clculo. Algunas son:

Asignacin ptima supuesta (para n fija):

Asignacin proporcional:

2.2. Estimacin del Total de PoblacinSi V es la V () deseada, las frmulas principales son:En general:

3. Afijacin

Se da el nombre de afijacin al reparto, asignacin, adjudicacin o distribucin, adjudicacin, adscripcin o distribucin del tamao muestra n entre los diferentes estratos. Esto es a la determinacin de los valores de nh que verifiquen:

Pueden establecerse muchas afijaciones o maneras de repartir la muestra, pero las ms importantes son: la afijacin igual en la que se toman todos los nh iguales a n/ L, aumentando o disminuyendo este tamao en una unidad si n no fuese mltiplo de L; la afijacin proporcional y la optima de las que nos ocuparemos ms adelante.

3.1. Estimadores y errores de muestreo

El estimador de la media se representa por se calcula como media ponderada de las obtenidas en los L estratos, tomando como pesos los tamaos de los estrados. Este estimador es insesgado, ya que siendo la muestra de cada estrato aleatoria simple (Poch, 1972)

Se verifica:

Y por tanto,

El estimador del total , es tambin insesgado por ser

Lo mismo ocurre con el de la proporcin,

Ya que

En cualquier libro de estadstica puede verse que la varianza de la suma de constantes por variables aleatorias independientes es igual a la suma de los cuadrados de dichas constantes por las varianzas de las correspondientes variables aleatorias. En este caso las constantes son Nh/N y las variables aleatorias las medias . Por tanto, la varianza del estimador de la media es:

Tenemos

3.2. Afijacin proporcional

Llamamos afijacin proporcional en el muestreo estratificado aleatorio, el reparto del tamao n de la muestra entre los L estratos proporcionalmente (de ah su nombre) a los tamaos de estos. Algunas veces se le han dado el nombre de afijacin de Bowley. (Poch, 1972)Habr, pues de verificarse:

Para determinar esta constante k, basta sumar ordenadamente las iguldades anteriores para h= 1, 2,, L, con lo cual tenemos:

Por consiguiente,

Esto es, si empleamos estos simbolos para designar el peso relativo de cada estrato, en la muestra y en la poblacin, respectivamente. Anteriormente vimos que los estimadores de la media, el total y la proporcin eran en el muestreo estratificado aleatorio: (Poch, 1972)

en particular, cuando la fijacin sea proporcional, las formulas anteriores son:

Se dice en este caso que es un estimador auto ponderado de esto quiere decir que se utiliza como estimador la misma media de la muestra,

Observemos que solo en el caso de afijacin proporcional es licito usar las como ponderaciones de las . En otro caso no seria un estimador insesgado de Si sustituimos en las formulas anteriores para las varianzas de de y de , los por su valor de funcin de , esto es, por (N/n). (, Tendremos:

Claro que si todas las cuasi varianzas fuesen iguales, la formula anterior se reducira a la del muestreo aleatorio simple.Para la varianza del tota se tiene:

Y para la proporcin:

Como estimadores insesgados de estas varianzas se utilizan el resultado de sustituir en las dos primeras formulas anteriores por:

En la tercera

Veamos un ejemplo numrico de muestreo estratificado aleatorio con fijacin proporcional.Sean tres estratos (L=3) de tamaos respectivos:

Y con

Para una muestra de tamao n=10, los tamaos de las muestras correspondientes a cada estrato son:

Se verifica en efecto .La varianza de la media es: (puesto que 100/3=33.33) y la varianza se obtendra sustituyendo estos valores en la formula general Para la varianza del estimador del total habra que multiplicar por 100002 los resultados anteriores.

Si hubiramos utilizado afijaciones igual los tamaos serian.

3.3. Afijacin ptima. Estudiaremos ahora la afijacin que para un tamao dado n de la muestra produce resultados ms precisos, esto es menor error de muestreo. (Poch, 1972) Segn vimos la varianza n de la media en el muestreo estratificado aleatorio es:

Se trata de establecer que valores de hacen mnima la expresin anterior, con la condicin esto es suponiendo prefijado el tamao de la muestra. Para hallar el mnimo o mximo de una expresin , condicionada por el sistema de ecuaciones.

Puede emplearse al mtodo de los multiplicadores de Lagrange para ello, se deriva la expresin siguiente:

Con respecto a , se igualan a cero las L derivadas y se utiliza este sistema de ecuaciones junto copn las Rde condicin para hallar los valores de las L+r incgnitas:

En particular, para una sola ecuacin de condiciones, ser:

T el sistema:

Aplicando el mtodo anterior a la expresin:

Condicionada por tenemos que derivar

Con respecto a igualando a cero estas derivadas tenemos el sistema de L+1 ecuaciones:

De aqu obtenemos igualando los valores de extrayendo las rices cuadradas y teniendo en cuenta la ultima ecuacin:

Por lo tanto:

Como vemos en esta afijacin optima y tambin afijacin de Neyman o de Cguprow- Neyman, el tamao de la muestra para cada estrato es proporcional al producto del tamao de este estrato por su variabilidad, representada por la cuasi desviacin estndar:

En particular si se verifica ser y la afijacin es proporcional ya estudiada. Aun prescindiendo de la demostracin resulta intuitivamente justificado que la afijacin optima de cada estrato, sino tambin su variabilidad, de modo que aunque un estrato tanga menos elementos, si estos son muy variables puede requerir mayor representacin en la muestra. (Poch, 1972) Sustituyendo los valores obtenidos en la formula que nos da la varianza de la media tenemos:

El error de muestreo se obtiene con la extraccin de la raz cuadrada de la expresin anterior. Como la varianza del total solo difiere de la anterior en una constante, sigue siendo aplicable al mismo mtodo y tenemos:

Y la para la proporcin:

Algunas veces se ha definido la afijacin ptima haciendo esto es proporcionales al producto de los tamaos por las desviaciones estndares o races cuadradas de las varianzas verdaderas. Prcticamente no existe gran deferencia entre definicin y la anterior, pero pueden encontrarse casos en que las dos afijaciones dan lugar a resultados distintos. Un ejemplo debido a J.Bejar pude encontrarse en la obra de Cansado (1950). La utilidad de esta afijacin es mayor si hay grandes diferencias en la variabilidad de los estratos. En otro caso la mayor sencillez y auto ponderacin de la afijacin proporcional hacen preferible el empleo de esta. Por otra parte si se conocen los valores de una variable auxiliar xi correlacionada con la yi puede ser ventajosa la afijacin que toma los proporcionales a los productos donde de correlacin entre en el estrato h-esimo. Sobre el empleo de la informacin a priori en la estratificacin puede verse un trabajo de Ericsson (1965) en el caso analtico. no se toma proporcional sino para conseguir la precisin deseada en el estrato h-esimo, o bien para precisiones relativas. Al hacer supuestos sobre las varianzas o coeficientes de variacin se obtienen diferentes afijaciones.Obsrvese que si bien esta afijacin es optima en el sentido de dar la mayor precisin para el tamao n (con el criterio de tomar las varianzas como expresin de la dispersin o esparcimiento del carcter en estudio) tambin requiere mejor conocimiento de las caractersticas poblacionales ya que no basta saber el tamao de cada estrato, sino que hay que conocer tambin su varianza o cuasi varianza. Habr, pues que estimar, conjeturar o precisar de algn modo los valores para poder calcular el tamao n de la muestra. Sukhatme (1953) estudia detenidamente el caso de la estimacin de tales varianzas a partir de una muestra preliminar o piloto. (Poch, 1972) En el caso de la proporcin, si se estima esta por la formula:

Se obtiene una expresin que no se simplifica como las anteriores y que exigira hiptesis complementarias o procedimientos recurrentes para la solucin.A veces para mayor sencillez y rapidez de los clculos se estiman las desviaciones estndares a partir de los recorridos. En ocasiones se utiliza la estratificacin a posteriori, es decir, una vez obtenida una muestra aleatoria simple de toda la poblacin, se clasifican las unidades de la muestra en L clases o estratos. Como estimador insesgado de la media puede tomarse: (Poch, 1972)

Hasta ahora hemos supuesto una sola variable o atributo, pero puede ocurrir que hayan de considerarse simultneamente varios. En tal caso, si la afijacin ptima para uno de ellos no lo es para los dems, habr que llegar a una solucin de compromiso. Cuando la diferencia no es grande pueden tomarse valores promedios para los tamaos (Jessen). En otra situacin cabe utilizar la afijacin proporcional, que siempre ofrece las ventajas de ensilles y auto ponderacin, aunque pueden estudiarse otras soluciones que de acuerdo con el criterio que se adopte den resultados ms precisos. Minimiza la varianza generalizada, resolviendo las ecuaciones que resultan, por iteracin y Ghosh(1963) trata el problema desde el punto de vista de la teora de juegos. La afijacin para estimadores de parmetros distintos de una misma poblacin ha sido estudiada por Ross (1961). Tambin Kish(19619 ha efectuado varias comparaciones de inters para propsitos ,mltiples y objetivos contrapuestos, y Kokan (1963) propone el uso de mtodos de programacin no lineal para la afijacin optima a distribuciones Log-normales puede verse en un trabajo de Jensen(1959). (Poch, 1972)

CAPTULO II

PROBLEMAS PROPUESTOS Y RESUELTOS

1.1. Ejercicio 1La empresa publicitaria del ejemplo 5.1 encontr que cuesta ms obtener una observacin del rea real que una del pueblo A o B. el incremento es debido a los costos de traslado de un hogar rural a otro. El costo por observacin en cada pueblo se ha estimado en $9.00 (esto es, c1=c2=9), y los costos por observacin en el rea rural se han estimado en $ 16.00 (esto es c3=16). Las desviaciones estndar por estrato (aproximadas por las varianzas mustrales de una encuesta previa) son encuentre el tamao de muestra total n y los tamaos de nuestra para los estratos que permiten a la empresa estimar, al mnimo costo, el tiempo promedio que se ve televisin, con un lmite para el error de estimacin igual a 2 horas.

Entonces

Por lo que

Por ellos el experimento debe seleccionar 18 hogares del pueblo A al azar, 23 del pueblo B, 17 del rea rural. As puede estimar el nmero promedio de horas empleadas en ver la televisin al mismo costo, con un lmite de 2 horas para el error de estimacin

CONCLUSIONES

Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen homogneos con respecto a alguna caracterstica de las que se van a estudiar. A cada uno de estos estratos se le asignara una cuota que determinara el nmero de miembros del mismo que compondrn la muestra. Dentro de cada estrato se suele usar la tcnica de muestreo sistemtico, una de las tcnicas de seleccin ms usadas en la prctica. Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos tcnicas de muestreo estratificado: Para una descripcin general del muestreo estratificado y los mtodos de inferencia asociados con este procedimiento, suponemos que la poblacin est dividida en h subpoblaciones o estratos de tamaos conocidos N1, N2,..., Nh tal que las unidades en cada estrato sean homogneas respecto a la caracterstica en cuestin. La media y la varianza desconocidas para el i-simo estrato son denotadas por mi y si2, respectivamente. Se clasifica la poblacin en grupos (estratos). Se trata de asegurar que todos los estratos de inters queden correctamente recogidos y, por tanto, representados en la particin. Desde un punto de vista probabilstico, se considera que existen subpoblaciones muy definidas dentro de la poblacin donde la distribucin de la variable que se analiza experimenta variaciones. Cada estrato funciona independientemente de los dems. Por tanto, se eligirn muestras aleatorias simples para cada uno de los estratos. La distribucin de la muestra en funcin de los distintos estratos se denomina afijacin.

BIBLIOGRAFA

Poch, F. A. (1972). Curso de Muestreo y Aplicaciones . Madrid: Graficas cochran, w. G. (2000). Tecnicas de muestreo. continental . kinnear, T. C. (2002). INvestigacion de mercados. mexico: Mc GRAHILL. MENDENHALL, W. (1987). Elementos de Muestro. mexico: visitacion.

9