estadistica espinosa. p

10
[Escriba aquí] Pedro J. Espinosa Psicología Universitat de Barcelona Estadística Distribución Muestral de un estadístico: Hemos conceptualizado anteriorment un estimador puntual com un estadistico obtenido en una muestra y que es funciín de los valores que la componen. Por tanto, si consideramos que las muestras se han obtenido por muestreo aleatorio, los estadisticos que calculamos en estas muestras pueden ( y de hecho deben) ser conceptualizados como variables aleatorias. Bajo la denominación Distribucdión muestral de un estadístico recogemos el modelo teórico de probabilidad que, bàsicament, describe el comportamiento de la variable aleatòria definida por el conjumntop de estadísticos calculados a lo largo de las diferentes muestra de igual tamaño que podrían generarse a partir de una población. Considerando un muestreo con rfeposición el numero de muestras sería infinito. La Distribución Muestral constituye un concepto teórico, ya que en la pràctica generamos una muestra y calculamos sobre ella un estadístico. Si a partir de una poblacióin caracteritzada por un parametro X generamos todas las posiubles muestras de tamaño n, el conjunto de estadísticos obtenidos a partir de cada una de las muestras constituiran la Distribución Muestral del estadístico. ¿Qué utilidad tiene conocer las características de la Distribución Muestrak de un Estadístico ? En primer lugar : evaluar las propiedades de los estimadores( que hemos planteado con anterioridad ). Por ejemplo, a partir de la esperanza matemàtica, determinar si el estimador presenta sesgo o, mediante su variància, analitzar la eficiència diferencial de los estimadores. En segundo lugar: tambiénb nos permitirá establecer estimacions por intervalo del parámetro poblacional, tal como veremos más adelante. ¿ Qué características presenta la Distribución Muestral de un Estadístico ? No se conocen las caracteísticas de la distribución de todos lo estadistícos, però a partir de la Ley de los grandes números y el Teorema del límite central, ha sido possible identificarlas de forma teòrica para algunos estadísticos.

Upload: javirodriguez

Post on 03-Oct-2015

224 views

Category:

Documents


1 download

DESCRIPTION

estadistica espinosa

TRANSCRIPT

[Escriba aqu] Pedro J. Espinosa Psicologa Universitat de Barcelona Estadstica Distribucin Muestral de un estadstico:Hemos conceptualizado anteriorment un estimador puntual com un estadistico obtenido en una muestra y que es funcin de los valores que la componen. Por tanto, si consideramos que las muestras se han obtenido por muestreo aleatorio, los estadisticos que calculamos en estas muestras pueden ( y de hecho deben) ser conceptualizados como variables aleatorias. Bajo la denominacin Distribucdin muestral de un estadstico recogemos el modelo terico de probabilidad que, bsicament, describe el comportamiento de la variable aleatria definida por el conjumntop de estadsticos calculados a lo largo de las diferentes muestra de igual tamao que podran generarse a partir de una poblacin. Considerando un muestreo con rfeposicin el numero de muestras sera infinito. La Distribucin Muestral constituye un concepto terico, ya que en la prctica generamos una muestra y calculamos sobre ella un estadstico. Si a partir de una poblaciin caracteritzada por un parametro X generamos todas las posiubles muestras de tamao n, el conjunto de estadsticos obtenidos a partir de cada una de las muestras constituiran la Distribucin Muestral del estadstico. Qu utilidad tiene conocer las caractersticas de la Distribucin Muestrak de un Estadstico ? En primer lugar : evaluar las propiedades de los estimadores( que hemos planteado con anterioridad ). Por ejemplo, a partir de la esperanza matemtica, determinar si el estimador presenta sesgo o, mediante su varincia, analitzar la eficincia diferencial de los estimadores. En segundo lugar: tambinb nos permitir establecer estimacions por intervalo del parmetro poblacional, tal como veremos ms adelante. Qu caractersticas presenta la Distribucin Muestral de un Estadstico ? No se conocen las caractesticas de la distribucin de todos lo estadistcos, per a partir de la Ley de los grandes nmeros y el Teorema del lmite central, ha sido possible identificarlas de forma terica para algunos estadsticos. Para los que no se conoce puede aproximarse mediante un proceso de simulaciin numrica. ( Montecarlo, Boostrap...)

Distribucin Muestral de Medias :Conforme al teorema del lmite central la distribucin de muestreo del estadstico media es asintticamente normal. Es decir, se ajusta a un modelo de proibabilidad normal a medida que el tamao de la muestra sobre la que se calcula el estadstico tiende a infinito.Donde representa la Media de la Distribucin Muestral y sera la Desviacin estndar de la distribucin Muestral, habitualmente tambin designada como Error Tpico o Error Estndar de la Distribucin Muestral .Los parmetros que caracterizan la distribucin Muestral del Estadstico son funcin de los parmetros de la variable Aleatoria poblacional. Para la Media

Para el Error tpico: Si el muestreo se ha realizado con reposicin o bien a partir de una poblacin infinita: En caso que el muestreo se haya realizado a partir de una poblacin infinita y sin reposicin: Donde y son respectivamente la media y la desviacin estndar de la Variable Aleatoria medida en la poblacin y la siguiente expresin: que es el coeficiente de correccin por infinitud. Puesto que la convergencia es asinttica, la aproximacin a la distribucin de probabilidad normal es buena para valores grandes de n siguiendo el teorema del lmite central. La convergencia, pues, se producir con independencia de las caractersticas de la variable aleatoria en la poblacin siempre que al menos la media y la variancia poblacionales sean finitas. En el caso de que el valor de n sea pequeo, para garantizar que las caractersticas distribucionales de la distribucin Muestral de Medias coinciden con las anteriormente descritas, ser necesario que la Variable Aleatoria se distribuya normalmente en la poblacin origen de la muestra. El cumplimiento de esta condicin es por s sola garanta suficiente en cualquier caso (sea cual sea el tamao muestral). Como elemento a destacar, obsrvese cmo el error tpico presenta una relacin inversa con el tamao de la muestra. Conforme esta ltima aumente, disminuir el error estndar de la Distribucin Muestral. Distribucin Muestral de Sumas:Conforme el Teorema del lmite central, la distribucin del muestreo del estadstico suma tambin es asintticamente normal. Por lo que respecta a sus parmetros, en un muestreo con reemplazo a partir de una poblacin finita seran: /// En caso de que el muestreo se haya realizado a partir de una poblacin finita y sin reposicin: Distribuciones Muestral de Proporciones: Conforme al teorema del lmite central, la distribucin de muestreo del estadstico proporcin tambin es asintticamente normal. Por lo que respecta a sus parmetros, en un muestreo con reemplazo a partir de una poblacin finita seran: En caso de que el muestreo haya se haya realizado a partir de una poblacin finita y sin reposicin: .En realidad, el teorema del lmite central es aplicable a la distribucin del estadstico proporcin nicamente si los productos ny n(1 -) son iguales o superiores a 5. Con este estadstico sera ms adecuado caracterizar la distribucin de muestreo mediante el modelo de probabilidad Binomial para poblaciones finitas con reposicin o el modelo Hiprgeomtrico para poblaciones finitas sin reposicin. Esto es as puesto que estos modelos de probabilidad estableceran la distribucin de muestreo exacta del estadstico. Otras distribuciones muestrales: Las distribuciones muestrales para algunos estadsticos se hallan especficadas y son conocidas bajo determinadas circunstancias. A continuacin identificaremos los parmetros (para muestreo infinito o con reposicin), las caractersticas distribucionales y los requerimientos que deben cumplirse para algunos casos: Distribucin Muestral de la Desviacin Estndar :

Para n=100 la distribucin muestral es casi normal: para el error tpico tenemos dos expresiones: Si la distribucin de la variable aleatoria a nivel poblacional es aproximadamente normal : . En caso de que no lo sea: .

Distribucin Muestral de la Mediana:

Para n=30 y la poblacin aproximadamente normal la distribucin muestral es muy aproximadamente normal. y .

Existe tambin una expresin de clculo del Error Estndar en base a indicadores de posicin: donde .

Distribucin Muestral de los Cuartiles:

Para n=30 y variable aleatoria con distribucin aproximadamente normal, la distribucin muestral es aproximadamente normal.

Distribucin Muestral de Deciles: Para n=30 y variable aleatoria con distribucin aproximadamente normal, la distribucin muestral es aproximadamente normal: Distribucin Muestral de los Rangos Semiintercuartiles: Para n=30 y variable aleatoria con distribucin aproximadamente normal, la distribucin muestral es aproximadamente normal y es csi igual al Rango Semiincuartil en la poblacin. Distribucin Muestral de Variancia: Para n=100 la distribucin muestral es casi normal porque:

Independientemente del valor de n, para variables aleatorias con distribucin normal en loa poblacin: . Donde v= n-1 .

Distribucin Muestral del coeficiente de Variacin: Para variables aleatorias con distribucin normal ( o casi normal ) y n=100 ( o ms grande que 100 ) la distribucin muestral es normal con:

Inferencia Estadstica. Muestreo y estimadores: Introduccin:Por medio de la estadstica descriptiva caracterizamos una o varias variables aleatorias, ya sea conjunta o separadamente. Dadas diversas medidas, que pueden corresponder a una parte de la poblacin, datos muestrales, o a la totalidad de los individuos de la misma, el objetivo es resumir o sintetizar la informacin, haciendo sta ms comprensible.Si se realiza un anlisis descriptivo sobre datos muestrales, no existe otro objetivo que describir la informacin contenida en los datos de la muestra, sin realizar ningn tipo de extrapolacin. Por tanto, los anlisis estadsticos slo se refieren al conjunto de los datos muestrales.En muchas ocasiones el inters no reside tanto en describir un determinado conjunto de datos muestrales como utilizar la informacin contenida en la muestra para conocer alguna caracterstica de la variable o variables aleatorias en la poblacin.Por supuesto, nada mejor que realizar un anlisis a partir de la totalidad de los individuos de la poblacin, pero eso no siempre es posible en trminos de costes, ya sean econmicos o temporales. De hecho, en muchas ocasiones es imposible obtener mediciones para la totalidad de los individuos de la poblacin. En consecuencia, se desprende la necesidad de un tipo ded razonamiento cuyo objetivo sea realizar extrapolaciones sobre los parmetros de las variables aleatorias en la poblacin a partir de una parte de los individuos pertenecientes a la misma. O sea, utilizar la informacin contenido en los datos muestrales para realizar inferencias sobre el valor de los parmetros para el conjunto de individuos de la poblacin. Este es el objetivo principal de la inferencia estadstica y, para alcanzar este objetivo, debemos conocer cmo obtener muestras que representen adecuadamente al conjunto de individuos de la poblacin de referencia. Dentro de la inferencia estadstica puede distinguirse entre estimacin y decisin. El proceso mediante el cual se obtiene informacin sobre el valor de los parmetros de las variables aleatorias en la poblacin a partir de datos muestrales se denomina estimacin. En este proceso de estimacin se utilizan ndices y coeficientes estadsticos, conocidos como estimadores, para obtener informacin sobre el valor de los parmetros. Estos parmetros, que utilizan la informacin contenida en la muestra, proporcionan un valor concreto que se denomina estadstico. Dado un valor del estadstico, puede realizarse una estimacin del parmetro conocida como estimacin puntual o por punto o, alternativamente, una estimacin denominada estimacin por intervalo. En el primer caso, se iguala el valor del parmetro a aquel correspondiente al estadstico. En el segundo caso, en cambio, se proporciona un intervalo o conjunto de valores probables para el parmetro y no un valor concreto como suceda con la estimacin puntual o por punto. La decisin estadstica tiene por objetivo tomar decisiones sobre determinadas caractersticas de una o varias variables aleatorias en la poblacin. Las tcnicas de la inferencia estadstica permiten poner a pruebas una hiptesis, dados unos datos muestrales. Por tanto, son precisas las estimaciones obtenidas en las muestras para tomar una decisin. Las pruebas de decisin estadstica pueden agruparse en tcnicas de conformidad y tcnicas de relacin. Las pruebas o tcnicas de conformidad permiten contrastar hiptesis que se refieren a caractersticas de las variables aleatorias, ya sea sobre el valor de alguno de sus parmetros o la forma de sus distribuciones. As, podemos diferenciar entre pruebas paramtricas y no paramtricas. Mediante las pruebas de relacin es posible contrastar si dos o ms variables aleatorias son independientes o no. Tambin aqu podemos diferenciar entre pruebas paramtricas y no paramtricas.

Muestreo de poblaciones finitas: Por la imposibilidad de obtener informacin o de realizar la medicin de determinadas caractersticas para la totalidad de individuos que componen una poblacin, es necesario, en general, realizar un estudio a partir de un subconjunto de individuos de la misma. La muestra, que as se denomina cualquier subconjunto de individuos de la poblacin, debe ser representativa de la misma, siempre que se pretenda uti8lizar la informacin obtenida en la muestra para realizar extrapolaciones o inferencias a la poblacin de referencia. Para garantizar la representatividad de la muestra, debemos procurar que en la misma no existan factores que puedan provocar la existencia de sesgo en los resultados extrapolados desde la muestra a la poblacin.En consecuencia, se precisan procedimientos que eviten o minimicen la existencia de sesgo y, en la medida de lo posible, garanticen la representatividad de la muestra; o sea, las tcnicas de muestreo de poblaciones finitas.Nos referiremos al muestreo de poblaciones finitas, que es aquel que se precisa, por ejemplo, cuando se realiza un estudio o sondeo de opinin. Una poblacin finita est compuesta por un nmero finito de individuos. Mediante el trmino marco se entiende la lista por medio de la cual se identifica a cada uno de los individuos de la poblacin. Un nmero asignado a cada individuo de la poblacin puede ser una forma de elaborar la lista.La variable de estudio es aquella caracterstica de la poblacin que se quiere estudiar. En una investigacin puede incluirse tantas variables de estudio como interese. Si el estudio se realiza sobre la totalidad de la poblacin, se denomina censo. Mediante N se denota el total de individuos de la poblacin, tambin refirindose como tamao poblacional. El total de individuos que componen una muestra se denomina tamao muestral y se denota mediante n.Dado un tamao poblacional, pueden obtenerse distintas muestras. El total de las diferentes muestras se denomina espacio muestral universal. Como son muchas las muestras que componen el espacio muestral universal, pues incluye todas las muestras posibles, independientemente de su tamao, es preciso tomar una parte del mismo. Se entiende por espacio muestral una parte del espacio muestral universal. Las muestras de un tamao concreto son una parte del espacio muestral universal. Una vez especificado un espacio muestral, el muestreo de poblaciones finitas tiene por objetivo obtener muestras para alcanzar precisas inferencias sobre las caractersticas de las variables aleatorias en la poblacin de referencia. Los procedimientos mediante los cuales se obtienen las muestras se denominan diseos o planes de muestreo. Estos se tratarn a continuacin.Muestreo aleatorio simple. MAS(N, n)Es una caracterstica de este plan de muestreo que la probabilidad de que cualquier individuo pertenezca a la muestra es igual a 1/N. Si se prefiere, la probabilidad de obtener cualquier muestra m de tamao n esEl denominador es igual al total de muestras posibles de tamao n sin reposicin. Para obtener una muestra mediante este procedimiento se ordenan las muestras del espacio muestral y se obtiene una de ellas al azar. Tambin puede obtenerse mediante la seleccin al azar individuo a individuo de forma secuencial. En ambos casos se utilizan nmeros pseudoaleatorios