trabajo prueba de corrida o racha

31
Universidad Experimental de Guayana Vice-Rectorado Académico Coordinación de Pregrado Proyecto de Carrera: Ingeniería Industrial Asignación: Estadística II

Upload: gilmar-kitty-ups-lopez

Post on 09-Nov-2015

9 views

Category:

Documents


1 download

DESCRIPTION

estadistica

TRANSCRIPT

Universidad Experimental de GuayanaVice-Rectorado AcadmicoCoordinacin de PregradoProyecto de Carrera: Ingeniera IndustrialAsignacin: Estadstica II

Integrantes: Alba Jess C.I: 20.285.522 Longart Mara C.I: 21.248.717 Lpez Gilmar C.I:19.302.827 Rojas Ernesto C.I: Profesora: Liliana Salomn.

Puerto Ordaz, agosto de 2012ndicePag

Introduccin3

Prueba No Paramtrica

Definicin4

Caractersticas de la Prueba no Paramtrica4

Ventaja y Desventajas5

Comparacin de las pruebas Paramtrica y no Paramtrica6

Tipos de Pruebas no Paramtricas7

Prueba de los Signos

Prueba de corrida o racha

Prueba Wilcoxon

Prueba de Kruskal-Wallis

Prueba con tabla de contingencia

Prueba de los signos pareados

Prueba de bondad de ajuste

Prueba de Corrida o Racha9

Definicin

Caracterstica

Procedimiento Especficos

Estudio 112

Estudio 2

Estudio 3

Estudio 4

Conclusin

Bibliografia

INTRODUCCIN

Como ya se ha demostrado en el curso de estadstica I y por consecuencia en el curso de estadstica II, la estadstica es considerada como el conjunto de procedimientos utilizados para clasificar, calcular, analizar y resumir los datos obtenidos de manera sistemtica. Dentro de los principales anlisis estadsticos que se pueden llevar a acabo se encuentran las pruebas estadsticas paramtricas y las pruebas estadsticas no paramtricas. Estas ltimas, son el principal objetivo de estudio en este trabajo, en realidad son poco utilizadas a pesar de la potencia y certeza de sus resultados. Normalmente se utilizan cuando no se dispone de informacin suficiente de la poblacin de la cual se extrajeron los datos, careciendo entonces de un soporte para la realizacin de una inferencia con base a una muestra observada.Partiendo de la base de que algunos contrastes de hiptesis dependen del supuesto de normalidad, muchos de estos contrastes siguen siendo aproximadamente vlidos cuando se aplican a muestras muy grandes, incluso si la distribucin de la poblacin no es normal. Sin embargo, muchas veces se da tambin el caso de que, en aplicaciones prcticas, dicho supuesto de normalidad no sea sostenible. Lo deseable entonces ser buscar la inferencia en contrastes que sean vlidos bajo un amplio rango de distribuciones de la poblacin. Tales contrastes se denominan no paramtricas.

PRUEBA NO PARAMTRICALas pruebas no paramtricas son aquellas que no presuponen una distribucin de probabilidad para los datos, por ello se conocen tambin como de distribucin libre. En la mayor parte de ellas los resultados estadsticos se derivan nicamente a partir de procedimientos de ordenacin y recuento, por lo que su base lgica es de fcil comprensin. Cuando trabajamos con muestras pequeas (n < 10) en las que se desconoce si es vlido suponer la normalidad de los datos, conviene utilizar pruebas no paramtricas, al menos para corroborar los resultados obtenidos a partir de la utilizacin de la teora basada en la normal. En estos casos se emplea como parmetro de centralizacin la mediana, que es aquel punto para el que el valor de X est el 50% de las veces por debajo y el 50% por encima.Caractersticas:

Las pruebas no paramtricas pueden referirse nicamente a los contraste que no plantean hiptesis sobre parmetros y que se limitan a analizar las propiedades nominales u ordinales de los datos, y aaden el trmino de distribucin libre para referirse a los contraste que no necesitan establecer supuestos sobre las poblaciones originales de las que se extraen las muestras.

Cuando los requisitos de la distribucin de una poblacin son satisfechos, las pruebas no paramtricas son generalmente menos eficientes que sus contrapartes paramtricas, pero la reduccin de eficiencia puede ser compensada por un aumento en el tamao de la muestra.

Hay una gran abundancia de pruebas no paramtricas, y a menudo se puede elegir entre varias, dada a una situacin; sin embargo muchas pruebas no paramtricas tienen carcter especializado y se adaptan a un trabajo en especfico.

Las pruebas experimentales son rpidas y fciles. Los clculos suelen ser muy simples y, en condiciones caractersticas, los datos necesarios se obtienen sin costos grandes.

Las suposiciones necesarias para utilizar las tcnicas no paramtricas contienen habitualmente menos restricciones que las pruebas paramtricas.

Ventajas

1. Las Pruebas No paramtricas pueden ser aplicados a una amplia variedad de situaciones porque ellos no tienen los requisitos rgidos de los mtodos paramtricos correspondientes. En particular, los mtodos no paramtricos no requieren poblaciones normalmente distribuidas.

2. Las pruebas no paramtricas pueden frecuentemente ser aplicados a datos no numricos, tal como el gnero de los que contestan una encuesta.

3. Las pruebas no paramtricas usualmente involucran simples computaciones que los correspondientes en los mtodos paramtricos y son por lo tanto, ms fciles para entender y aplicar.

4. Se pueden usar con muestras pequeas

Desventajas

1. Los mtodos no paramtricos tienden a perder informacin porque datos numricos exactos son frecuentemente reducidos a una forma cualitativa.

2. Las pruebas no paramtricas no son tan eficientes como las pruebas paramtricas, de manera que con una prueba no paramtrica generalmente se necesita evidencia ms fuerte (as como una muestra ms grande o mayores diferencias) antes de rechazar una hiptesis nula.

3. Llevan a una mayor probabilidad de no rechazar una hiptesis nula falsa (incurriendo en un error de tipo II).

COMPARACIN DE LAS PRUEBAS PARAMTRICAS Y NO PARAMTRICAS

AplicacinPrueba Paramtrica

Prueba No Paramtrica

Valor de eficiencia de la prueba paramtrica con poblacin normal

Pares pareados de datos de la muestraPrueba t o Prueba zPrueba del signoPrueba de Wilcoxon de rangos con signo0.630.95

Dos muestras independientesPrueba t o Prueba zPrueba de Wilcoxon de rangos sumados0.95

Varias muestras independientesAnlisis de varianzas (Prueba F)Prueba Kruskal-Wallis0.95

CorrelacinCorrelacin linealPrueba de correlacin de rangos0.91

AleatorioNinguna prueba paramtricaPrueba RunsNo hay base para comparacin

TIPOS DE PRUEBAS NO PARAMTRICAS

Prueba de los Signos

La prueba de los signos es quiz la prueba no paramtrica ms antigua. En ella est, basadas muchas otras. Se utiliza para contrastar hiptesis sobre el parmetro de centralizacin y es usado fundamentalmente en el anlisis de comparacin de datos pareados.Se usa para hacer pruebas de hiptesis acerca de la mediana de una poblacin de una variable continua.

Prueba de corrida o rachaEl contraste de rachas permite verificar la hiptesis nula de que la muestra es aleatoria, es decir, si las sucesivas observaciones son independientes. Este contraste se basa en el nmero de rachas que presenta una muestra. Una racha se define como una secuencia de valores mustrales con una caracterstica comn precedida y seguida por valores que no presentan esa caracterstica. As, se considera una racha la secuencia de k valores consecutivos superiores o iguales a la media muestral (o a la mediana o a la moda, o a cualquier otro valor de corte) siempre que estn precedidos y seguidos por valores inferiores a la media muestral (o a la mediana o a la moda, o a cualquier otro valor de corte).

Prueba Wilcoxon

La prueba de Wilcoxon va a permitir contrastar la hiptesis de que una muestra aleatoria procede de una poblacin con mediana M0. Adems, bajo el supuesto de simetra este contraste se puede referir a la media, E(X). Esta prueba es mucho ms sensible y poderosa que la prueba de los signos; ya que utiliza ms informacin, pues no solo tiene en cuenta si las diferencias son positivas o negativas, sino tambin su magnitud.

Prueba de Kruskal-Wallis Para la comparacin de una misma variable cuantitativa en ms de tres grupos. Es la prueba no paramtrica considerada ms potente para comparar >2 variables continuas independientes. Es el similar al test de ANOVA para un factor. Prueba con tabla de contingencia

A travs de este contraste pretendemos probar si existe independencia entre dos variables o atributos (en el conjunto de la poblacin) a partir de las observaciones de las dos caractersticas (en una muestra).

Prueba de los signos pareadosEs usada para hacer pruebas de hiptesis acerca de la mediana. La prueba estadstica se basa en el estadstico de Wilcoxon (1945), el cual se calcula de la siguiente manera: Se resta de cada dato el valor de la mediana que se considera en la hiptesis nula. Se calcula los rangos de las diferencias sin tomar en cuenta el signo de las mismas (o sea en valor absoluto). En el caso de haber empate se asigna un rango promedio a todas las diferencias empatadas es decir; se les asigna el rango

Prueba de bondad de ajusteEs considerada como una prueba no paramtrica que mide la discrepancia entre una distribucin observada y otra terica, indicando en qu medida las diferencias existentes entre ambas, de haberlas, se deben al azar.Nota: La prueba de bondad de ajuste es una de las pruebas no paramtricas ms utilizadas. Puede usarse para cualquier nivel de datos. Como lo indica el nombre completo el objetivo lo indica el nombre completo, el objetivo de la prueba de bondad de ajuste es comparar un conjunto de frecuencias observado con un conjunto de frecuencias esperado.

PRUEBA DE CORRIDA O RACHA

Una corrida o racha se define como una secuencia de valores mustrales con una caracterstica comn precedida y seguida por valores que no presentan esa caracterstica. El contraste de rachas permite verificar la hiptesis nula de que la muestra es aleatoria, es decir, si las sucesivas observaciones son independientes. Este contraste se basa en el nmero de rachas que presenta una muestra. Una racha se define como una secuencia de valores mustrales con una caracterstica comn precedida y seguida por valores que no presentan esa caracterstica. As, se considera una racha la secuencia de k valores consecutivos superiores o iguales a la media muestral (o a la mediana o a la moda, o a cualquier otro valor de corte) siempre que estn precedidos y seguidos por valores inferiores a la media muestral (o a la mediana o a la moda, o a cualquier otro valor de corte).El nmero total de rachas en una muestra proporciona un indicio de si hay o no aleatoriedad en la muestra. Un nmero reducido de rachas (el caso extremo es 2) es indicio de que las observaciones no se han extrado de forma aleatoria, los elementos de la primera racha proceden de una poblacin con una determinada caracterstica (valores mayores o menores al punto de corte) mientras que los de la segunda proceden de otra poblacin. De forma idntica un nmero excesivo de rachas puede ser tambin indicio de no aleatoriedad de la muestra.Si la muestra es suficientemente grande y la hiptesis de aleatoriedad es cierta, la distribucin muestral del nmero de rachas, R, puede aproximarse mediante una distribucin normal de parmetros:

Donde n1 es el nmero de elementos de una clase, n2 es el nmero de elementos de la otra clase y n es el nmero total de observaciones.

Caractersticas: La prueba de corrida o racha mide hasta que punto en una variable dicotmica la observacin de uno de sus atributos puede influir en las siguientes observaciones

Se observa la secuencia de un mismo atributo o cualidad.

Serie de datos en los que hay muchas o pocas rachas.

PROCEDIMIENTOS

Paso 1. Ho: la disposicin de los datos es aleatoriaH1: La disposicin de los datos NO es aleatoria Se ordenan los datos de la muestra en orden ascendente.

Paso 2: Calcule la media de la muestra tomando en consideracin si se tienen datos pares o impares.Paso 3: Pasando por la secuencia de la muestra, substituya cualquier observacin con +, - dependiendo si esta por debajo o por arriba de la media. Deseche cualquier lazo.Paso 4: Calcule R, n1 y n2. Se establece n1 como el nmero de elementos de la muestra por encima de la mediana Se establece n2 como el nmero de elementos de la muestra por debajo de la mediana Si ambos elementos de la combinacin (n1, n2) >10 se puede utilizar la prueba de corrida.

Si la tabla Utilizada para la prueba e rachas aparece la combinacin (n1, n2) se procede a la tabla.

Paso 5: Calcule la media y la varianza esperada de R, como sigue:u=

2u=

Paso 6: Calcule ZZ=

Paso 7: Anlisis :Si Z>Za, entonces debera tener un comportamiento cclico y con estacionalidad (sub mesclada)Si Z < -Za, debera tener una pendiente.

Esta prueba es vlida para los casos en las cuales n1 y n2 son grandes, al menos > 10. Para muestras de pequeas de tamao, las tablas especiales deber ser utilizadas.

ESTUDIO N 1

Una muestra de 48 laminas producidas por una maquina en rea de colado, mostro la siguiente secuencia de buenas G y defectuosas D

G G G G G G |D D| G G G G G G G GG G |D D D |G G G G G G |D |G G GG G G G G G| D D| G G G G G| D| G GPruebe la aleatoriedad de la secuencia al nivel de significancia 0.05Datosn1 D= 10n2 G= 38V= 11

Ho: Se acepta la hiptesis si -1.96 Z 1.96H1: se rechaza la hiptesis si sucede lo contrario

+1=+1= 16.38

= 4.997

De manera que =2.235V=11

Anlisis-2.61< -1.96 la hiptesis Ho se rechaza, las pruebas muestra que hay muy pocas corridas, lo que indica un amontonamiento de laminas defectuosas, por lo tanto existe un patrn en la produccin de laminas defectuosas. Se recomienda la observacin posterior del proceso de produccin. Todo esto a un nivel de significancia de 0.05

ESTUDIO N2

Se ajusta una mquina para despachar adelgazante de pintura acrlica en un recipiente. Dira que la cantidad de adelgazante que est siendo despachada por esta mquina vara aleatoriamente? Si los contenidos de los siguientes quince recipientes se miden y se encuentra que son 3.6, 3.9, 4.1, 3.6, 3.8, 3,7, 3.4, 4.0, 3.8, 4.1, 3.9, 4.0, 3.8, 4.2 y 4.2 0.1Ho: si es > 0.1 la secuencia es aleatoriaH1: la secuencia no es aleatoriaParmetro de prueba: el nmero total de corrida: 3.9Si cae arriba de 3.9 , por el smbolo , si cae por debajo y omitimos los dos 3.9

n1: 6n2: 7Lo ubicamos en la tabla = 0.296P= 2(P (V 6 cuando Ho es verdadera)P= 0.592 > 0.1

Anlisis Se acepta la hiptesis Ho que dice que la secuencia de mediciones varia aleatoriamente.StatgraphicsPronsticos - Col_1Datos/Variable: Col_1

Nmero de observaciones = 15Indice Inicial = 1,0Intervalo de Muestra = 1,0

Resumen de PronsticosModelo de pronstico seleccionado: Caminata aleatoriaNmero de pronsticos generados: 12Nmero de periodos retenidos para validacin: 0

Periodo dePeriodo de

EstadsticoEstimacinValidacin

RMSE0,310353

MAE0,264286

MAPE6,86597

ME9,5162E-17

MPE-0,303025

El StatAdvisorEste procedimiento pronostica futuros valores de Col_1. Los datos cubren 15 periodos de tiempo. Actualmente, se ha seleccionado el modelo de una caminata aleatoria. Este modelo asume que el mejor pronstico para datos futuros est dado por el valor del ltimo dato disponible. Cada valor de Col_1 ha sido ajustado de la siguiente forma, antes de ajustar el modelo:

Puede seleccionar un modelo diferente de pronsticos pulsando el botn secundario del ratn y seleccionando Opciones de Anlisis.

Esta tabla tambin resume el desempeo del modelo actualmente seleccionado en ajustar datos histricos. Se muestra:

(1) la raz del error cuadrado medio (RMSE) (2) el error absoluto medio (MAE) (3) el porcentaje de error absoluto medio (MAPE) (4) el error medio (ME) (5) el porcentaje de error medio (MPE)

Cada uno de los estadsticos est basado en los errores de pronstico uno-adelante, los cuales son las diferencias entre los datos al tiempo t y el valor pronosticado al tiempo t-1. Los primeros tres estadsticos miden la magnitud de los errores. Un mejor modelo dara un valor ms pequeo. Los ltimos dos estadsticos miden el bias. Un mejor modelo dara un valor ms cercano a 0.

Comparacin de ModelosVariable de datos: Col_1Nmero de observaciones = 15Indice Inicial = 1,0Intervalo de Muestra = 1,0

Modelos(A) Caminata aleatoria(B) Media constante = 3,86667(C) tendencia curtva-S = exp(1,36882 + -0,0816043 /t)(D) Promedio mvil simple de 3 trminos (E) Suavizacin exponencial simple con alfa = 0,1665 Ajuste matemtico:

Periodo de EstimacinModeloRMSEMAEMAPEMEMPE

(A)0,3103530,2642866,865979,5162E-17-0,303025

(B)0,2257260,1822224,77958-1,18424E-16-0,328148

(C)0,2201770,1664794,358160,00555118-0,147166

(D)0,2256680,1944445,045950,02222220,2857

(E)0,2309720,1899584,924590,04891770,948084

ModeloRMSERUNSRUNMAUTOMEDIAVAR

(A)0,310353OKOKOKOKOK

(B)0,225726OKOKOK*OK

(C)0,220177OKOKOKOKOK

(D)0,225668OKOKOKOKOK

(E)0,230972OKOKOK*OK

Clave:RMSE = Root Mean Squared Error (Raz del Cuadrado Medio del Error)RUNS = Prueba corridas excesivas arriba y abajoRUNM = Prueba corridas excesivas arriba y abajo de la medianaAUTO = Prueba de Box-Pierce para autocorrelacin excesivaMEDIA = Prueba para diferencia en medias entre la 1 mitad y la 2 mitadVAR = Prueba para diferencia en varianza entre la 1 mitad y la 2 mitadOK = no significativo (p >= 0,05)* = marginalmente significativo (0,01 < p