analisis chi cuadrada

Upload: xoomter

Post on 03-Mar-2016

11 views

Category:

Documents


0 download

DESCRIPTION

Estadística

TRANSCRIPT

  • LCPLilianaMargaritaHermosilloAguirre Pgina1

    ANALISIS CHI CUADRADA

    Las pruebas no paramtricas mas utilizadas son:

    1. La chi cuadrada o X2 2. Los coeficientes de correlacin e independencia para tabulaciones

    cruzadas 3. Los coeficientes de correlacin por rangos ordenados de Spearman y

    Kendall

    La chi cuadrada es una prueba estadstica para evaluar hiptesis acerca de la relacin entre dos variables categricas, se simboliza X2

    Las variables involucradas son dos, la prueba chi cuadrada no considera relaciones causales. Su nivel de medicin de las variables es nominal u ordinal (o intervalos o razn reducidos a ordinales)

    Se calcula por medio de una tabla de contingencia o tabulacin cruzada, que es un cuadro de dos dimensiones y cada dimensin contiene una variable. A su vez, cada variable se subdivide en dos o mas categoras.

    En la tabla de contingencia se anotan las frecuencias observadas en la muestra de la investigacin. Despus se calculan las frecuencias esperadas por cada celda. En esencia, la chi cuadrada es una comparacin entre la tabla de frecuencias observadas y la denominada tabla de frecuencias esperadas, la cual constituye la tabal que esperaramos encontrar si las variables fueran estadsticamente independientes o no estuviera relacionadas.

    La chi cuadrada es una prueba que parte del supuesto de no relacin entre variables y el investigador evala si en su caso esto es cierto o no, analiza si las frecuencias observadas son diferentes de lo que pudiera esperarse en caso de ausencia de correlacin. La lgica es asi: si no hay relacin entre las variables, debe tenerse una tabla asi (el de frecuencias esperadas). Si hay relacin, la tabla que obtengamos como resultado en nuestra investigacin tiene que ser muy diferente respecto de la tabla de frecuencias esperadas. La frecuencia esperada

  • LCPLilianaMargaritaHermosilloAguirre Pgina2

    de cada celda, casilla o recuadro, se calcula mediante la siguiente frmula aplicada a la tabla de frecuencias observadas.

    Fe= (Total o marginal de rengln) (Total o marginal de columna)

    n

    En donde n es el numero total de frecuencias observadas.

    Una vez obtenidas las frecuencias esperadas, se aplica la siguiente formula de chi cuadrada:

    X2 =

    Donde significa sumatoria

    0 es la frecuencia observada en cada celda

    E es la frecuencia esperada en cada celda

    Es decir, se calcula para cada celda la diferencia entre la frecuencia observada y la esperada; esta diferencia se eleva al cuadrado y se divide entre la frecuencia esperada. Finalmente, se suman tales resultados y la sumatoria es el valor de X2 obtenida

  • LCPLilianaMargaritaHermosilloAguirre Pgina3

    VALORES P

    Una vez obtenida la muestra, se puede calcular una cantidad que s que permite resumir el resultado del experimento de manera objetiva. Esta cantidad es el p-valor que corresponde al nivel de significacin ms pequeo posible que puede escogerse, para el cual todava se aceptara la hiptesis alternativa con las observaciones actuales. Cualquier nivel de significacin escogido inferior al p-valor (simblicamente pv) comporta aceptar H0. Obviamente, al ser una probabilidad, se cumple que:

    0 pv 1

    El p-valor es una medida directa de lo verosmil que resulta obtener una muestra como la actual si es cierta H0. Los valores pequeos indican que es muy infrecuente obtener una muestra como la actual, en cambio, los valores altos que es frecuente. El p-valor se emplea para indicar cunto (o cun poco) contradice la muestra actual la hiptesis alternativa.

    Informar sobre cual es el p-valor tiene la ventaja de permitir que cualquiera decida qu hiptesis acepta basndose en su propio nivel de riesgo . Esto no es posible cuando se informa, como ha sido tradicional, indicando slo el resultado de la decisin, es decir, si se acepta o se rechaza H0 con un fijo.

    Al proporcionar el p-valor obtenido con la muestra actual, la decisin se har de acuerdo a la regla siguiente:

    si pv , aceptar H1

    si pv > , aceptar H0

    Entrando en el terreno prctico, algunos paquetes estadsticos proporcionan en sus listados el significance level, cuya traduccin literal es nivel de significacin, cuando muchas veces se refieren en realidad al p-valor (p-value).