prueba chicuadrado

Upload: latinboymarce

Post on 05-Jul-2018

247 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/15/2019 Prueba Chicuadrado

    1/36

  • 8/15/2019 Prueba Chicuadrado

    2/36

    TÍTULO DEL TEMA

    PRUEBA NO PARAMÉTRICAS

  • 8/15/2019 Prueba Chicuadrado

    3/36

    ORIENTACIONES

    •   Lea las previamente las orientacionesgenerales del curso.

    •   Revise los temas afines a este en laBiblioteca Virtual de la UAP

    •  Participe de los foros

  • 8/15/2019 Prueba Chicuadrado

    4/36

    Chi cuadrado

    Característica de la chi cuadrado

    Hipótesis

    CONTENIDOS TEMÁTICOS

  • 8/15/2019 Prueba Chicuadrado

    5/36

    DESARROLLO DE CONTENIDOS - SUBTÍTULOS

    DEL TEMA

  • 8/15/2019 Prueba Chicuadrado

    6/36

    Test de hipótesis

    Paramétricos:   hipótesis sobre los

    parámetros que definen la población(por ej., pobl. Normales, y tests sobrela media o la desv. típica).

    No paramétricos: no se refieren a

    parámetros de la población; seaplican típicamente   cuando noconocemos la   distribución de lapoblación, o cuando su distribuciónes no normal.

  • 8/15/2019 Prueba Chicuadrado

    7/36

    7

    •   Para realizar análisis no paramétricos, debe partirse de las siguientesconsideraciones:

    •   La mayoría de estos análisis no requieren de supuestos acerca de la

    forma de la distribución poblacional. Aceptan distribuciones nonormales.

    •   Las variables no necesariamente deben estar medidas en un nivel por intervalo o de razón, pueden analizar datos nominales u ordinales.

    •   Si se quieren aplicar análisis no paramétrica a datos por intervalos orazón, éstos deben ser resumidos a categorías discretas (a unascuantas). Las variables deben ser categorías.

    ¿CUÁLES SON LAS SUPOSICIONES DE LAESTADÍSTICA NO PARAMÉTRICA?

  • 8/15/2019 Prueba Chicuadrado

    8/36

    8

    1) La Chi-cuadrada o Ji-Cuadrada   o X 2.2) Los coeficientes de correlación e independencia

    para tabulaciones cruzadas.

    3) Los coeficientes de correlación por rangosordenados de Spearman y Kendall.

    4) Prueba de U de MannWhitney

    5) PruebasW deWilcoxon

    ¿CUÁLES SON LOS MÉTODOS O PRUEBASESTADÍSTICAS NO PARAMÉTRICAS MÁS UTILIZADAS?

    Las Pruebas no paramétricas más utilizadas son:

  • 8/15/2019 Prueba Chicuadrado

    9/36

    Distribución Ji-Cuadrada o Chi-cuadrada o X2 

  • 8/15/2019 Prueba Chicuadrado

    10/36

    10

    Es una prueba útil para variables categóricas yestadística, es aplicable cuando la variable nominal estácompuesto por dos o más categorías. Tiene dosaplicaciones:

    1. La prueba de bondad de ajuste Chi-cuadrada.2. La prueba Chi-cuadrada de asociación.3. Prueba de homogeneidad

    Distribución Ji-Cuadrada o Chi-cuadrada o X2 

  • 8/15/2019 Prueba Chicuadrado

    11/36

    11

    Distribución Ji-Cuadrada o Chi-cuadrada o X2 

  • 8/15/2019 Prueba Chicuadrado

    12/36

    Es una prueba estadística para evaluar hipótesis acerca de la relación

    entre dos variables categóricas.

    Símbolo:   X  2 

    Hipótesis a probar:   Correlaciones

    Variablesinvolucradas: Dos variables (la prueba Chi-cuadrada noconsidera relaciones causales).

    Nivel de medición delas variables

    Nominal u ordinal (o intervalos o razón reducidasa ordinales)

    Procedimiento   La Chi-cuadrada se calcula por medio de unatabla de contingencia o tabulación cruzada, quees una tabla de dos dimensiones y cadadimensión contiene una variable. A su vez, cadavariable se subdivide en dos o más categorías.

    Distribución Ji-Cuadrada o Chi-cuadrada o X2 

  • 8/15/2019 Prueba Chicuadrado

    13/36

    13Total de Fila x Total de Columna

    F. Esperada=Total General

    CARACTERÍSTICAS1. La Distribución X2 se lee con grados de libertad G.L = (Nº

    de filas - 1)(Nº de columnas - 1).2. No tiene valores negativos. El valor mínimo es 0.3. Todas las curvas son asimétricas4. Cuando aumentan los grados de libertad las curvas son

    menos elevadas y más extendidas a la derecha.5. Se utiliza para variables medidas en escala nominal uordinal.

    6. Las fórmulas son:

  • 8/15/2019 Prueba Chicuadrado

    14/36

    14

    Ejemplo 1. Variable, categoría y tabla de contingencia 2x2:

    Sean las variables SEXO (Masculino y Femenino) yCANDIDATO (“A” y “B”). La tabla de contingencia o tabulacióncruzada es:

    CANDIDATO“A” “B”

    MasculinoSEXO

    Femenino

    20 30

    40 25

  • 8/15/2019 Prueba Chicuadrado

    15/36

    15

    Ejemplo 2. Estudio de Tabla de contingencia 3x2:Se estudia a 1040 estudiantes de los niveles de educaciónprimaria y secundaria y a los cuales se aplica un instrumentoque mide el aprendizaje de la matemática, en las dimensionesde aprendizaje conceptual, procedimental y actitudinal.Variables: APRENDIZAJE categorías: Conceptual, Procedimental, Actitudinal.NIVEL DE EDUCACIÓN categorías: Primaria, Secundaria.

    NIVEL DE EDUCACIÓN

    Primaria Secundaria

    APRENDIZAJEConceptualProcedimental

    Actitudinal

    180 100190 280

    170 120

    Tabla de contingencia

  • 8/15/2019 Prueba Chicuadrado

    16/36

    16

    Tabla de frecuencias observadas (O):

    NIVEL DE EDUCACIÓN TOTALPrimaria Secundaria

     APRENDIZAJEConceptual

    Procedimental

    Actitudinal

    180 100 280

    190 280 470

    170 120 290TOTAL 540 500 1040

    La Chi-cuadrada es una comparación entre las tablas defrecuencias observadas y la denominada tabla de frecuencias

    esperadas (la tabla que esperaríamos encontrar si las variablesfueran estadísticamente independientes o no estuvieranrelacionadas).

  • 8/15/2019 Prueba Chicuadrado

    17/36

    17

    La   frecuencia esperada  de cada celda, casilla o recuadro, se

    calcula mediante la siguiente fórmula aplicada a la tabla defrecuencias observadas:N = número total de frecuencias observadas.E = (marginal del reglón)*(marginal de columna) / N.

    NIVEL DE EDUCACIÓN Marginalde filasPrimaria Secundaria

     APRENDIZAJE

    Conceptual

    Procedimental

     Actitudinal

    (280)*(540)/1040 (280)*(500)/1040 280

    (470)*(540)/1040 (470)*( 500)/1040 470

    (290)*(540)/1040 (290)*(500)/1040 290

    marginal de columnas540 500 1040

    Tabla de frecuencias esperadas (E):

  • 8/15/2019 Prueba Chicuadrado

    18/36

    18

    NIVEL DE EDUCACIÓN TOTALPrimaria Secundaria

    O E O E

     APRENDIZAJEConceptual

    Procedimental Actitudinal

    180 145,4 100 134,6 280

    190 244,0 280 226,0 470170 150,6 120 139,4 290

    TOTAL 540 500 1040

    Frecuencias observada y esperada en una sola tabla:

    Donde:

    O: frecuencia observada en cada celda

    E: frecuencia esperada en cada celda

  • 8/15/2019 Prueba Chicuadrado

    19/36

    19

    Celda O E O - E (O - E)2 (O - E)2  / EConceptual/Primaria 180 145,4 34,6 1197,16 8,23

    Procedimental/ Primaria 190 244,4 -54,4 2959,36 12,11

     Actitudinal / Primaria 170 150,6 19,4 376,36 2,50

    Conceptual / Secundaria 100 134,6 -34,6 1197,16 8,69

    Procedimental /Secundaria 280 226,0 54,0 2916,00 12,80

     Actitudinal / Secundaria 120 139,4 -19,4 376,36 2,70

    X2 = 47,33

    Para saber si el valor de X2 es o no significativo, debemos

    calcular los grados de libertad.

    G.L. = (Nº de filas - 1)(Nº de columnas - 1).

     

     E 

     E O X  

    2

    2

  • 8/15/2019 Prueba Chicuadrado

    20/36

    20

    Para el ejemplo: Nº de filas = 3 y Nº de columnas = 2;entonces G.L. = (3-1)*(2-1) = 2.

    Luego, acudimos a la “tabla de distribución de Chi-cuadrado”,

    eligiendo nuestro nivel de significancia ( = 0,05 ó    = 0,01).

    Si el valor obtenido de X2 es igual o superior al valor de la“tabla”, decimos que las variables están relacionadas   o noson independientes.

     Aplicación:

    Para el nivel de significancia de 

    =0,05  y g.l. = 2, el X2

    detabla es 5,9915 (ver tabla).X2Obtenido = 47,33X2Crítico =   5,9915

  • 8/15/2019 Prueba Chicuadrado

    21/36

    21

  • 8/15/2019 Prueba Chicuadrado

    22/36

    22

    H0: No existe relación entre el aprendizaje y los nivelesde educación. (VARIABLES INDEPENDIENTES)

    H1: Existe relación entre el aprendizaje y niveles deeducación. (VARIABLES RELACIONADAS)

    X2obtenido  X2crítico entonces variables no sonindependientes; es decir existe una relación entreAprendizaje y los niveles educativos

    X2obtenido   X2crítico entonces se rechaza lahipótesis nula (H0), y por lo tanto se acepta la hipótesisalterna (H1).

    Prueba de hipótesis:

  • 8/15/2019 Prueba Chicuadrado

    23/36

    23

    1.  Un politólogo cree que, durante los últimos años, la composición étnica

    de la ciudad donde vive ha cambiado. Las cifras más actuales (reunidashace unos cuántos años) muestran que los habitantes de dicha ciudadpresentan la siguiente composición étnica: 53% noruegos, 32% suecos, 8%irlandeses, 5% alemanes y 2% italianos. Para verificar esta idea, estecientífico social obtiene una muestra aleatoria de 750 habitantes, con losresultados que se presentan en la siguiente tabla:

    Países Noruegos Suecos Irlandeses Alemanes Italianos

    frecuencia 399 193 63 82 13

    a). ¿Cuál es la hipótesis nula?

    b). ¿Cuál es la hipótesis alterna?

    c). ¿Cuál es la conclusión?. Utilice  = 0,05.

    Ejercicios propuestos:

  • 8/15/2019 Prueba Chicuadrado

    24/36

    24

    2. Una universidad está pensando en implantar uno de los tres sistemas decalificaciones siguientes: (1) todas las calificaciones son aprobados-reprobado; (2) todas las calificaciones están en el sistema 4.0 y (3) 90% delas calificaciones están en el sistema 4.0 y 10% son a probados-reprobado.Se realiza una encuesta para determinar si existe una relación entre el áreade interés de cada alumno y su presencia para algún sistema decalificación. Se elige una muestra aleatoria de 200 estudiantes del áreaingeniería, 200 de ciencias, y 100 de bellas artes. Se pregunta a cada

    alumno cuál de los tres calificaciones prefieren. Los resultados aparecen enla siguiente tabla:

    Sistema de calificación

    Aprobado-reprobado 4,0 4,0 y aprobado-reprobado

    Bellas artes 26 55 19

    Ciencias 24 118 58Ingeniería 20 112 68

    a). ¿Cuál es lahipótesis nula?

    b). ¿Cuál es lahipótesis alterna?

    c). ¿Cuál es laconclusión?. Utilice = 0,05.

  • 8/15/2019 Prueba Chicuadrado

    25/36

    25

    3.   Debido a la inflación galopante, el gobierno está considerando laimposición de un control de precios y salarios. Un economista del gobierno,interesado en determinar si existe una relación entre el empleo y la actitudhacia este control, reúne los siguientes datos. Los datos muestran, para cadatipo de empleo, el número de individuos en la muestra que están a   favor  ocontra de los controles.

    a). ¿Cuál es la hipótesis nula?b). ¿Cuál es la hipótesis alterna?

    c). ¿Cuál es la conclusión?. Utilice   = 0,05.

     Actitud hacia el control de precios y salarios

     A favor En contraObreros 90 60

    Empresarios 100 150

    Profesionales 110 90

  • 8/15/2019 Prueba Chicuadrado

    26/36

    CHI CUADRADO 

    ¿Cuándo usar esta distribución?   Esta es una distribución de muestreo asociada a la

    probabilidad de la varianza (2). Por medio de ella sedetermina la probabilidad de ocurrencia de un valor específico de varianza con v=n-1 grados de libertad enuna muestra de tamaño n.

    Varianza

    f(x)

  • 8/15/2019 Prueba Chicuadrado

    27/36

    CHI CUADRADO 

    Fórmulas

    tabulada Está

    dx x  f   x F 

    e x

    v

     x  f  

    densidad  Función

     xv

    v

      

      

    )()(

    **

    2*2

    1)(   2

    12

    2

    Forma de la curva de esta distribución según v

  • 8/15/2019 Prueba Chicuadrado

    28/36

    CHI CUADRADO 

    ¿Cómo usar las tablas?   La tabla da valores de probabilidad acumulados de derecha

    a izquierda. Para extraer valores de probabilidad de estatabla se sigue el siguiente procedimiento:

      Estimar el valor de la verdadera desviación estándar.

      Determinar los grados de libertad (v) tal que v=n-1.

      Calcular el valor de  2=v*(s2/2)

  • 8/15/2019 Prueba Chicuadrado

    29/36

    CHI CUADRADO 

    ¿Cómo usar las tablas?   Localizar en tablas el valor de la probabilidad

    asociada  a   los   valores  de   2 y  de  v. En  algunoscasos, puede ser  necesario interpolar  para encontrar 

    el valor  exacto buscado, de lo contrario, se escoge elque más se aproxime. Por  ejemplo, si  2 es igual 0.48con 4 grados de libertad, el valor  de la probabilidadmayor  a el es 0.975, pues se localiza en la direcciónvertical en la parte superior, tal y como se muestra a

    continuación.

  • 8/15/2019 Prueba Chicuadrado

    30/36

    CHI CU DR DO

    ¿Cómo usar las tablas?

  • 8/15/2019 Prueba Chicuadrado

    31/36

    CHI CUADRADO 

    EJEMPLOUna máquina llenadora ha ejecutado su operación conuna varianza de 0.83 grms2. Si se toma una muestra de15 unidades, ¿cuál es la probabilidad de tener una

    varianza:a. superior a 1.249 grms2?

    b. inferior a 0.3896 grms2?

  • 8/15/2019 Prueba Chicuadrado

    32/36

    CHI CUADRADO 

    SOLUCIÓNa. La probabilidad de tener una varianza superior a1.249 grms2 es 0.1.

      1.0067.2183.0

    249.1*14)249.1(   222

     

      

                P  P  P 

  • 8/15/2019 Prueba Chicuadrado

    33/36

    CHI CUADRADO SOLUCIÓN

    a. La probabilidad de tener unavarianza superior a 1.249 grms2

    es 0.1.

      En Excel se pulsa en el menú:

    INSERTAR, FUNCIÓN,ESTADÍSTICAS, DISTR.CHI

      P(2>1.249) se introduce elvalor de   2 que es 21.067 y elnúmero de grados de libertad

    que es 14. Excel retorna elvalor de la probabilidad que es0.099.

  • 8/15/2019 Prueba Chicuadrado

    34/36

    CHI CUADRADO 

    SOLUCIÓN

    b. La probabilidad de tener una varianza inferior a 0.3896grms2 es 0.05.

      05.095.0157.683.0

    3896.0*14)3896.0(   222

     

      

                P  P  P 

  • 8/15/2019 Prueba Chicuadrado

    35/36

    CHI

    CUADRADO 

  • 8/15/2019 Prueba Chicuadrado

    36/36

    GRACIAS

    Cortesia: DR. JORGE ACUÑA A.