clase 2_d_análisis de reactivos y estandarización de pruebas

Upload: jose-luis-cortes-araya

Post on 25-Feb-2018

248 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    1/19

    Anlisis de

    Reactivos yestandarizacinde PruebasDocente: Ps. Jos Luis Corts

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    2/19

    ANALISIS DE REACTIVOS YESTANDARIZACIN DEPRUEBAS

    Anlisis de reactivos se centra en el funcionamiento

    de reactivos individuales, mientras que laestandarizacin de pruebas se ocupa de lainterpretacin normativa de los resultados de laprueba en su conjunto o de algunas de las partes osubpruebas que la integran.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    3/19

    Se deben analizar las respuestas de esa muestra

    pilotopara determinar si los reactivos estnfuncionando de manera adecuada.

    Cualquiera que sea el tipo de prueba,estandarizada o elaborada por el maestro, de

    habilidad o de personalidad, un anlisispost mortemopost hocde los resultados es necesario.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    4/19

    Validez de reactivoA fin de evaluar la utilidad de un reactivo como

    medida de las diferencias individuales en cuantoa las caractersticas de habilidad o depersonalidad, se requiere un criterio externo de

    medida de dicho rasgo.

    La validez de un reactivo para predecir unaposicin con base en un criterio externo puede

    determinarse al correlacionar las calificacionesde un reactivo (0 para los errores y 1 para losaciertos) con las calificaciones de la medida decriterio.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    5/19

    Se han usado distintos tipos de coeficientes de

    correlacin para este propsito; el ms comnes el coeficiente biserial puntual,

    nt = la cantidad total de examinados.np = la cantidad de examinados que resuelven correctamente el

    reactivoYp = la media de las calificaciones de criterio de quienes pasan elreactivo,Y = la media de todas las calificaciones de criterio,

    s, = la desviacin estndar de todas las calificaciones de criterio.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    6/19

    Conclusin de peso en

    evaluacin.Mayor correlacin entre reactivo y criterio= mspreciso ser el reactivo como predictor delcriterio.

    Coef. de .20 o menores pueden contribuir a

    predecir el criterio, se prefieren coeficientes mselevados.

    No solo correlacin entre reactivo y criterio, sinotambin de la correlacin del reactivo con otrosreactivos de la prueba.

    Son mejores los reactivos que tienen correlacioneselevadas con el criterio, pero bajas con otrosreactivos, porque representan una contribucinms independiente a la prediccin decalificaciones de criterio.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    7/19

    No hay un criterio externo fcilmente disponiblecontra el cual validar los reactivos de las pruebasde aprovechamiento en el aula: entoncesusamos consistencia interna.

    El procedimiento ms breve consiste en dividir alos examinandos en tres grupos segn suscalificaciones en la prueba como un todo: ungrupo superior formado por el 27% que obtuvo lascalificaciones ms altas, un grupo inferior

    compuesto por el 27% que tuvo las calificacionesms bajas, y el restante 46% incluido en un grupointermedio, luego se realiza el siguiente clculo.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    8/19

    Up y Lp son la cantidad de individuos que hay en losgrupos superior e inferior, respectivamente, y que

    aciertan en el reactivo; U y L son el nmero total depersonas en los grupos superior e inferior (obsrveseque U = L), respectivamente. Al valor de p se leconoce como ndice de dificultad del reactivo y alde D como ndice de discriminacin del reactivo.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    9/19

    Slo porque la forma como se responde un reactivovara de grupo a grupo no quiere decir necesariamente

    que un reactivo est sesgado en contra de alguno delos grupos. Tcnicamente, un reactivo se considerasesgado slo cuando mide algo distintounacaracterstica o rasgo diferenteen un grupo conrespecto a otro.

    A pesar de sus desventajas, los ndices de dificultad y dediscriminacin de reactivos proporcionan informacintil sobre el funcionamiento de los reactivos individuales.

    En general, se ha descubierto que el anlisis de reactivosproduce mejoras considerables en la eficacia de laspruebas. En particular, el ndice de discriminacin dereactivos es una medida bastante adecuada de lacalidad del reactivo.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    10/19

    ESTANDARIZACIN Y NORMAS

    DE LAS PRUEBAS. Los datos sobre el desempeo de un grupo numerosode individuos, como aquellos en quienes se basa eldiseo de un instrumento, son tiles para propsitos deinterpretacin de calificaciones.

    La estandarizacin tambin incluye aplicar la prueba auna muestra grande de personas (la muestra deestandarizacin) aleccionada como representante dela poblacin meta a la que est destinada la prueba.

    Toda prueba estandarizada tiene instruccionesestndar de aplicacin y calificacin que debenseguirse estrictamente, sin dejar lugar a lainterpretacin personal o al sesgo.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    11/19

    El principal propsito de estandarizar una prueba

    es determinar la distribucin de puntuacioneseradas en la muestra de estandarizacin (gruponorma). Las calificaciones crudas obtenidas setransforman entonces en alguna forma decalificaciones derivadas o normas.

    Los principales tipos de normas son equivalentesde edad, de grado, rangos de percentilares ycalificaciones estndar.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    12/19

    Este mtodo de interpretacin con referencias a

    normas, las normas obtenidas no funcionan comoestndares del desempeo deseado, sinosimplemente como un marco de referencia parainterpretar calificaciones.

    Normas indican la posicin de una persona en laprueba con respecto a la distribucin de lascalificaciones obtenidas por personas de la mismaedad cronolgica, grado, sexo u otras

    caractersticas demogrficas.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    13/19

    Seleccin de una muestra de

    estandarizacin Muestreo aleatorio sencillo, cada uno de los miembros

    de la poblacin meta tiene la misma oportunidad deser seleccionado, pero aleatoriedad no garantiza que

    haya representatividad.

    Muestreo aleatorio estratificado, se reduce laprobabilidad de elegir una muestra atpica o sesgada,categorizar, o estratificar, la poblacin de una serie devariables demogrficas (sexo, edad, nivelsocioeconmico, regin geogrfica y similares) quepresumiblemente estn relacionadas con lascalificaciones de la prueba. Entonces la cantidad deindividuos seleccionados al azar de cada categora oestrato es proporcional al nmero total de personas dela poblacin que caen en ese estrato.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    14/19

    El muestreo por grupos: dividir una regingeogrfica designada o alguna otra

    entidad relevante en bloques o gruposluego elige al azar un porcentajeespecificado de los grupos y dentro decada uno se selecciona aleatoriamente

    una cantidad determinada desubunidades (escuelas, residencias, etc.).

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    15/19

    Normas de calificacinestndar A diferencia de los rangos percentilares,

    las calificaciones estndar representan la

    medicin en una escala de intervalos.

    Las normas de calificacin estndar sonpuntuaciones convertidas que tienen

    cualesquier media y desviacin estndardeseadas.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    16/19

    Calificacionesz

    X es una puntuacin cruda dada,X es la media

    aritmtica, ys es la desviacin estndar de laspuntuaciones crudas.

    Transformar puntuaciones crudas en calificacioneszproduce una distribucin de calificaciones con lamisma forma, pero con una media y desviacinestndar distintas a la distribucin de la puntuacincruda (X).

    Media de las calificacionesz es 0, y la desviacinestndar es 1.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    17/19

    Calificaciones Wechsler.

    Las puntuaciones crudas en las subpruebas de las

    escalas de inteligencia de Wechsler se transformaron

    para tener una media de 10 y desviacin estndar de3. No obstante, las puntuaciones verbales, de

    ejecucin y de escala total (CIs de desviacin) en las

    pruebas de Wechsler se convirtieron a una distribucin

    con una media de 100 y desviacin estndar de 15

    (vea las ltimas dos lneas de la figura 4.3).

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    18/19

    Otra escala de calificacin es la calificacinestanina (nueve estndar).

    En esta escala estndar normalizada, que tieneuna media de 5 y desviacin estndar deaproximadamente 2, hay nueve rangos distintos, oestaninas.

    Calificacin estanina no es una verdadera escalade calificaciones estndar, porque la primera y lanovena estanina estn abiertas.

    Equilibrar la tendencia a considerar las

    calificaciones de pruebas como medidas precisas,invariables, de las diferencias individuales.

  • 7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas

    19/19

    Otro procedimiento que tiene el mismo efectoes registrar no slo el rango percentilar o lacalificacin estndar correspondiente a unapuntuacin cruda dada, sino tambin un rangopercentilar o un intervalo de calificacinestndar dentro de los cuales pueda esperarse

    razonablemente que caiga la verdaderaposicin.