clase 2_d_análisis de reactivos y estandarización de pruebas
TRANSCRIPT
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
1/19
Anlisis de
Reactivos yestandarizacinde PruebasDocente: Ps. Jos Luis Corts
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
2/19
ANALISIS DE REACTIVOS YESTANDARIZACIN DEPRUEBAS
Anlisis de reactivos se centra en el funcionamiento
de reactivos individuales, mientras que laestandarizacin de pruebas se ocupa de lainterpretacin normativa de los resultados de laprueba en su conjunto o de algunas de las partes osubpruebas que la integran.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
3/19
Se deben analizar las respuestas de esa muestra
pilotopara determinar si los reactivos estnfuncionando de manera adecuada.
Cualquiera que sea el tipo de prueba,estandarizada o elaborada por el maestro, de
habilidad o de personalidad, un anlisispost mortemopost hocde los resultados es necesario.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
4/19
Validez de reactivoA fin de evaluar la utilidad de un reactivo como
medida de las diferencias individuales en cuantoa las caractersticas de habilidad o depersonalidad, se requiere un criterio externo de
medida de dicho rasgo.
La validez de un reactivo para predecir unaposicin con base en un criterio externo puede
determinarse al correlacionar las calificacionesde un reactivo (0 para los errores y 1 para losaciertos) con las calificaciones de la medida decriterio.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
5/19
Se han usado distintos tipos de coeficientes de
correlacin para este propsito; el ms comnes el coeficiente biserial puntual,
nt = la cantidad total de examinados.np = la cantidad de examinados que resuelven correctamente el
reactivoYp = la media de las calificaciones de criterio de quienes pasan elreactivo,Y = la media de todas las calificaciones de criterio,
s, = la desviacin estndar de todas las calificaciones de criterio.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
6/19
Conclusin de peso en
evaluacin.Mayor correlacin entre reactivo y criterio= mspreciso ser el reactivo como predictor delcriterio.
Coef. de .20 o menores pueden contribuir a
predecir el criterio, se prefieren coeficientes mselevados.
No solo correlacin entre reactivo y criterio, sinotambin de la correlacin del reactivo con otrosreactivos de la prueba.
Son mejores los reactivos que tienen correlacioneselevadas con el criterio, pero bajas con otrosreactivos, porque representan una contribucinms independiente a la prediccin decalificaciones de criterio.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
7/19
No hay un criterio externo fcilmente disponiblecontra el cual validar los reactivos de las pruebasde aprovechamiento en el aula: entoncesusamos consistencia interna.
El procedimiento ms breve consiste en dividir alos examinandos en tres grupos segn suscalificaciones en la prueba como un todo: ungrupo superior formado por el 27% que obtuvo lascalificaciones ms altas, un grupo inferior
compuesto por el 27% que tuvo las calificacionesms bajas, y el restante 46% incluido en un grupointermedio, luego se realiza el siguiente clculo.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
8/19
Up y Lp son la cantidad de individuos que hay en losgrupos superior e inferior, respectivamente, y que
aciertan en el reactivo; U y L son el nmero total depersonas en los grupos superior e inferior (obsrveseque U = L), respectivamente. Al valor de p se leconoce como ndice de dificultad del reactivo y alde D como ndice de discriminacin del reactivo.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
9/19
Slo porque la forma como se responde un reactivovara de grupo a grupo no quiere decir necesariamente
que un reactivo est sesgado en contra de alguno delos grupos. Tcnicamente, un reactivo se considerasesgado slo cuando mide algo distintounacaracterstica o rasgo diferenteen un grupo conrespecto a otro.
A pesar de sus desventajas, los ndices de dificultad y dediscriminacin de reactivos proporcionan informacintil sobre el funcionamiento de los reactivos individuales.
En general, se ha descubierto que el anlisis de reactivosproduce mejoras considerables en la eficacia de laspruebas. En particular, el ndice de discriminacin dereactivos es una medida bastante adecuada de lacalidad del reactivo.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
10/19
ESTANDARIZACIN Y NORMAS
DE LAS PRUEBAS. Los datos sobre el desempeo de un grupo numerosode individuos, como aquellos en quienes se basa eldiseo de un instrumento, son tiles para propsitos deinterpretacin de calificaciones.
La estandarizacin tambin incluye aplicar la prueba auna muestra grande de personas (la muestra deestandarizacin) aleccionada como representante dela poblacin meta a la que est destinada la prueba.
Toda prueba estandarizada tiene instruccionesestndar de aplicacin y calificacin que debenseguirse estrictamente, sin dejar lugar a lainterpretacin personal o al sesgo.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
11/19
El principal propsito de estandarizar una prueba
es determinar la distribucin de puntuacioneseradas en la muestra de estandarizacin (gruponorma). Las calificaciones crudas obtenidas setransforman entonces en alguna forma decalificaciones derivadas o normas.
Los principales tipos de normas son equivalentesde edad, de grado, rangos de percentilares ycalificaciones estndar.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
12/19
Este mtodo de interpretacin con referencias a
normas, las normas obtenidas no funcionan comoestndares del desempeo deseado, sinosimplemente como un marco de referencia parainterpretar calificaciones.
Normas indican la posicin de una persona en laprueba con respecto a la distribucin de lascalificaciones obtenidas por personas de la mismaedad cronolgica, grado, sexo u otras
caractersticas demogrficas.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
13/19
Seleccin de una muestra de
estandarizacin Muestreo aleatorio sencillo, cada uno de los miembros
de la poblacin meta tiene la misma oportunidad deser seleccionado, pero aleatoriedad no garantiza que
haya representatividad.
Muestreo aleatorio estratificado, se reduce laprobabilidad de elegir una muestra atpica o sesgada,categorizar, o estratificar, la poblacin de una serie devariables demogrficas (sexo, edad, nivelsocioeconmico, regin geogrfica y similares) quepresumiblemente estn relacionadas con lascalificaciones de la prueba. Entonces la cantidad deindividuos seleccionados al azar de cada categora oestrato es proporcional al nmero total de personas dela poblacin que caen en ese estrato.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
14/19
El muestreo por grupos: dividir una regingeogrfica designada o alguna otra
entidad relevante en bloques o gruposluego elige al azar un porcentajeespecificado de los grupos y dentro decada uno se selecciona aleatoriamente
una cantidad determinada desubunidades (escuelas, residencias, etc.).
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
15/19
Normas de calificacinestndar A diferencia de los rangos percentilares,
las calificaciones estndar representan la
medicin en una escala de intervalos.
Las normas de calificacin estndar sonpuntuaciones convertidas que tienen
cualesquier media y desviacin estndardeseadas.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
16/19
Calificacionesz
X es una puntuacin cruda dada,X es la media
aritmtica, ys es la desviacin estndar de laspuntuaciones crudas.
Transformar puntuaciones crudas en calificacioneszproduce una distribucin de calificaciones con lamisma forma, pero con una media y desviacinestndar distintas a la distribucin de la puntuacincruda (X).
Media de las calificacionesz es 0, y la desviacinestndar es 1.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
17/19
Calificaciones Wechsler.
Las puntuaciones crudas en las subpruebas de las
escalas de inteligencia de Wechsler se transformaron
para tener una media de 10 y desviacin estndar de3. No obstante, las puntuaciones verbales, de
ejecucin y de escala total (CIs de desviacin) en las
pruebas de Wechsler se convirtieron a una distribucin
con una media de 100 y desviacin estndar de 15
(vea las ltimas dos lneas de la figura 4.3).
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
18/19
Otra escala de calificacin es la calificacinestanina (nueve estndar).
En esta escala estndar normalizada, que tieneuna media de 5 y desviacin estndar deaproximadamente 2, hay nueve rangos distintos, oestaninas.
Calificacin estanina no es una verdadera escalade calificaciones estndar, porque la primera y lanovena estanina estn abiertas.
Equilibrar la tendencia a considerar las
calificaciones de pruebas como medidas precisas,invariables, de las diferencias individuales.
-
7/25/2019 Clase 2_d_Anlisis de Reactivos y Estandarizacin de Pruebas
19/19
Otro procedimiento que tiene el mismo efectoes registrar no slo el rango percentilar o lacalificacin estndar correspondiente a unapuntuacin cruda dada, sino tambin un rangopercentilar o un intervalo de calificacinestndar dentro de los cuales pueda esperarse
razonablemente que caiga la verdaderaposicin.