clase 2_a_temas históricos y profesionales
TRANSCRIPT
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
1/77
Temas histricosy profesionales.
Docente: Ps. Jos Luis CortsAraya
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
2/77
Antecedentes Histricos yProfesionales. Cualquiera que haya asistido a la escuela bsica o a la
universidad, ingresado al servicio militar o bien solicitado
algn empleo durante el ltimo medio siglo, sin duda ha
completado una o ms pruebas. Hace casi 2,500 aos, Platn y Aristteles escribieron
acerca de las diferencias individuales.
Ao 2200 a. C., el entonces emperador chino instituy un
sistema de exmenes en el servicio civil para determinar
los funcionarios gubernamentales eran aptos para
desempear sus labores.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
3/77
Ilustracin y Renacimiento
Un mundo ms progresista, menos doctrinario dondefue desarrollndose la idea de que las personas erannicas y tenan derecho a afirmar sus dones naturalesy a mejorar su posicin en la vida.
El inters por el aprendizaje y la creatividad resurgi yfue fomentado, constituy tambin un renacimientodel individualismo.
El espritu de la libertad y el valor individual, quefloreca gracias al estmulo poltico y econmico que
proporcionaban el capitalismo y la democracia,encontr su expresin en el arte, la ciencia, la filosofay el gobierno.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
4/77
S. XIX: La medicin mental
cientficaA principios del siglo XIX, los cientficos solan
considerar las diferencias en cuanto ahabilidades sensoriomotrices y mentales sobre
todo como un fastidio o una fuente de error.
Debido a que la bsqueda de leyes generalesen la naturaleza es difcil cuando lasmediciones de fenmenos naturales sonimprecisas y no confiables, los fsicos dirigieronsu atencin hacia la construccin deinstrumentos que fueran ms precisos yconsistentes que la sola observacin humana.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
5/77
Charles Darwin y El origen de las especies.
Al final del siglo XIX Gustav Fechner, Wilhelm Wundt,Hermann Ebbinghaus y otros psiclogos experimentalesdemostraron que los fenmenos psicolgicos podan serdescritos en trminos cuantitativos y racionales.
Francis Galton, primo del naturalista Charles Darwin, fueun caballero ingls que se interes en las baseshereditarias de la inteligencia y en la medicin de lashabilidades humanas. Galton dedic su atencin enparticular a la herencia del talento, pero tambinelabor una serie de pruebas sensoriomotrices y disevarias tcnicas para investigar las diferencias
individuales en cuanto a aptitudes y temperamento.Entre sus contribuciones metodolgicas figura latcnica de co-relaciones, que sigue siendo un mtodopopular para analizar calificaciones de pruebas.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
6/77
S. XX: la estandarizacin y la
Ciencia. Alfred Binet, construir la primera prueba
mental que contribuy en forma
significativa a la prediccin delaprovechamiento acadmico. Aportesignificativo concepto Edad Mental.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
7/77
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
8/77
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
9/77
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
10/77
Clasificando tests Las pruebas se pueden clasificar segn su contenido, la forma en que se
elaboraron, el parmetro para cuya medicin se disearon, el propsito
de su aplicacin, e incluso de acuerdo con la manera en que se
administran, califican e interpretan.
Un criterio de clasificacin sencillo es la dicotoma entre pruebas
estandarizadas contra no estandarizadas. Una prueba estandarizada,
elaborada por profesionales especialistas en desarrollar pruebas y que es
administrada a una muestra representativa de personas pertenecientes ala poblacin para la que se dise el instrumento, tiene procedimientos
establecidos de administracin y calificacin(normas) que son constantes
en los distintos examinandos. As, todos ellos tienen la misma oportunidad
de responder los distintos reactivos de acuerdo con sus habilidades.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
11/77
Otros criterios de clasificacin
Individuales contra colectivas.
Velocidad contra potencia.
Pruebas objetivas contra no objetivas.
Verbales o de Ejecucin.Cognoscitivas contra afectivas.
Rendimiento(fluida) yaprovechamiento(cristal).
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
12/77
Usos Comunes de los tests Clasificar, colocar, conservar, despedir, promover y/o
rotar a las personas en contextos educativos y laborales.
Asesorar y guiar a las personas con propsitos de asesora
educativa, vocacional y personal. Diagnosticar y prescribir tratamientos psicolgicos y fsicos
en clnicas y hospitales.
Evaluar cambios cognoscitivos, intra o interpersonales
relativos a programas educativos, psicoteraputicos y
otros de intervencin en el comportamiento.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
13/77
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
14/77
tica y uso de los testsQuien?, Como? A quien?para qu?
La preparacin requerida para aplicar, evaluare interpretar pruebas vara en cierta medida de
acuerdo con el tipo de prueba en particular. Preparacin mayor para:
individuales que colectivas.
Inteligencia y personalidad que en rendimiento
y aptitudes especiales.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
15/77
La evaluacin y el diagnstico deberan serrealizados slo en un contexto profesional y por
parte de especialistas capacitados ycompetentes en las pruebas adecuadas.Tambin se pone nfasis en
1. La aplicacin de procedimientos cientficospara disear y seleccionar pruebas y tcnicas
que sean apropiadas para poblacionesespecficas.
2. La interpretacin juiciosa de los resultados delas pruebas.
3. El uso cuidadoso de las calificaciones de laspruebas y los servidos de interpretacin.4. Explicaciones claras pero cuidadosas de los
hallazgos de la evaluacin.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
16/77
Factores a considerarConsentimiento Informado escrito y
firmado.
Etiqueta menos estigmatizante.
Resultados son informacin privilegiadaincluida en secreto profesional.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
17/77
Diseo y Elaboracin de tests La cantidad de esfuerzo invertido en laelaboracin de un test psicolgico o educativo
vara con el tipo de prueba y con los propsitospara los cuales se crea.
Cualquiera que sea el tipo de prueba o las metasde los usuarios, se necesita cierto grado deplaneacin incluyendo definiciones claras de lasvariables o constructos que van a medirse,descripciones de las personas que van a ser
examinadas, condiciones bajo las cuales seadministrar la prueba, e informacinconcerniente a la calificacin, interpretacin delas puntuaciones y uso que se dar a losresultados.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
18/77
Proceso de elaboracin varia en cierto grado deacuerdo con el propsito que se pretendalograr.
De manera ideal, la elaboracin de una pruebau otro instrumento psicomtrico empieza con ladefinicin de las variables o constructos que vana medirse y con el esbozo del contenidopropuesto.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
19/77
Test de inteligencia: se rene un conjunto de
reactivos que supuestamente miden algnaspecto del constructo inteligencia. Esosreactivos pueden ser elaborados de acuerdocon una teora especfica de la conducta
inteligente o haciendo referencia slo a los tiposde tareas que la gente muy inteligente puederealizar de manera ms efectiva que las personasmenos inteligentes.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
20/77
Inventarios y escalas depersonalidad Se han empleado varios enfoques,
algunos basados en el sentido comn,
otros en las teoras de personalidad yotros ms en procedimientos estadsticos.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
21/77
Pruebas de rendimiento
Se ha dedicado ms atencin a los procedimientosusados para elaborar pruebas de rendimientoacadmico que a los de otras clases de pruebas.
Se aplican ms pruebas de rendimiento que todos
los otros tipos de pruebas combinados. Pese a la actual cultura anti exmenes, debeconsiderrseles parte integral y formativa delproceso educativo: cuando se usan de maneraefectiva, los resultados de los exmenes no se limitana la sola evaluacin y motivacin de los estudiantes,
si no que proporcionan informacin a los maestros, alpersonal administrativo y a los padres, concernientea la medida en que se han alcanzado los objetivoseducativos especficos.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
22/77
Preguntas para las personasque planifican los instrumentos
Cules son los temas y materiales sobre los que se
examinar a los estudiantes?
Qu tipos de preguntas deben elaborarse?
Qu formatos o esquemas de reactivos y pruebas
deben utilizarse?
Cundo, dnde y cmo debe administrarse la prueba? Cmo debe calificarse y evaluarse la prueba resuelta?
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
23/77
Taxonomas de objetivoscognoscitivos
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
24/77
Taxonomas de objetivos
cognoscitivos
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
25/77
PREPARACIN DE LOS
REACTIVOS DEL TEST Ciertos tipos de reactivos de prueba son ms apropiados
que otros para medir la obtencin de objetivos especficos.
Prepare alrededor de 20% ms de reactivos de los que enrealidad se necesiten .
Tipos de Reactivos
1. Completamiento o llenado contraseleccin.
2. Recuerdo contrareconocimiento.
3. Construccin de respuesta contra identificacin.
4. Ensayo contra objetivo.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
26/77
Reactivos de respuesta corta
Reactivos de verdadero y falso
Reactivos de aparejamiento
Reactivos de opcin mltiple
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
27/77
FORMACIN YREPRODUCCIN DE UN TEST Una vez que se han preparado los reactivos
para una prueba, es aconsejable hacer que
los revisen y editen personas conocedoras.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
28/77
Tiempo!!: Lmites en los tests
Un minuto = 1 reactivo de opcin mltiple o de respuesta
corta.
Un minuto = dos reactivos de verdadero y falso.
Ocho minutos = 1 pregunta de ensayo que requiererespuesta de media pgina.
La extensin de la prueba y los lmites de tiempo necesitarn
ajustarse hacia abajo o hacia arriba cuando se examine a
alumnos de escuela primaria o a estudiantes de universidad.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
29/77
PRUEBAS DE DESEMPEO Tpicamente en Chile Evaluacin por
competencias. Se le conoce tambien
como evaluacin autntica o, paraenfatizar que son una opcin a laspruebas escritas, evaluacin alternativa.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
30/77
ADMINISTRACION,
APLICACION Y CALIFICACINDE LOS TESTS Sin importar qu tan cuidadosamente se
elabore una prueba, los resultados no
tienen ningn valor si no se administra ycalifica sta en forma adecuada.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
31/77
El procedimiento que debe seguirse para aplicar una
prueba o cualquier otro instrumento psicomtricodepende de:
1. Tipo de instrumento (individual o colectiva, con tiempo
predeterminado o sin ste, cognoscitiva o afectiva).2. Evaluado(edad cronolgica, la educacin, los
antecedentes culturales y el estado fsico y mental y
especialmente de la disposicin y motivacin.
3. Evaluador(apariencia, comportamiento y
conocimiento de la tcnica, entre otros)
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
32/77
Deberes del examinadorantes de la prueba
Programacin.
Consentimiento informado.
Familiarizarse con la prueba.
Garantizar condiciones de evaluacin
satisfactorias.
Reducir los fraudes.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
33/77
Deberes del examinadordurante la prueba
Seguir las instrucciones de la prueba.
Permanecer alerta . Establecer una relacin interpersonal.
Prepararse para manejar problemas
especiales. Flexibilidad,
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
34/77
Deberes del examinadordespus de la prueba Tras la administracin de una prueba
colectiva de grupo, el examinador tiene
que recoger los materiales pertinentes.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
35/77
Pruebas adaptativas
En pruebas adaptativas o a la medida,
los reactivos especficos aplicados a unapersona en particular dependen de sucapacidad calculada a partir de susrespuestas a reactivos previos. Debido aque las pruebas son ms precisas para
medir la habilidad de las personas si ladificultad de los reactivos corresponde asu propio nivel de habilidad .
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
36/77
CALIFICACIN DE LOS TESTS
Cuando esta diseando el instrumento, el evaluador
debe decidir si quiere obtener calificaciones separadas
de las diversas partes, as como un resultado general de
la prueba en su conjunto.
Tambin debe decidirse si se restar una correccin por
adivinar, si se asignarn distintos pesos a la calificacin
de los diversos reactivos o secciones y si se entregarn
los resultados en forma directa o convertidos a otrasescalas numricas.
Para pruebas estandarizadas, el maestro de aula no
necesita tomar todas estas decisiones.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
37/77
Correccin por adivinacin.
R es la cantidad de reactivos que el examinadoacierta.
W la cantidad de reactivos en que el examinadose equivoca.
k la cantidad de opciones por reactivo.
S la calificacin corregida
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
38/77
ANALISIS DE REACTIVOS YESTANDARIZACIN DEPRUEBAS
Anlisis de reactivos se centra en el funcionamiento
de reactivos individuales, mientras que laestandarizacin de pruebas se ocupa de lainterpretacin normativa de los resultados de laprueba en su conjunto o de algunas de las partes osubpruebas que la integran.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
39/77
Se deben analizar las respuestas de esa muestra
pilotopara determinar si los reactivos estnfuncionando de manera adecuada.Cualquiera que sea el tipo de prueba,
estandarizada o elaborada por el maestro, de
habilidad o de personalidad, un anlisispost mortemopost hocde los resultados es necesario.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
40/77
Validez de reactivoA fin de evaluar la utilidad de un reactivo como
medida de las diferencias individuales en cuantoa las caractersticas de habilidad o depersonalidad, se requiere un criterio externo de
medida de dicho rasgo.
La validez de un reactivo para predecir unaposicin con base en un criterio externo puede
determinarse al correlacionar las calificacionesde un reactivo (0 para los errores y 1 para losaciertos) con las calificaciones de la medida decriterio.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
41/77
Se han usado distintos tipos de coeficientes de
correlacin para este propsito; el ms comnes el coeficiente biserial puntual,
nt = la cantidad total de examinados.np = la cantidad de examinados que resuelven correctamente el
reactivoYp = la media de las calificaciones de criterio de quienes pasan elreactivo,Y = la media de todas las calificaciones de criterio,
s, = la desviacin estndar de todas las calificaciones de criterio.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
42/77
Conclusin de peso en
evaluacin.Mayor correlacin entre reactivo y criterio= mspreciso ser el reactivo como predictor delcriterio.
Coef. de .20 o menores pueden contribuir a
predecir el criterio, se prefieren coeficientes mselevados.No solo correlacin entre reactivo y criterio, sino
tambin de la correlacin del reactivo con otrosreactivos de la prueba.
Son mejores los reactivos que tienen correlacioneselevadas con el criterio, pero bajas con otrosreactivos, porque representan una contribucinms independiente a la prediccin decalificaciones de criterio.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
43/77
No hay un criterio externo fcilmente disponiblecontra el cual validar los reactivos de las pruebasde aprovechamiento en el aula: entoncesusamos consistencia interna.
El procedimiento ms breve consiste en dividir alos examinandos en tres grupos segn suscalificaciones en la prueba como un todo: ungrupo superior formado por el 27% que obtuvo lascalificaciones ms altas, un grupo inferior
compuesto por el 27% que tuvo las calificacionesms bajas, y el restante 46% incluido en un grupointermedio, luego se realiza el siguiente clculo.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
44/77
Up y Lp son la cantidad de individuos que hay en losgrupos superior e inferior, respectivamente, y queaciertan en el reactivo; U y L son el nmero total depersonas en los grupos superior e inferior (obsrveseque U = L), respectivamente. Al valor de p se leconoce como ndice de dificultad del reactivo y alde D como ndice de discriminacin del reactivo.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
45/77
Slo porque la forma como se responde un reactivovara de grupo a grupo no quiere decir necesariamente
que un reactivo est sesgado en contra de alguno delos grupos. Tcnicamente, un reactivo se considerasesgado slo cuando mide algo distintounacaracterstica o rasgo diferenteen un grupo conrespecto a otro.
A pesar de sus desventajas, los ndices de dificultad y dediscriminacin de reactivos proporcionan informacintil sobre el funcionamiento de los reactivos individuales.
En general, se ha descubierto que el anlisis de reactivosproduce mejoras considerables en la eficacia de laspruebas. En particular, el ndice de discriminacin dereactivos es una medida bastante adecuada de lacalidad del reactivo.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
46/77
ESTANDARIZACIN Y NORMAS
DE LAS PRUEBAS. Los datos sobre el desempeo de un grupo numerosode individuos, como aquellos en quienes se basa eldiseo de un instrumento, son tiles para propsitos deinterpretacin de calificaciones.
La estandarizacin tambin incluye aplicar la prueba auna muestra grande de personas (la muestra deestandarizacin) aleccionada como representante dela poblacin meta a la que est destinada la prueba.
Toda prueba estandarizada tiene instruccionesestndar de aplicacin y calificacin que debenseguirse estrictamente, sin dejar lugar a lainterpretacin personal o al sesgo.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
47/77
El principal propsito de estandarizar una pruebaes determinar la distribucin de puntuacioneseradas en la muestra de estandarizacin (gruponorma). Las calificaciones crudas obtenidas setransforman entonces en alguna forma decalificaciones derivadas o normas.
Los principales tipos de normas son equivalentesde edad, de grado, rangos de percentilares ycalificaciones estndar.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
48/77
Este mtodo de interpretacin con referencias a
normas, las normas obtenidas no funcionan comoestndares del desempeo deseado, sinosimplemente como un marco de referencia parainterpretar calificaciones.
Normas indican la posicin de una persona en laprueba con respecto a la distribucin de lascalificaciones obtenidas por personas de la mismaedad cronolgica, grado, sexo u otrascaractersticas demogrficas.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
49/77
Seleccin de una muestra de
estandarizacin Muestreo aleatorio sencillo, cada uno de los miembros
de la poblacin meta tiene la misma oportunidad deser seleccionado, pero aleatoriedad no garantiza quehaya representatividad.
Muestreo aleatorio estratificado, se reduce laprobabilidad de elegir una muestra atpica o sesgada,categorizar, o estratificar, la poblacin de una serie devariables demogrficas (sexo, edad, nivel
socioeconmico, regin geogrfica y similares) quepresumiblemente estn relacionadas con lascalificaciones de la prueba. Entonces la cantidad deindividuos seleccionados al azar de cada categora oestrato es proporcional al nmero total de personas dela poblacin que caen en ese estrato.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
50/77
El muestreo por grupos: dividir una regingeogrfica designada o alguna otra
entidad relevante en bloques o gruposluego elige al azar un porcentajeespecificado de los grupos y dentro decada uno se selecciona aleatoriamente
una cantidad determinada desubunidades (escuelas, residencias, etc.).
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
51/77
Normas de calificacinestndar A diferencia de los rangos percentilares,
las calificaciones estndar representan la
medicin en una escala de intervalos.
Las normas de calificacin estndar sonpuntuaciones convertidas que tienen
cualesquier media y desviacin estndardeseadas.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
52/77
Calificacionesz
X es una puntuacin cruda dada,X es la media
aritmtica, ys es la desviacin estndar de laspuntuaciones crudas.
Transformar puntuaciones crudas en calificacioneszproduce una distribucin de calificaciones con lamisma forma, pero con una media y desviacin
estndar distintas a la distribucin de la puntuacincruda (X).
Media de las calificacionesz es 0, y la desviacinestndar es 1.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
53/77
Calificaciones Wechsler.
Las puntuaciones crudas en las subpruebas de las
escalas de inteligencia de Wechsler se transformaron
para tener una media de 10 y desviacin estndar de3. No obstante, las puntuaciones verbales, de
ejecucin y de escala total (CIs de desviacin) en las
pruebas de Wechsler se convirtieron a una distribucin
con una media de 100 y desviacin estndar de 15
(vea las ltimas dos lneas de la figura 4.3).
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
54/77
Otra escala de calificacin es la calificacinestanina (nueve estndar).
En esta escala estndar normalizada, que tieneuna media de 5 y desviacin estndar deaproximadamente 2, hay nueve rangos distintos, oestaninas.
Calificacin estanina no es una verdadera escalade calificaciones estndar, porque la primera y lanovena estanina estn abiertas.
Equilibrar la tendencia a considerar las
calificaciones de pruebas como medidas precisas,invariables, de las diferencias individuales.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
55/77
Otro procedimiento que tiene el mismo efectoes registrar no slo el rango percentilar o la
calificacin estndar correspondiente a unapuntuacin cruda dada, sino tambin un rangopercentilar o un intervalo de calificacinestndar dentro de los cuales pueda esperarse
razonablemente que caiga la verdaderaposicin.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
56/77
CONFIABILIDAD Y VALIDEZ
CONFIABILIDAD: para medir lo que fue diseadapara medir.
Teora clsica de la confiabilidad La calificacin observada de una persona en una
prueba est compuesta por una puntuacinreal ms algn error no sistemtico de medicin.
Puntuacin real de una persona = promedio delas puntuaciones de infinitas aplicaciones.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
57/77
La varianza de las puntuaciones observadas(s2obs) de un grupo de personas es igual a la
varianza de sus puntuaciones reales (s2rea) ms lavarianza debida a los errores no sistemticos demedicin (s2err):
Entonces la confiabilidad (rn)= proporcin de lavarianza observada que es explicada por lavarianza real.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
58/77
La confiabilidad de un conjunto decalificaciones en una prueba se expresa
como un nmero decimal positivo queflucta entre .00 y 1.00. Una r de 1.00indica una confiabilidad perfecta, y una rde .00 indica una falta absoluta deconfiabilidad de la medic.n
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
59/77
Coeficiente test-retest: coeficiente deestabilidad.
Coeficiente de formas paralelas.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
60/77
Coeficientes de consistencia
internaMitades de Spearman: Enfoque
simplificado de la consistencia interna
una sola prueba se considera compuestapor dos partes (formas paralelas) quemiden la misma cosa.
Kuder-Richardson: Una prueba puede
dividirse de muchas formas diferentes endos mitades que contengan igualnmero de reactivos.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
61/77
Alfa de Cronbach k es el nmero de reactivos,s2i la varianza de las
calificaciones en el reactivo i, ys2t la varianza delas calificaciones totales de la prueba.
Kuder-Richanison slo son aplicables cuando los
reactivos de la prueba se califican con 0 o 1, pero elcoeficiente alfa es una frmula general para estimarla confiabilidad de una prueba que consta dereactivos en los cuales pueden asignarsecalificaciones de distinto peso a respuestas diferentes.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
62/77
Confiabilidad entrecalificadores
Importante conocer el grado en que diferentescalificadores estn de acuerdo en lascalificaciones y otros valores numricos dados alas respuestas de diferentes examinados y
reactivos.1. Los personas califican las respuestas de un
nmero considerable de examinados y calcularluego la correlacin entre los dos conjuntos decalificaciones.
2. muchas personas califiquen las respuestas de unexaminado
3. Muchas personas califiquen las respuestas devarios examinados.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
63/77
Interpretacin de los
coeficientes de confiabilidad Qu tan alto debe ser un coeficiente de confiabilidadpara que una prueba u otro instrumento psicomtricosean tiles? La respuesta depende de lo queplaneemos hacer con las puntuaciones de la prueba:
1. Determinar si las calificaciones promedio de dosgrupos de personas son significativamente diferentes :.60 a .70
2. Comparar la calificacin de una persona con la deotra, o la calificacin de una persona en una pruebacon su calificacin en otro instrumento: .85+ .
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
64/77
agregar reactivos que miden algo
diferente de lo que miden los reactivosoriginales puede dar lugar a unareduccin en la confiabilidad.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
65/77
Variabilidad y extensin de la
prueba.Coeficientes de confiabilidad tienden a ser ms
altos cuando la varianza de las puntuaciones de laprueba, las puntuaciones del reactivo, las
calificaciones u otras variables que son evaluadas,es grande que cuando es pequea.
La varianza de la calificacin de la prueba serelaciona con la extensin de sta.
Mayor extensin de la prueba =mayorconfiabilidad.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
66/77
Frmula general de Spearman-Brown es unaexpresin del efecto que tiene sobre la
confiabilidad el alargar una prueba incluyendoms reactivos del mismo tipo general.
m es el factor por el cual se alarga la prueba
rll la confiabilidad de la prueba original no alargada
rmm la confiabilidad estimada de la pruebaalargada.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
67/77
Aplicacin de Spearman
Brown. Puede utilizarse para determinar el incremento
necesario en la longitud de la prueba y, en
consecuencia, el nmero de reactivos quedeben agregarse para incrementar laconfiabilidad de un valor desderll hasta rmm
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
68/77
Varianza y confiabilidad.Adems de depender del nmero de reactivos, la
varianza y la confiabilidad de una prueba sonafectadas por la heterogeneidad de la muestrade personas que la presentan.
Entre mayor sea el rango de diferenciasindividuales en cierta caracterstica, mayor ser lavarianza de las calificaciones en una medida de
esa caracterstica.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
69/77
Error estndar de medicin
S obs es la desviacin estndar de las calificacionesobservadas de la prueba
rll el coeficiente de confiabilidad test-retest.
Para ilustrar el clculo y el significado del error estndar demedicin, suponga que la desviacin estndar de una prueba es6.63 y el coeficiente de confiabilidad test-retest es .85; entonces
Serr = 6.631-.85 = 2.57. Si la calificacin de una persona en laprueba es 40, puede concluirse, con 68% de confianza, que formaparte de un grupo de personas que tienen calificacionesobservadas de 40 cuyas calificaciones reales en la prueba caenentre 37.43(40 - 2.57)y 42.57(40 + 2.57).
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
70/77
Confiabilidad de las pruebas
referidas a criterio Un grupo consta de personas cuyas puntuacionesigualan o exceden el nivel de criterio (dedominio) en la habilidad que se est evaluando;
el otro grupo consta de personas cuyaspuntuaciones no alcanzan el nivel de criterio.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
71/77
VALIDEZ
El grado en que una prueba mide lo que estdiseada para medir.
Metodos: (1) analizar el contenido de la prueba, (2)calcular la correlacin entre las calificaciones en laprueba y las calificaciones en el criterio de inters y(3) investigar las caractersticas psicolgicasparticulares o constructos medidos por la prueba.
A diferencia de la confiabilidad, la cual es influidaslo por los errores no sistemticos de medicin, la
validez de una prueba es afectada tanto por loserrores no sistemticos como por los sistemticos(constantes).
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
72/77
Validez de contenidoAtae a si la prueba produce un rango de
respuestas que son representativas del dominioentero o universo de habilidades, entendimientosy otras conductas que supuestamente debemedir la prueba.
A menudo en conexin con las pruebas deaprovechamiento, las cuales por lo general noexiste un criterio externo especificado.
Si expertos en la materia coinciden en que una
prueba parece y acta como un instrumentodiseado para medir lo que se supone debemedir, entonces se dice que posee validez decontenido.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
73/77
Validez con relacin a criterio Procedimientos en los cuales las calificaciones en
la prueba de un grupo de personas se comparancon las puntuaciones, clasificaciones u otrasmedidas de desempeo.
Siempre que se dispone de una medida de criterio
en el momento de la prueba puede determinarsela validez concurrente del instrumento. Cuando lascalificaciones en el criterio no estn disponibles sinohasta cierto tiempo despus de que se aplic laprueba, se enfatiza la validez predictiva de la
prueba. Validez predictiva es del mayor inters en la
seleccin y ubicacin en un contexto ocupacionalo educativo.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
74/77
Validez de constructo
Grado en que el instrumento mide un constructoparticular, o concepto psicolgico .
El tipo ms general de validez, no se determina de
una sola manera o por una investigacin, mas bieninvolucra una red de investigaciones y otrosprocedimientos diseados para determinar si uninstrumento de evaluacin que supuestamentemide una determinada variable de personalidad
en realidad lo hace.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
75/77
Evidencia a favor de la validezde constructo.
Los juicios de expertos en contenido. Anlisis de la consistencia interna. Estudios, tanto en grupos formados de manera
experimental como en grupos que se presentan demanera natural, de las relaciones entre las
puntuaciones de la prueba y otras variables en lascuales difieren los grupos. Correlaciones de las puntuaciones en la prueba con
las puntuaciones en otras pruebas y variables con lascuales se espera que tengan cierta relacin, seguidaspor un anlisis factorial de esas correlaciones.
Interrogar con detalle a los examinados o a loscalificadores acerca de sus respuestas a una pruebao escala de calificacin para revelar los procesosmentales especficos implicados al dar respuesta a losreactivos.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
76/77
Validacin convergente y discriminante. Uninstrumento con validez de constructo debe tenercorrelaciones altas con otras medidas o mtodosde medicin del mismo constructo (validezconvergente), pero correlaciones bajas con lasmedidas de constructos diferentes (validez
discriminante)
Cuando las correlaciones entre el mismoconstructo medidas por el mismo y por diferentes
mtodos son significativamente mayores que lascorrelaciones entre diferentes constructosmedidas por los mismos o por diferentes mtodos.
-
7/25/2019 Clase 2_a_Temas Histricos y Profesionales
77/77
AIKEN, Cap 1, Temas histricos y profesionales
AIKEN, Cap 2, Diseo y elaboracin de tests
AIKEN, Cap 4, Anlisis de reactivos y
estandarizacin de pruebas.
AIKEN, Cap 5, Confiablidad y Validez.
Bibliografa