clase 2_e_confiabilidad y validez
TRANSCRIPT
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
1/23
Confiabilidady ValidezDocente: Ps. Jos Luis Corts
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
2/23
CONFIABILIDAD Y VALIDEZ
CONFIABILIDAD: para medir lo que fue diseadapara medir.
Teora clsica de la confiabilidad
La calificacin observada de una persona en unaprueba est compuesta por una puntuacinreal ms algn error no sistemtico de medicin.
Puntuacin real de una persona = promedio delas puntuaciones de infinitas aplicaciones.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
3/23
La varianza de las puntuaciones observadas(s2obs) de un grupo de personas es igual a la
varianza de sus puntuaciones reales (s2rea) ms lavarianza debida a los errores no sistemticos demedicin (s2err):
Entonces la confiabilidad (rn)= proporcin de lavarianza observada que es explicada por lavarianza real.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
4/23
La confiabilidad de un conjunto decalificaciones en una prueba se expresa
como un nmero decimal positivo queflucta entre .00 y 1.00. Una r de 1.00indica una confiabilidad perfecta, y una rde .00 indica una falta absoluta de
confiabilidad de la medic.n
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
5/23
Coeficiente test-retest: coeficiente deestabilidad.
Coeficiente de formas paralelas.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
6/23
Coeficientes de consistenciainterna
Mitades de Spearman: Enfoquesimplificado de la consistencia interna
una sola prueba se considera compuestapor dos partes (formas paralelas) quemiden la misma cosa.
Kuder-Richardson: Una prueba puede
dividirse de muchas formas diferentes endos mitades que contengan igualnmero de reactivos.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
7/23
Alfa de Cronbach k es el nmero de reactivos,s2i la varianza de las
calificaciones en el reactivo i, ys2t la varianza delas calificaciones totales de la prueba.
Kuder-Richanison slo son aplicables cuando los
reactivos de la prueba se califican con 0 o 1, pero elcoeficiente alfa es una frmula general para estimarla confiabilidad de una prueba que consta dereactivos en los cuales pueden asignarsecalificaciones de distinto peso a respuestas diferentes.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
8/23
Confiabilidad entre
calificadores Importante conocer el grado en que diferentes
calificadores estn de acuerdo en lascalificaciones y otros valores numricos dados alas respuestas de diferentes examinados yreactivos.
1. Los personas califican las respuestas de unnmero considerable de examinados y calcularluego la correlacin entre los dos conjuntos de
calificaciones.2. muchas personas califiquen las respuestas de un
examinado
3. Muchas personas califiquen las respuestas devarios examinados.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
9/23
Interpretacin de los
coeficientes de confiabilidad Qu tan alto debe ser un coeficiente de confiabilidad
para que una prueba u otro instrumento psicomtricosean tiles? La respuesta depende de lo que
planeemos hacer con las puntuaciones de la prueba:
1. Determinar si las calificaciones promedio de dosgrupos de personas son significativamente diferentes :.60 a .70
2. Comparar la calificacin de una persona con la deotra, o la calificacin de una persona en una pruebacon su calificacin en otro instrumento: .85+ .
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
10/23
agregar reactivos que miden algodiferente de lo que miden los reactivosoriginales puede dar lugar a unareduccin en la confiabilidad.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
11/23
Variabilidad y extensin de la
prueba.Coeficientes de confiabilidad tienden a ser ms
altos cuando la varianza de las puntuaciones de laprueba, las puntuaciones del reactivo, las
calificaciones u otras variables que son evaluadas,es grande que cuando es pequea.
La varianza de la calificacin de la prueba serelaciona con la extensin de sta.
Mayor extensin de la prueba =mayorconfiabilidad.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
12/23
Frmula general de Spearman-Brown es unaexpresin del efecto que tiene sobre la
confiabilidad el alargar una prueba incluyendoms reactivos del mismo tipo general.
m es el factor por el cual se alarga la prueba
rll la confiabilidad de la prueba original no alargada
rmm la confiabilidad estimada de la pruebaalargada.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
13/23
Aplicacin de SpearmanBrown.
Puede utilizarse para determinar el incrementonecesario en la longitud de la prueba y, en
consecuencia, el nmero de reactivos quedeben agregarse para incrementar laconfiabilidad de un valor desderll hasta rmm
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
14/23
Varianza y confiabilidad.Adems de depender del nmero de reactivos, la
varianza y la confiabilidad de una prueba sonafectadas por la heterogeneidad de la muestrade personas que la presentan.
Entre mayor sea el rango de diferenciasindividuales en cierta caracterstica, mayor ser lavarianza de las calificaciones en una medida de
esa caracterstica.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
15/23
Error estndar de medicin
S obs es la desviacin estndar de las calificacionesobservadas de la prueba
rll el coeficiente de confiabilidad test-retest.
Para ilustrar el clculo y el significado del error estndar demedicin, suponga que la desviacin estndar de una prueba es6.63 y el coeficiente de confiabilidad test-retest es .85; entoncesSerr = 6.631-.85 = 2.57. Si la calificacin de una persona en laprueba es 40, puede concluirse, con 68% de confianza, que formaparte de un grupo de personas que tienen calificacionesobservadas de 40 cuyas calificaciones reales en la prueba caenentre 37.43(40 - 2.57)y 42.57(40 + 2.57).
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
16/23
Confiabilidad de las pruebas
referidas a criterio Un grupo consta de personas cuyas puntuaciones
igualan o exceden el nivel de criterio (dedominio) en la habilidad que se est evaluando;
el otro grupo consta de personas cuyaspuntuaciones no alcanzan el nivel de criterio.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
17/23
VALIDEZ
El grado en que una prueba mide lo que estdiseada para medir.
Metodos: (1) analizar el contenido de la prueba, (2)calcular la correlacin entre las calificaciones en la
prueba y las calificaciones en el criterio de inters y(3) investigar las caractersticas psicolgicasparticulares o constructos medidos por la prueba.
A diferencia de la confiabilidad, la cual es influidaslo por los errores no sistemticos de medicin, lavalidez de una prueba es afectada tanto por loserrores no sistemticos como por los sistemticos(constantes).
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
18/23
Validez de contenido
Atae a si la prueba produce un rango derespuestas que son representativas del dominioentero o universo de habilidades, entendimientosy otras conductas que supuestamente debemedir la prueba.
A menudo en conexin con las pruebas deaprovechamiento, las cuales por lo general noexiste un criterio externo especificado.
Si expertos en la materia coinciden en que una
prueba parece y acta como un instrumentodiseado para medir lo que se supone debemedir, entonces se dice que posee validez decontenido.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
19/23
Validez con relacin a criterio
Procedimientos en los cuales las calificaciones enla prueba de un grupo de personas se comparancon las puntuaciones, clasificaciones u otrasmedidas de desempeo.
Siempre que se dispone de una medida de criterio
en el momento de la prueba puede determinarsela validez concurrente del instrumento. Cuando lascalificaciones en el criterio no estn disponibles sinohasta cierto tiempo despus de que se aplic laprueba, se enfatiza la validez predictiva de la
prueba. Validez predictiva es del mayor inters en la
seleccin y ubicacin en un contexto ocupacionalo educativo.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
20/23
Validez de constructo
Grado en que el instrumento mide un constructoparticular, o concepto psicolgico .
El tipo ms general de validez, no se determina de
una sola manera o por una investigacin, mas bieninvolucra una red de investigaciones y otrosprocedimientos diseados para determinar si uninstrumento de evaluacin que supuestamentemide una determinada variable de personalidaden realidad lo hace.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
21/23
Evidencia a favor de la validezde constructo.
Los juicios de expertos en contenido. Anlisis de la consistencia interna. Estudios, tanto en grupos formados de manera
experimental como en grupos que se presentan demanera natural, de las relaciones entre las
puntuaciones de la prueba y otras variables en lascuales difieren los grupos.
Correlaciones de las puntuaciones en la prueba conlas puntuaciones en otras pruebas y variables con lascuales se espera que tengan cierta relacin, seguidaspor un anlisis factorial de esas correlaciones.
Interrogar con detalle a los examinados o a loscalificadores acerca de sus respuestas a una pruebao escala de calificacin para revelar los procesosmentales especficos implicados al dar respuesta a losreactivos.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
22/23
Validacin convergente y discriminante. Un
instrumento con validez de constructo debe tenercorrelaciones altas con otras medidas o mtodosde medicin del mismo constructo (validezconvergente), pero correlaciones bajas con lasmedidas de constructos diferentes (validez
discriminante)
Cuando las correlaciones entre el mismoconstructo medidas por el mismo y por diferentes
mtodos son significativamente mayores que lascorrelaciones entre diferentes constructosmedidas por los mismos o por diferentes mtodos.
-
7/25/2019 Clase 2_e_Confiabilidad y Validez
23/23
Bibliografa
AIKEN, Cap 1, Temas histricos y profesionales
AIKEN, Cap 2, Diseo y elaboracin de tests
AIKEN, Cap 4, Anlisis de reactivos y
estandarizacin de pruebas.
AIKEN, Cap 5, Confiablidad y Validez.