clase 2_e_confiabilidad y validez

7/25/2019 Clase 2_e_Confiabilidad y Validez

1/23

Confiabilidady ValidezDocente: Ps. Jos Luis Corts


2/23

CONFIABILIDAD Y VALIDEZ

CONFIABILIDAD: para medir lo que fue diseadapara medir.

Teora clsica de la confiabilidad

La calificacin observada de una persona en unaprueba est compuesta por una puntuacinreal ms algn error no sistemtico de medicin.

Puntuacin real de una persona = promedio delas puntuaciones de infinitas aplicaciones.


3/23

La varianza de las puntuaciones observadas(s2obs) de un grupo de personas es igual a la

varianza de sus puntuaciones reales (s2rea) ms lavarianza debida a los errores no sistemticos demedicin (s2err):

Entonces la confiabilidad (rn)= proporcin de lavarianza observada que es explicada por lavarianza real.


4/23

La confiabilidad de un conjunto decalificaciones en una prueba se expresa

como un nmero decimal positivo queflucta entre .00 y 1.00. Una r de 1.00indica una confiabilidad perfecta, y una rde .00 indica una falta absoluta de

confiabilidad de la medic.n


5/23

Coeficiente test-retest: coeficiente deestabilidad.

Coeficiente de formas paralelas.


6/23

Coeficientes de consistenciainterna

Mitades de Spearman: Enfoquesimplificado de la consistencia interna

una sola prueba se considera compuestapor dos partes (formas paralelas) quemiden la misma cosa.

Kuder-Richardson: Una prueba puede

dividirse de muchas formas diferentes endos mitades que contengan igualnmero de reactivos.


7/23

Alfa de Cronbach k es el nmero de reactivos,s2i la varianza de las

calificaciones en el reactivo i, ys2t la varianza delas calificaciones totales de la prueba.

Kuder-Richanison slo son aplicables cuando los

reactivos de la prueba se califican con 0 o 1, pero elcoeficiente alfa es una frmula general para estimarla confiabilidad de una prueba que consta dereactivos en los cuales pueden asignarsecalificaciones de distinto peso a respuestas diferentes.


8/23

Confiabilidad entre

calificadores Importante conocer el grado en que diferentes

calificadores estn de acuerdo en lascalificaciones y otros valores numricos dados alas respuestas de diferentes examinados yreactivos.

1. Los personas califican las respuestas de unnmero considerable de examinados y calcularluego la correlacin entre los dos conjuntos de

calificaciones.2. muchas personas califiquen las respuestas de un

examinado

3. Muchas personas califiquen las respuestas devarios examinados.


9/23

Interpretacin de los

coeficientes de confiabilidad Qu tan alto debe ser un coeficiente de confiabilidad

para que una prueba u otro instrumento psicomtricosean tiles? La respuesta depende de lo que

planeemos hacer con las puntuaciones de la prueba:

1. Determinar si las calificaciones promedio de dosgrupos de personas son significativamente diferentes :.60 a .70

2. Comparar la calificacin de una persona con la deotra, o la calificacin de una persona en una pruebacon su calificacin en otro instrumento: .85+ .


10/23

agregar reactivos que miden algodiferente de lo que miden los reactivosoriginales puede dar lugar a unareduccin en la confiabilidad.


11/23

Variabilidad y extensin de la

prueba.Coeficientes de confiabilidad tienden a ser ms

altos cuando la varianza de las puntuaciones de laprueba, las puntuaciones del reactivo, las

calificaciones u otras variables que son evaluadas,es grande que cuando es pequea.

La varianza de la calificacin de la prueba serelaciona con la extensin de sta.

Mayor extensin de la prueba =mayorconfiabilidad.


12/23

Frmula general de Spearman-Brown es unaexpresin del efecto que tiene sobre la

confiabilidad el alargar una prueba incluyendoms reactivos del mismo tipo general.

m es el factor por el cual se alarga la prueba

rll la confiabilidad de la prueba original no alargada

rmm la confiabilidad estimada de la pruebaalargada.


13/23

Aplicacin de SpearmanBrown.

Puede utilizarse para determinar el incrementonecesario en la longitud de la prueba y, en

consecuencia, el nmero de reactivos quedeben agregarse para incrementar laconfiabilidad de un valor desderll hasta rmm


14/23

Varianza y confiabilidad.Adems de depender del nmero de reactivos, la

varianza y la confiabilidad de una prueba sonafectadas por la heterogeneidad de la muestrade personas que la presentan.

Entre mayor sea el rango de diferenciasindividuales en cierta caracterstica, mayor ser lavarianza de las calificaciones en una medida de

esa caracterstica.


15/23

Error estndar de medicin

S obs es la desviacin estndar de las calificacionesobservadas de la prueba

rll el coeficiente de confiabilidad test-retest.

Para ilustrar el clculo y el significado del error estndar demedicin, suponga que la desviacin estndar de una prueba es6.63 y el coeficiente de confiabilidad test-retest es .85; entoncesSerr = 6.631-.85 = 2.57. Si la calificacin de una persona en laprueba es 40, puede concluirse, con 68% de confianza, que formaparte de un grupo de personas que tienen calificacionesobservadas de 40 cuyas calificaciones reales en la prueba caenentre 37.43(40 - 2.57)y 42.57(40 + 2.57).


16/23

Confiabilidad de las pruebas

referidas a criterio Un grupo consta de personas cuyas puntuaciones

igualan o exceden el nivel de criterio (dedominio) en la habilidad que se est evaluando;

el otro grupo consta de personas cuyaspuntuaciones no alcanzan el nivel de criterio.


17/23

VALIDEZ

El grado en que una prueba mide lo que estdiseada para medir.

Metodos: (1) analizar el contenido de la prueba, (2)calcular la correlacin entre las calificaciones en la

prueba y las calificaciones en el criterio de inters y(3) investigar las caractersticas psicolgicasparticulares o constructos medidos por la prueba.

A diferencia de la confiabilidad, la cual es influidaslo por los errores no sistemticos de medicin, lavalidez de una prueba es afectada tanto por loserrores no sistemticos como por los sistemticos(constantes).


18/23

Validez de contenido

Atae a si la prueba produce un rango derespuestas que son representativas del dominioentero o universo de habilidades, entendimientosy otras conductas que supuestamente debemedir la prueba.

A menudo en conexin con las pruebas deaprovechamiento, las cuales por lo general noexiste un criterio externo especificado.

Si expertos en la materia coinciden en que una

prueba parece y acta como un instrumentodiseado para medir lo que se supone debemedir, entonces se dice que posee validez decontenido.


19/23

Validez con relacin a criterio

Procedimientos en los cuales las calificaciones enla prueba de un grupo de personas se comparancon las puntuaciones, clasificaciones u otrasmedidas de desempeo.

Siempre que se dispone de una medida de criterio

en el momento de la prueba puede determinarsela validez concurrente del instrumento. Cuando lascalificaciones en el criterio no estn disponibles sinohasta cierto tiempo despus de que se aplic laprueba, se enfatiza la validez predictiva de la

prueba. Validez predictiva es del mayor inters en la

seleccin y ubicacin en un contexto ocupacionalo educativo.


20/23

Validez de constructo

Grado en que el instrumento mide un constructoparticular, o concepto psicolgico .

El tipo ms general de validez, no se determina de

una sola manera o por una investigacin, mas bieninvolucra una red de investigaciones y otrosprocedimientos diseados para determinar si uninstrumento de evaluacin que supuestamentemide una determinada variable de personalidaden realidad lo hace.


21/23

Evidencia a favor de la validezde constructo.

Los juicios de expertos en contenido. Anlisis de la consistencia interna. Estudios, tanto en grupos formados de manera

experimental como en grupos que se presentan demanera natural, de las relaciones entre las

puntuaciones de la prueba y otras variables en lascuales difieren los grupos.

Correlaciones de las puntuaciones en la prueba conlas puntuaciones en otras pruebas y variables con lascuales se espera que tengan cierta relacin, seguidaspor un anlisis factorial de esas correlaciones.

Interrogar con detalle a los examinados o a loscalificadores acerca de sus respuestas a una pruebao escala de calificacin para revelar los procesosmentales especficos implicados al dar respuesta a losreactivos.


22/23

Validacin convergente y discriminante. Un

instrumento con validez de constructo debe tenercorrelaciones altas con otras medidas o mtodosde medicin del mismo constructo (validezconvergente), pero correlaciones bajas con lasmedidas de constructos diferentes (validez

discriminante)

Cuando las correlaciones entre el mismoconstructo medidas por el mismo y por diferentes

mtodos son significativamente mayores que lascorrelaciones entre diferentes constructosmedidas por los mismos o por diferentes mtodos.


23/23

Bibliografa

AIKEN, Cap 1, Temas histricos y profesionales

AIKEN, Cap 2, Diseo y elaboracin de tests

AIKEN, Cap 4, Anlisis de reactivos y

estandarizacin de pruebas.

AIKEN, Cap 5, Confiablidad y Validez.

clase 2_e_confiabilidad y validez

Documents