clase 2_e_confiabilidad y validez

Upload: jose-luis-cortes-araya

Post on 25-Feb-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    1/23

    Confiabilidady ValidezDocente: Ps. Jos Luis Corts

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    2/23

    CONFIABILIDAD Y VALIDEZ

    CONFIABILIDAD: para medir lo que fue diseadapara medir.

    Teora clsica de la confiabilidad

    La calificacin observada de una persona en unaprueba est compuesta por una puntuacinreal ms algn error no sistemtico de medicin.

    Puntuacin real de una persona = promedio delas puntuaciones de infinitas aplicaciones.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    3/23

    La varianza de las puntuaciones observadas(s2obs) de un grupo de personas es igual a la

    varianza de sus puntuaciones reales (s2rea) ms lavarianza debida a los errores no sistemticos demedicin (s2err):

    Entonces la confiabilidad (rn)= proporcin de lavarianza observada que es explicada por lavarianza real.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    4/23

    La confiabilidad de un conjunto decalificaciones en una prueba se expresa

    como un nmero decimal positivo queflucta entre .00 y 1.00. Una r de 1.00indica una confiabilidad perfecta, y una rde .00 indica una falta absoluta de

    confiabilidad de la medic.n

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    5/23

    Coeficiente test-retest: coeficiente deestabilidad.

    Coeficiente de formas paralelas.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    6/23

    Coeficientes de consistenciainterna

    Mitades de Spearman: Enfoquesimplificado de la consistencia interna

    una sola prueba se considera compuestapor dos partes (formas paralelas) quemiden la misma cosa.

    Kuder-Richardson: Una prueba puede

    dividirse de muchas formas diferentes endos mitades que contengan igualnmero de reactivos.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    7/23

    Alfa de Cronbach k es el nmero de reactivos,s2i la varianza de las

    calificaciones en el reactivo i, ys2t la varianza delas calificaciones totales de la prueba.

    Kuder-Richanison slo son aplicables cuando los

    reactivos de la prueba se califican con 0 o 1, pero elcoeficiente alfa es una frmula general para estimarla confiabilidad de una prueba que consta dereactivos en los cuales pueden asignarsecalificaciones de distinto peso a respuestas diferentes.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    8/23

    Confiabilidad entre

    calificadores Importante conocer el grado en que diferentes

    calificadores estn de acuerdo en lascalificaciones y otros valores numricos dados alas respuestas de diferentes examinados yreactivos.

    1. Los personas califican las respuestas de unnmero considerable de examinados y calcularluego la correlacin entre los dos conjuntos de

    calificaciones.2. muchas personas califiquen las respuestas de un

    examinado

    3. Muchas personas califiquen las respuestas devarios examinados.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    9/23

    Interpretacin de los

    coeficientes de confiabilidad Qu tan alto debe ser un coeficiente de confiabilidad

    para que una prueba u otro instrumento psicomtricosean tiles? La respuesta depende de lo que

    planeemos hacer con las puntuaciones de la prueba:

    1. Determinar si las calificaciones promedio de dosgrupos de personas son significativamente diferentes :.60 a .70

    2. Comparar la calificacin de una persona con la deotra, o la calificacin de una persona en una pruebacon su calificacin en otro instrumento: .85+ .

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    10/23

    agregar reactivos que miden algodiferente de lo que miden los reactivosoriginales puede dar lugar a unareduccin en la confiabilidad.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    11/23

    Variabilidad y extensin de la

    prueba.Coeficientes de confiabilidad tienden a ser ms

    altos cuando la varianza de las puntuaciones de laprueba, las puntuaciones del reactivo, las

    calificaciones u otras variables que son evaluadas,es grande que cuando es pequea.

    La varianza de la calificacin de la prueba serelaciona con la extensin de sta.

    Mayor extensin de la prueba =mayorconfiabilidad.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    12/23

    Frmula general de Spearman-Brown es unaexpresin del efecto que tiene sobre la

    confiabilidad el alargar una prueba incluyendoms reactivos del mismo tipo general.

    m es el factor por el cual se alarga la prueba

    rll la confiabilidad de la prueba original no alargada

    rmm la confiabilidad estimada de la pruebaalargada.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    13/23

    Aplicacin de SpearmanBrown.

    Puede utilizarse para determinar el incrementonecesario en la longitud de la prueba y, en

    consecuencia, el nmero de reactivos quedeben agregarse para incrementar laconfiabilidad de un valor desderll hasta rmm

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    14/23

    Varianza y confiabilidad.Adems de depender del nmero de reactivos, la

    varianza y la confiabilidad de una prueba sonafectadas por la heterogeneidad de la muestrade personas que la presentan.

    Entre mayor sea el rango de diferenciasindividuales en cierta caracterstica, mayor ser lavarianza de las calificaciones en una medida de

    esa caracterstica.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    15/23

    Error estndar de medicin

    S obs es la desviacin estndar de las calificacionesobservadas de la prueba

    rll el coeficiente de confiabilidad test-retest.

    Para ilustrar el clculo y el significado del error estndar demedicin, suponga que la desviacin estndar de una prueba es6.63 y el coeficiente de confiabilidad test-retest es .85; entoncesSerr = 6.631-.85 = 2.57. Si la calificacin de una persona en laprueba es 40, puede concluirse, con 68% de confianza, que formaparte de un grupo de personas que tienen calificacionesobservadas de 40 cuyas calificaciones reales en la prueba caenentre 37.43(40 - 2.57)y 42.57(40 + 2.57).

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    16/23

    Confiabilidad de las pruebas

    referidas a criterio Un grupo consta de personas cuyas puntuaciones

    igualan o exceden el nivel de criterio (dedominio) en la habilidad que se est evaluando;

    el otro grupo consta de personas cuyaspuntuaciones no alcanzan el nivel de criterio.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    17/23

    VALIDEZ

    El grado en que una prueba mide lo que estdiseada para medir.

    Metodos: (1) analizar el contenido de la prueba, (2)calcular la correlacin entre las calificaciones en la

    prueba y las calificaciones en el criterio de inters y(3) investigar las caractersticas psicolgicasparticulares o constructos medidos por la prueba.

    A diferencia de la confiabilidad, la cual es influidaslo por los errores no sistemticos de medicin, lavalidez de una prueba es afectada tanto por loserrores no sistemticos como por los sistemticos(constantes).

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    18/23

    Validez de contenido

    Atae a si la prueba produce un rango derespuestas que son representativas del dominioentero o universo de habilidades, entendimientosy otras conductas que supuestamente debemedir la prueba.

    A menudo en conexin con las pruebas deaprovechamiento, las cuales por lo general noexiste un criterio externo especificado.

    Si expertos en la materia coinciden en que una

    prueba parece y acta como un instrumentodiseado para medir lo que se supone debemedir, entonces se dice que posee validez decontenido.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    19/23

    Validez con relacin a criterio

    Procedimientos en los cuales las calificaciones enla prueba de un grupo de personas se comparancon las puntuaciones, clasificaciones u otrasmedidas de desempeo.

    Siempre que se dispone de una medida de criterio

    en el momento de la prueba puede determinarsela validez concurrente del instrumento. Cuando lascalificaciones en el criterio no estn disponibles sinohasta cierto tiempo despus de que se aplic laprueba, se enfatiza la validez predictiva de la

    prueba. Validez predictiva es del mayor inters en la

    seleccin y ubicacin en un contexto ocupacionalo educativo.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    20/23

    Validez de constructo

    Grado en que el instrumento mide un constructoparticular, o concepto psicolgico .

    El tipo ms general de validez, no se determina de

    una sola manera o por una investigacin, mas bieninvolucra una red de investigaciones y otrosprocedimientos diseados para determinar si uninstrumento de evaluacin que supuestamentemide una determinada variable de personalidaden realidad lo hace.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    21/23

    Evidencia a favor de la validezde constructo.

    Los juicios de expertos en contenido. Anlisis de la consistencia interna. Estudios, tanto en grupos formados de manera

    experimental como en grupos que se presentan demanera natural, de las relaciones entre las

    puntuaciones de la prueba y otras variables en lascuales difieren los grupos.

    Correlaciones de las puntuaciones en la prueba conlas puntuaciones en otras pruebas y variables con lascuales se espera que tengan cierta relacin, seguidaspor un anlisis factorial de esas correlaciones.

    Interrogar con detalle a los examinados o a loscalificadores acerca de sus respuestas a una pruebao escala de calificacin para revelar los procesosmentales especficos implicados al dar respuesta a losreactivos.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    22/23

    Validacin convergente y discriminante. Un

    instrumento con validez de constructo debe tenercorrelaciones altas con otras medidas o mtodosde medicin del mismo constructo (validezconvergente), pero correlaciones bajas con lasmedidas de constructos diferentes (validez

    discriminante)

    Cuando las correlaciones entre el mismoconstructo medidas por el mismo y por diferentes

    mtodos son significativamente mayores que lascorrelaciones entre diferentes constructosmedidas por los mismos o por diferentes mtodos.

  • 7/25/2019 Clase 2_e_Confiabilidad y Validez

    23/23

    Bibliografa

    AIKEN, Cap 1, Temas histricos y profesionales

    AIKEN, Cap 2, Diseo y elaboracin de tests

    AIKEN, Cap 4, Anlisis de reactivos y

    estandarizacin de pruebas.

    AIKEN, Cap 5, Confiablidad y Validez.