clase 2_a_temas históricos y profesionales

Upload: jose-luis-cortes-araya

Post on 25-Feb-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    1/77

    Temas histricosy profesionales.

    Docente: Ps. Jos Luis CortsAraya

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    2/77

    Antecedentes Histricos yProfesionales. Cualquiera que haya asistido a la escuela bsica o a la

    universidad, ingresado al servicio militar o bien solicitado

    algn empleo durante el ltimo medio siglo, sin duda ha

    completado una o ms pruebas. Hace casi 2,500 aos, Platn y Aristteles escribieron

    acerca de las diferencias individuales.

    Ao 2200 a. C., el entonces emperador chino instituy un

    sistema de exmenes en el servicio civil para determinar

    los funcionarios gubernamentales eran aptos para

    desempear sus labores.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    3/77

    Ilustracin y Renacimiento

    Un mundo ms progresista, menos doctrinario dondefue desarrollndose la idea de que las personas erannicas y tenan derecho a afirmar sus dones naturalesy a mejorar su posicin en la vida.

    El inters por el aprendizaje y la creatividad resurgi yfue fomentado, constituy tambin un renacimientodel individualismo.

    El espritu de la libertad y el valor individual, quefloreca gracias al estmulo poltico y econmico que

    proporcionaban el capitalismo y la democracia,encontr su expresin en el arte, la ciencia, la filosofay el gobierno.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    4/77

    S. XIX: La medicin mental

    cientficaA principios del siglo XIX, los cientficos solan

    considerar las diferencias en cuanto ahabilidades sensoriomotrices y mentales sobre

    todo como un fastidio o una fuente de error.

    Debido a que la bsqueda de leyes generalesen la naturaleza es difcil cuando lasmediciones de fenmenos naturales sonimprecisas y no confiables, los fsicos dirigieronsu atencin hacia la construccin deinstrumentos que fueran ms precisos yconsistentes que la sola observacin humana.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    5/77

    Charles Darwin y El origen de las especies.

    Al final del siglo XIX Gustav Fechner, Wilhelm Wundt,Hermann Ebbinghaus y otros psiclogos experimentalesdemostraron que los fenmenos psicolgicos podan serdescritos en trminos cuantitativos y racionales.

    Francis Galton, primo del naturalista Charles Darwin, fueun caballero ingls que se interes en las baseshereditarias de la inteligencia y en la medicin de lashabilidades humanas. Galton dedic su atencin enparticular a la herencia del talento, pero tambinelabor una serie de pruebas sensoriomotrices y disevarias tcnicas para investigar las diferencias

    individuales en cuanto a aptitudes y temperamento.Entre sus contribuciones metodolgicas figura latcnica de co-relaciones, que sigue siendo un mtodopopular para analizar calificaciones de pruebas.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    6/77

    S. XX: la estandarizacin y la

    Ciencia. Alfred Binet, construir la primera prueba

    mental que contribuy en forma

    significativa a la prediccin delaprovechamiento acadmico. Aportesignificativo concepto Edad Mental.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    7/77

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    8/77

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    9/77

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    10/77

    Clasificando tests Las pruebas se pueden clasificar segn su contenido, la forma en que se

    elaboraron, el parmetro para cuya medicin se disearon, el propsito

    de su aplicacin, e incluso de acuerdo con la manera en que se

    administran, califican e interpretan.

    Un criterio de clasificacin sencillo es la dicotoma entre pruebas

    estandarizadas contra no estandarizadas. Una prueba estandarizada,

    elaborada por profesionales especialistas en desarrollar pruebas y que es

    administrada a una muestra representativa de personas pertenecientes ala poblacin para la que se dise el instrumento, tiene procedimientos

    establecidos de administracin y calificacin(normas) que son constantes

    en los distintos examinandos. As, todos ellos tienen la misma oportunidad

    de responder los distintos reactivos de acuerdo con sus habilidades.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    11/77

    Otros criterios de clasificacin

    Individuales contra colectivas.

    Velocidad contra potencia.

    Pruebas objetivas contra no objetivas.

    Verbales o de Ejecucin.Cognoscitivas contra afectivas.

    Rendimiento(fluida) yaprovechamiento(cristal).

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    12/77

    Usos Comunes de los tests Clasificar, colocar, conservar, despedir, promover y/o

    rotar a las personas en contextos educativos y laborales.

    Asesorar y guiar a las personas con propsitos de asesora

    educativa, vocacional y personal. Diagnosticar y prescribir tratamientos psicolgicos y fsicos

    en clnicas y hospitales.

    Evaluar cambios cognoscitivos, intra o interpersonales

    relativos a programas educativos, psicoteraputicos y

    otros de intervencin en el comportamiento.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    13/77

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    14/77

    tica y uso de los testsQuien?, Como? A quien?para qu?

    La preparacin requerida para aplicar, evaluare interpretar pruebas vara en cierta medida de

    acuerdo con el tipo de prueba en particular. Preparacin mayor para:

    individuales que colectivas.

    Inteligencia y personalidad que en rendimiento

    y aptitudes especiales.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    15/77

    La evaluacin y el diagnstico deberan serrealizados slo en un contexto profesional y por

    parte de especialistas capacitados ycompetentes en las pruebas adecuadas.Tambin se pone nfasis en

    1. La aplicacin de procedimientos cientficospara disear y seleccionar pruebas y tcnicas

    que sean apropiadas para poblacionesespecficas.

    2. La interpretacin juiciosa de los resultados delas pruebas.

    3. El uso cuidadoso de las calificaciones de laspruebas y los servidos de interpretacin.4. Explicaciones claras pero cuidadosas de los

    hallazgos de la evaluacin.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    16/77

    Factores a considerarConsentimiento Informado escrito y

    firmado.

    Etiqueta menos estigmatizante.

    Resultados son informacin privilegiadaincluida en secreto profesional.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    17/77

    Diseo y Elaboracin de tests La cantidad de esfuerzo invertido en laelaboracin de un test psicolgico o educativo

    vara con el tipo de prueba y con los propsitospara los cuales se crea.

    Cualquiera que sea el tipo de prueba o las metasde los usuarios, se necesita cierto grado deplaneacin incluyendo definiciones claras de lasvariables o constructos que van a medirse,descripciones de las personas que van a ser

    examinadas, condiciones bajo las cuales seadministrar la prueba, e informacinconcerniente a la calificacin, interpretacin delas puntuaciones y uso que se dar a losresultados.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    18/77

    Proceso de elaboracin varia en cierto grado deacuerdo con el propsito que se pretendalograr.

    De manera ideal, la elaboracin de una pruebau otro instrumento psicomtrico empieza con ladefinicin de las variables o constructos que vana medirse y con el esbozo del contenidopropuesto.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    19/77

    Test de inteligencia: se rene un conjunto de

    reactivos que supuestamente miden algnaspecto del constructo inteligencia. Esosreactivos pueden ser elaborados de acuerdocon una teora especfica de la conducta

    inteligente o haciendo referencia slo a los tiposde tareas que la gente muy inteligente puederealizar de manera ms efectiva que las personasmenos inteligentes.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    20/77

    Inventarios y escalas depersonalidad Se han empleado varios enfoques,

    algunos basados en el sentido comn,

    otros en las teoras de personalidad yotros ms en procedimientos estadsticos.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    21/77

    Pruebas de rendimiento

    Se ha dedicado ms atencin a los procedimientosusados para elaborar pruebas de rendimientoacadmico que a los de otras clases de pruebas.

    Se aplican ms pruebas de rendimiento que todos

    los otros tipos de pruebas combinados. Pese a la actual cultura anti exmenes, debeconsiderrseles parte integral y formativa delproceso educativo: cuando se usan de maneraefectiva, los resultados de los exmenes no se limitana la sola evaluacin y motivacin de los estudiantes,

    si no que proporcionan informacin a los maestros, alpersonal administrativo y a los padres, concernientea la medida en que se han alcanzado los objetivoseducativos especficos.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    22/77

    Preguntas para las personasque planifican los instrumentos

    Cules son los temas y materiales sobre los que se

    examinar a los estudiantes?

    Qu tipos de preguntas deben elaborarse?

    Qu formatos o esquemas de reactivos y pruebas

    deben utilizarse?

    Cundo, dnde y cmo debe administrarse la prueba? Cmo debe calificarse y evaluarse la prueba resuelta?

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    23/77

    Taxonomas de objetivoscognoscitivos

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    24/77

    Taxonomas de objetivos

    cognoscitivos

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    25/77

    PREPARACIN DE LOS

    REACTIVOS DEL TEST Ciertos tipos de reactivos de prueba son ms apropiados

    que otros para medir la obtencin de objetivos especficos.

    Prepare alrededor de 20% ms de reactivos de los que enrealidad se necesiten .

    Tipos de Reactivos

    1. Completamiento o llenado contraseleccin.

    2. Recuerdo contrareconocimiento.

    3. Construccin de respuesta contra identificacin.

    4. Ensayo contra objetivo.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    26/77

    Reactivos de respuesta corta

    Reactivos de verdadero y falso

    Reactivos de aparejamiento

    Reactivos de opcin mltiple

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    27/77

    FORMACIN YREPRODUCCIN DE UN TEST Una vez que se han preparado los reactivos

    para una prueba, es aconsejable hacer que

    los revisen y editen personas conocedoras.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    28/77

    Tiempo!!: Lmites en los tests

    Un minuto = 1 reactivo de opcin mltiple o de respuesta

    corta.

    Un minuto = dos reactivos de verdadero y falso.

    Ocho minutos = 1 pregunta de ensayo que requiererespuesta de media pgina.

    La extensin de la prueba y los lmites de tiempo necesitarn

    ajustarse hacia abajo o hacia arriba cuando se examine a

    alumnos de escuela primaria o a estudiantes de universidad.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    29/77

    PRUEBAS DE DESEMPEO Tpicamente en Chile Evaluacin por

    competencias. Se le conoce tambien

    como evaluacin autntica o, paraenfatizar que son una opcin a laspruebas escritas, evaluacin alternativa.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    30/77

    ADMINISTRACION,

    APLICACION Y CALIFICACINDE LOS TESTS Sin importar qu tan cuidadosamente se

    elabore una prueba, los resultados no

    tienen ningn valor si no se administra ycalifica sta en forma adecuada.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    31/77

    El procedimiento que debe seguirse para aplicar una

    prueba o cualquier otro instrumento psicomtricodepende de:

    1. Tipo de instrumento (individual o colectiva, con tiempo

    predeterminado o sin ste, cognoscitiva o afectiva).2. Evaluado(edad cronolgica, la educacin, los

    antecedentes culturales y el estado fsico y mental y

    especialmente de la disposicin y motivacin.

    3. Evaluador(apariencia, comportamiento y

    conocimiento de la tcnica, entre otros)

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    32/77

    Deberes del examinadorantes de la prueba

    Programacin.

    Consentimiento informado.

    Familiarizarse con la prueba.

    Garantizar condiciones de evaluacin

    satisfactorias.

    Reducir los fraudes.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    33/77

    Deberes del examinadordurante la prueba

    Seguir las instrucciones de la prueba.

    Permanecer alerta . Establecer una relacin interpersonal.

    Prepararse para manejar problemas

    especiales. Flexibilidad,

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    34/77

    Deberes del examinadordespus de la prueba Tras la administracin de una prueba

    colectiva de grupo, el examinador tiene

    que recoger los materiales pertinentes.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    35/77

    Pruebas adaptativas

    En pruebas adaptativas o a la medida,

    los reactivos especficos aplicados a unapersona en particular dependen de sucapacidad calculada a partir de susrespuestas a reactivos previos. Debido aque las pruebas son ms precisas para

    medir la habilidad de las personas si ladificultad de los reactivos corresponde asu propio nivel de habilidad .

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    36/77

    CALIFICACIN DE LOS TESTS

    Cuando esta diseando el instrumento, el evaluador

    debe decidir si quiere obtener calificaciones separadas

    de las diversas partes, as como un resultado general de

    la prueba en su conjunto.

    Tambin debe decidirse si se restar una correccin por

    adivinar, si se asignarn distintos pesos a la calificacin

    de los diversos reactivos o secciones y si se entregarn

    los resultados en forma directa o convertidos a otrasescalas numricas.

    Para pruebas estandarizadas, el maestro de aula no

    necesita tomar todas estas decisiones.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    37/77

    Correccin por adivinacin.

    R es la cantidad de reactivos que el examinadoacierta.

    W la cantidad de reactivos en que el examinadose equivoca.

    k la cantidad de opciones por reactivo.

    S la calificacin corregida

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    38/77

    ANALISIS DE REACTIVOS YESTANDARIZACIN DEPRUEBAS

    Anlisis de reactivos se centra en el funcionamiento

    de reactivos individuales, mientras que laestandarizacin de pruebas se ocupa de lainterpretacin normativa de los resultados de laprueba en su conjunto o de algunas de las partes osubpruebas que la integran.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    39/77

    Se deben analizar las respuestas de esa muestra

    pilotopara determinar si los reactivos estnfuncionando de manera adecuada.Cualquiera que sea el tipo de prueba,

    estandarizada o elaborada por el maestro, de

    habilidad o de personalidad, un anlisispost mortemopost hocde los resultados es necesario.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    40/77

    Validez de reactivoA fin de evaluar la utilidad de un reactivo como

    medida de las diferencias individuales en cuantoa las caractersticas de habilidad o depersonalidad, se requiere un criterio externo de

    medida de dicho rasgo.

    La validez de un reactivo para predecir unaposicin con base en un criterio externo puede

    determinarse al correlacionar las calificacionesde un reactivo (0 para los errores y 1 para losaciertos) con las calificaciones de la medida decriterio.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    41/77

    Se han usado distintos tipos de coeficientes de

    correlacin para este propsito; el ms comnes el coeficiente biserial puntual,

    nt = la cantidad total de examinados.np = la cantidad de examinados que resuelven correctamente el

    reactivoYp = la media de las calificaciones de criterio de quienes pasan elreactivo,Y = la media de todas las calificaciones de criterio,

    s, = la desviacin estndar de todas las calificaciones de criterio.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    42/77

    Conclusin de peso en

    evaluacin.Mayor correlacin entre reactivo y criterio= mspreciso ser el reactivo como predictor delcriterio.

    Coef. de .20 o menores pueden contribuir a

    predecir el criterio, se prefieren coeficientes mselevados.No solo correlacin entre reactivo y criterio, sino

    tambin de la correlacin del reactivo con otrosreactivos de la prueba.

    Son mejores los reactivos que tienen correlacioneselevadas con el criterio, pero bajas con otrosreactivos, porque representan una contribucinms independiente a la prediccin decalificaciones de criterio.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    43/77

    No hay un criterio externo fcilmente disponiblecontra el cual validar los reactivos de las pruebasde aprovechamiento en el aula: entoncesusamos consistencia interna.

    El procedimiento ms breve consiste en dividir alos examinandos en tres grupos segn suscalificaciones en la prueba como un todo: ungrupo superior formado por el 27% que obtuvo lascalificaciones ms altas, un grupo inferior

    compuesto por el 27% que tuvo las calificacionesms bajas, y el restante 46% incluido en un grupointermedio, luego se realiza el siguiente clculo.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    44/77

    Up y Lp son la cantidad de individuos que hay en losgrupos superior e inferior, respectivamente, y queaciertan en el reactivo; U y L son el nmero total depersonas en los grupos superior e inferior (obsrveseque U = L), respectivamente. Al valor de p se leconoce como ndice de dificultad del reactivo y alde D como ndice de discriminacin del reactivo.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    45/77

    Slo porque la forma como se responde un reactivovara de grupo a grupo no quiere decir necesariamente

    que un reactivo est sesgado en contra de alguno delos grupos. Tcnicamente, un reactivo se considerasesgado slo cuando mide algo distintounacaracterstica o rasgo diferenteen un grupo conrespecto a otro.

    A pesar de sus desventajas, los ndices de dificultad y dediscriminacin de reactivos proporcionan informacintil sobre el funcionamiento de los reactivos individuales.

    En general, se ha descubierto que el anlisis de reactivosproduce mejoras considerables en la eficacia de laspruebas. En particular, el ndice de discriminacin dereactivos es una medida bastante adecuada de lacalidad del reactivo.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    46/77

    ESTANDARIZACIN Y NORMAS

    DE LAS PRUEBAS. Los datos sobre el desempeo de un grupo numerosode individuos, como aquellos en quienes se basa eldiseo de un instrumento, son tiles para propsitos deinterpretacin de calificaciones.

    La estandarizacin tambin incluye aplicar la prueba auna muestra grande de personas (la muestra deestandarizacin) aleccionada como representante dela poblacin meta a la que est destinada la prueba.

    Toda prueba estandarizada tiene instruccionesestndar de aplicacin y calificacin que debenseguirse estrictamente, sin dejar lugar a lainterpretacin personal o al sesgo.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    47/77

    El principal propsito de estandarizar una pruebaes determinar la distribucin de puntuacioneseradas en la muestra de estandarizacin (gruponorma). Las calificaciones crudas obtenidas setransforman entonces en alguna forma decalificaciones derivadas o normas.

    Los principales tipos de normas son equivalentesde edad, de grado, rangos de percentilares ycalificaciones estndar.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    48/77

    Este mtodo de interpretacin con referencias a

    normas, las normas obtenidas no funcionan comoestndares del desempeo deseado, sinosimplemente como un marco de referencia parainterpretar calificaciones.

    Normas indican la posicin de una persona en laprueba con respecto a la distribucin de lascalificaciones obtenidas por personas de la mismaedad cronolgica, grado, sexo u otrascaractersticas demogrficas.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    49/77

    Seleccin de una muestra de

    estandarizacin Muestreo aleatorio sencillo, cada uno de los miembros

    de la poblacin meta tiene la misma oportunidad deser seleccionado, pero aleatoriedad no garantiza quehaya representatividad.

    Muestreo aleatorio estratificado, se reduce laprobabilidad de elegir una muestra atpica o sesgada,categorizar, o estratificar, la poblacin de una serie devariables demogrficas (sexo, edad, nivel

    socioeconmico, regin geogrfica y similares) quepresumiblemente estn relacionadas con lascalificaciones de la prueba. Entonces la cantidad deindividuos seleccionados al azar de cada categora oestrato es proporcional al nmero total de personas dela poblacin que caen en ese estrato.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    50/77

    El muestreo por grupos: dividir una regingeogrfica designada o alguna otra

    entidad relevante en bloques o gruposluego elige al azar un porcentajeespecificado de los grupos y dentro decada uno se selecciona aleatoriamente

    una cantidad determinada desubunidades (escuelas, residencias, etc.).

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    51/77

    Normas de calificacinestndar A diferencia de los rangos percentilares,

    las calificaciones estndar representan la

    medicin en una escala de intervalos.

    Las normas de calificacin estndar sonpuntuaciones convertidas que tienen

    cualesquier media y desviacin estndardeseadas.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    52/77

    Calificacionesz

    X es una puntuacin cruda dada,X es la media

    aritmtica, ys es la desviacin estndar de laspuntuaciones crudas.

    Transformar puntuaciones crudas en calificacioneszproduce una distribucin de calificaciones con lamisma forma, pero con una media y desviacin

    estndar distintas a la distribucin de la puntuacincruda (X).

    Media de las calificacionesz es 0, y la desviacinestndar es 1.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    53/77

    Calificaciones Wechsler.

    Las puntuaciones crudas en las subpruebas de las

    escalas de inteligencia de Wechsler se transformaron

    para tener una media de 10 y desviacin estndar de3. No obstante, las puntuaciones verbales, de

    ejecucin y de escala total (CIs de desviacin) en las

    pruebas de Wechsler se convirtieron a una distribucin

    con una media de 100 y desviacin estndar de 15

    (vea las ltimas dos lneas de la figura 4.3).

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    54/77

    Otra escala de calificacin es la calificacinestanina (nueve estndar).

    En esta escala estndar normalizada, que tieneuna media de 5 y desviacin estndar deaproximadamente 2, hay nueve rangos distintos, oestaninas.

    Calificacin estanina no es una verdadera escalade calificaciones estndar, porque la primera y lanovena estanina estn abiertas.

    Equilibrar la tendencia a considerar las

    calificaciones de pruebas como medidas precisas,invariables, de las diferencias individuales.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    55/77

    Otro procedimiento que tiene el mismo efectoes registrar no slo el rango percentilar o la

    calificacin estndar correspondiente a unapuntuacin cruda dada, sino tambin un rangopercentilar o un intervalo de calificacinestndar dentro de los cuales pueda esperarse

    razonablemente que caiga la verdaderaposicin.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    56/77

    CONFIABILIDAD Y VALIDEZ

    CONFIABILIDAD: para medir lo que fue diseadapara medir.

    Teora clsica de la confiabilidad La calificacin observada de una persona en una

    prueba est compuesta por una puntuacinreal ms algn error no sistemtico de medicin.

    Puntuacin real de una persona = promedio delas puntuaciones de infinitas aplicaciones.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    57/77

    La varianza de las puntuaciones observadas(s2obs) de un grupo de personas es igual a la

    varianza de sus puntuaciones reales (s2rea) ms lavarianza debida a los errores no sistemticos demedicin (s2err):

    Entonces la confiabilidad (rn)= proporcin de lavarianza observada que es explicada por lavarianza real.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    58/77

    La confiabilidad de un conjunto decalificaciones en una prueba se expresa

    como un nmero decimal positivo queflucta entre .00 y 1.00. Una r de 1.00indica una confiabilidad perfecta, y una rde .00 indica una falta absoluta deconfiabilidad de la medic.n

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    59/77

    Coeficiente test-retest: coeficiente deestabilidad.

    Coeficiente de formas paralelas.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    60/77

    Coeficientes de consistencia

    internaMitades de Spearman: Enfoque

    simplificado de la consistencia interna

    una sola prueba se considera compuestapor dos partes (formas paralelas) quemiden la misma cosa.

    Kuder-Richardson: Una prueba puede

    dividirse de muchas formas diferentes endos mitades que contengan igualnmero de reactivos.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    61/77

    Alfa de Cronbach k es el nmero de reactivos,s2i la varianza de las

    calificaciones en el reactivo i, ys2t la varianza delas calificaciones totales de la prueba.

    Kuder-Richanison slo son aplicables cuando los

    reactivos de la prueba se califican con 0 o 1, pero elcoeficiente alfa es una frmula general para estimarla confiabilidad de una prueba que consta dereactivos en los cuales pueden asignarsecalificaciones de distinto peso a respuestas diferentes.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    62/77

    Confiabilidad entrecalificadores

    Importante conocer el grado en que diferentescalificadores estn de acuerdo en lascalificaciones y otros valores numricos dados alas respuestas de diferentes examinados y

    reactivos.1. Los personas califican las respuestas de un

    nmero considerable de examinados y calcularluego la correlacin entre los dos conjuntos decalificaciones.

    2. muchas personas califiquen las respuestas de unexaminado

    3. Muchas personas califiquen las respuestas devarios examinados.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    63/77

    Interpretacin de los

    coeficientes de confiabilidad Qu tan alto debe ser un coeficiente de confiabilidadpara que una prueba u otro instrumento psicomtricosean tiles? La respuesta depende de lo queplaneemos hacer con las puntuaciones de la prueba:

    1. Determinar si las calificaciones promedio de dosgrupos de personas son significativamente diferentes :.60 a .70

    2. Comparar la calificacin de una persona con la deotra, o la calificacin de una persona en una pruebacon su calificacin en otro instrumento: .85+ .

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    64/77

    agregar reactivos que miden algo

    diferente de lo que miden los reactivosoriginales puede dar lugar a unareduccin en la confiabilidad.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    65/77

    Variabilidad y extensin de la

    prueba.Coeficientes de confiabilidad tienden a ser ms

    altos cuando la varianza de las puntuaciones de laprueba, las puntuaciones del reactivo, las

    calificaciones u otras variables que son evaluadas,es grande que cuando es pequea.

    La varianza de la calificacin de la prueba serelaciona con la extensin de sta.

    Mayor extensin de la prueba =mayorconfiabilidad.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    66/77

    Frmula general de Spearman-Brown es unaexpresin del efecto que tiene sobre la

    confiabilidad el alargar una prueba incluyendoms reactivos del mismo tipo general.

    m es el factor por el cual se alarga la prueba

    rll la confiabilidad de la prueba original no alargada

    rmm la confiabilidad estimada de la pruebaalargada.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    67/77

    Aplicacin de Spearman

    Brown. Puede utilizarse para determinar el incremento

    necesario en la longitud de la prueba y, en

    consecuencia, el nmero de reactivos quedeben agregarse para incrementar laconfiabilidad de un valor desderll hasta rmm

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    68/77

    Varianza y confiabilidad.Adems de depender del nmero de reactivos, la

    varianza y la confiabilidad de una prueba sonafectadas por la heterogeneidad de la muestrade personas que la presentan.

    Entre mayor sea el rango de diferenciasindividuales en cierta caracterstica, mayor ser lavarianza de las calificaciones en una medida de

    esa caracterstica.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    69/77

    Error estndar de medicin

    S obs es la desviacin estndar de las calificacionesobservadas de la prueba

    rll el coeficiente de confiabilidad test-retest.

    Para ilustrar el clculo y el significado del error estndar demedicin, suponga que la desviacin estndar de una prueba es6.63 y el coeficiente de confiabilidad test-retest es .85; entonces

    Serr = 6.631-.85 = 2.57. Si la calificacin de una persona en laprueba es 40, puede concluirse, con 68% de confianza, que formaparte de un grupo de personas que tienen calificacionesobservadas de 40 cuyas calificaciones reales en la prueba caenentre 37.43(40 - 2.57)y 42.57(40 + 2.57).

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    70/77

    Confiabilidad de las pruebas

    referidas a criterio Un grupo consta de personas cuyas puntuacionesigualan o exceden el nivel de criterio (dedominio) en la habilidad que se est evaluando;

    el otro grupo consta de personas cuyaspuntuaciones no alcanzan el nivel de criterio.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    71/77

    VALIDEZ

    El grado en que una prueba mide lo que estdiseada para medir.

    Metodos: (1) analizar el contenido de la prueba, (2)calcular la correlacin entre las calificaciones en laprueba y las calificaciones en el criterio de inters y(3) investigar las caractersticas psicolgicasparticulares o constructos medidos por la prueba.

    A diferencia de la confiabilidad, la cual es influidaslo por los errores no sistemticos de medicin, la

    validez de una prueba es afectada tanto por loserrores no sistemticos como por los sistemticos(constantes).

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    72/77

    Validez de contenidoAtae a si la prueba produce un rango de

    respuestas que son representativas del dominioentero o universo de habilidades, entendimientosy otras conductas que supuestamente debemedir la prueba.

    A menudo en conexin con las pruebas deaprovechamiento, las cuales por lo general noexiste un criterio externo especificado.

    Si expertos en la materia coinciden en que una

    prueba parece y acta como un instrumentodiseado para medir lo que se supone debemedir, entonces se dice que posee validez decontenido.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    73/77

    Validez con relacin a criterio Procedimientos en los cuales las calificaciones en

    la prueba de un grupo de personas se comparancon las puntuaciones, clasificaciones u otrasmedidas de desempeo.

    Siempre que se dispone de una medida de criterio

    en el momento de la prueba puede determinarsela validez concurrente del instrumento. Cuando lascalificaciones en el criterio no estn disponibles sinohasta cierto tiempo despus de que se aplic laprueba, se enfatiza la validez predictiva de la

    prueba. Validez predictiva es del mayor inters en la

    seleccin y ubicacin en un contexto ocupacionalo educativo.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    74/77

    Validez de constructo

    Grado en que el instrumento mide un constructoparticular, o concepto psicolgico .

    El tipo ms general de validez, no se determina de

    una sola manera o por una investigacin, mas bieninvolucra una red de investigaciones y otrosprocedimientos diseados para determinar si uninstrumento de evaluacin que supuestamentemide una determinada variable de personalidad

    en realidad lo hace.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    75/77

    Evidencia a favor de la validezde constructo.

    Los juicios de expertos en contenido. Anlisis de la consistencia interna. Estudios, tanto en grupos formados de manera

    experimental como en grupos que se presentan demanera natural, de las relaciones entre las

    puntuaciones de la prueba y otras variables en lascuales difieren los grupos. Correlaciones de las puntuaciones en la prueba con

    las puntuaciones en otras pruebas y variables con lascuales se espera que tengan cierta relacin, seguidaspor un anlisis factorial de esas correlaciones.

    Interrogar con detalle a los examinados o a loscalificadores acerca de sus respuestas a una pruebao escala de calificacin para revelar los procesosmentales especficos implicados al dar respuesta a losreactivos.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    76/77

    Validacin convergente y discriminante. Uninstrumento con validez de constructo debe tenercorrelaciones altas con otras medidas o mtodosde medicin del mismo constructo (validezconvergente), pero correlaciones bajas con lasmedidas de constructos diferentes (validez

    discriminante)

    Cuando las correlaciones entre el mismoconstructo medidas por el mismo y por diferentes

    mtodos son significativamente mayores que lascorrelaciones entre diferentes constructosmedidas por los mismos o por diferentes mtodos.

  • 7/25/2019 Clase 2_a_Temas Histricos y Profesionales

    77/77

    AIKEN, Cap 1, Temas histricos y profesionales

    AIKEN, Cap 2, Diseo y elaboracin de tests

    AIKEN, Cap 4, Anlisis de reactivos y

    estandarizacin de pruebas.

    AIKEN, Cap 5, Confiablidad y Validez.

    Bibliografa