psicome1

PSICOMETRA

PSICOMETRACarlos Camacho M. Vara de Rey

E. Francisco Snchez GarcaM. Snchez Garca

INDICE

0.- Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.- La medicin psicolgica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1.1.- Definicin y objeto de estudio de la Psicometra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.2.- Introduccin a la Teora de la Medida. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.3.- El error de medida. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3.1.- Tipos de errores de medida y sus consecuencias . . . . . . . . . . . . . . . . . . . . . . . . . 111.3.2.- La estimacin del error aleatorio en la validacin de teoras . . . . . . . . . . . . . . . . 13

1.3.- Conceptos de fiabilidad y validez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.- La Teora Clsica de los Tests y su extensin Congenrica . . . . . . . . . . . . . . . . . . . . . . . . . . .2.1.- Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2.2.- Fundamentos de la Teora Clsica de los Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2.3.- Definicin de Coeficiente de Fiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2.4.- Modelo de medida en Puntuaciones Directas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2.5.- Modelos de medida en Puntuaciones Estandarizadas . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.- Fiabilidad.- . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3.1.- Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3.2.- Procedimientos basados en dos aplicaciones del test . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.2.1.- Test-retest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3.2.2.- Formas paralelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.3.- Procedimientos basados en una nica aplicacin del test . . . . . . . . . . . . . . . . . . . . . . . . .3.3.1.- Dos mitades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.3.1.1.- Frmula de Rulon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3.3.1.1.- Frmula de Flanagan y Guttman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.3.4.- Coeficiente Alpha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3.3.4.1.- Alpha con elementos dicotmicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.4.- Fiabilidad desde la perspectiva del anlisis de la varianza . . . . . . . . . . . . . . . . . . . . . . . .3.5.- Coeficientes de Consistencia interna basados en resultados de Anlisis Factorial. . . . . .

3.5.1.- Coeficiente Theta de Carmines y Zeller (1979) . . . . . . . . . . . . . . . . . . . . . . . . .3.5.2.- Coeficiente Omega de Heise y Bahrnstedt (1970) . . . . . . . . . . . . . . . . . . . . . .

3.6.- Fiabilidad de un test compuesto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3.7.- Factores que afectan al coeficiente de fiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.7.1.- Fiabilidad y variabilidad de la muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3.7.2.- Fiabilidad y longitud del test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3.7.3.- Fiabilidad y limitacin del tiempo de aplicacin del test . . . . . . . . . . . . . . . . . . . . .3.7.4.- Fiabilidad y caractersticas del tem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.8.- Valoracin de los distintos coeficientes de fiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.- Validez. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.1.- Introduccin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.2.- Validez referida al criterio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.2.1.- Validez y fiabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.2.2.- Validez y longitud. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.2.3.- Validez y variabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.3.3.- Validez de contenido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.3.1.- Evaluacin de la validez de contenido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.4.- Validez de constructo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.4.1.- Evaluacin de la validez de constructo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.4.1.1.- Anlisis factorial exploratorio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.4.1.2.- Modelos estructurales como validez de constructo. . . . . . . . . . . . . . . . . . . . . .4.4.1.3.- Matriz multirrasgo-multimtodo (MMRMM). . . . . . . . . . . . . . . . . . . . . . . . . .4.4.1.4.- MMRMM analizadas con modelos estructurales. . . . . . . . . . . . . . . . . . . . . . . .

4.5.- Prcticas de validez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.5.1.- Validez referida al criterio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.5.1.1.- Prediccin del criterio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.5.1.2.- Validez y Fiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.5.1.3.- Validez y longitud del test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.5.1.4.- Validez y variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.5.2.- Validez de constructo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.5.2.1.- Anlisis factorial exploratorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.5.2.2.- Anlisis factorial confirmatorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.5.2.3.- Modelos de estructuras de covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.5.2.4.- Evidencias de validez convergente y discriminante . . . . . . . . . . . . . . . . . . . . .

4.5.2.4.1.- Matrices MRMM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4.5.2.4.2.- Validez Conv. y Disc. a travs de modelos de estructuras de covar . . . . .

4.5.3.- Otros ficheros para prcticas de depuracin de tems, fiabilidad y validez . . . . . . .4.5.3.1.- Listado de ficheros de prcticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5.- Procedimiento general de construccin de una prueba o test . . . . . . . . . . . . . . . . . . . . . . . . . .5.1.- Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5.2.- Identificacin del Objetivo para el que se utilizarn las puntuaciones . . . . . . . . . . . . . . .5.3.- Definicin del constructo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5.4.- Descripcin general de los componentes del constructo . . . . . . . . . . . . . . . . . . . . . . . . . .5.5.- Diseo del test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5.5.1.- Nmero de tems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5.5.2.- Tipo de tems y nmero de alternativas de respuesta . . . . . . . . . . . . . . . . . . . . . . . .5.5.3.- Cmo cuantificar las alternativas de respuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5.6.- Redaccin de los tems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5.7.- Anlisis de la calidad de los tems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5.7.1.- Juicio de expertos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5.7.2.- Anlisis estadstico de los tems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.7.2.1.- ndices descriptivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.7.2.2.- ndice de discriminacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.7.2.3.- ndices mixtos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.7.2.4.- A modo de conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5.8.- Estandarizacin y Baremacin del test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5.8.1.- Baremos referidos a la Norma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5.9.- Prcticas de depuracin de tems y fiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

APNDICE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Frmula 1.5. El error de medida en el modelo de regresin y sus consecuencias . . . . . . . . . . .

Frmula 4.13 Coeficiente Alpha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Apartado 2.6. Redaccin de los tems: Consideraciones prcticas para la construccin

de tems. Taxonomas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .A) Taxonoma de Bloom. Su instrumentacin para definir objetivo . . . . . . . . . . . . .instruccionales o evaluables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .B) Instrumentos de evaluacin para las habilidades claves. . . . . . . . . . . . . . . . . . . .

REFERENCIAS BIBLIOGRFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

0.- INTRODUCCIN

Estos apuntes han sido previstos en el programa de la asignatura de Psicometra (curso 2006-2007) como una ayuda o gua para los alumnos que cursan los estudios de Psicologa de laUniversidad de Sevilla.

Cuando se aborda el tema de la docencia en reuniones o congresos del rea de metodologa losautores se pronuncian como partidarios de una docencia muy prctica, conceptual e intuitiva; quehaga uso de los avances matemticos, estadsticos e informticos, pero sin demostraciones nijustificaciones sobre los mismos.

En este sentido: Al igual que antiguamente el conductor de un coche deba saber revisar y reponerlos distintos niveles del vehculo, cambiarle la polea al ventilador, cambiar una rueda, etc. y hoy dalos coches vienen preparados para que ninguna de estas cosas haya que hacerlas tan frecuente ni taninexcusablemente; en la misma linea presentaremos una asignatura de Psicometra eminentementeprctica y en la que slo se desarrollarn los fundamentos matemticos en aquellos casos que losconsideremos necesarios para la comprensin del tema. As lo que antes costaba ms trabajo altenerlo que hacer con calculadora, papel y lpiz; actualmente, con los avances de la informtica, elordenador lo hace en el mnimo tiempo y sin ningn esfuerzo. As pues con la ayuda de lainformtica quizs no sean tan engorrosas las aplicaciones psicomtricas, ni haya que basar ladocencia en frmulas y clculos que, por otra parte, el alumno nunca va a tener que realizar a mano.

Para solucionar algunos problemas didcticos surgidos del seguimiento de una secuenciacinbasada en el proceso cronolgico de construccin de un test este curso seguiremos una secuenciacinms clsica y habitual en otras facultades de Psicologa: Despus de un tema 0" de tipointroductorio en el que se presenta el programa, el plan didctico, la definicin y los contenidos dela disciplina, pasamos a un tema 1" que planteo el problema de la medicin en las ciencias humanasy sociales y en Psicologa en particular, un tema 2 el que se presentan de forma sucinta lospostulados fundamentales de la Teora Clsica de los Tests ( en adelante TCT), un 3 en el que sedesarrollan los dintos procedimientos tanto de recogida de datos como de clculo para contrastar lacualidad fiabilidad de los tests, un tema 4 en el que se aborda la difcil contrastacin de la validezde los tests, y, para terminar, la aplicacin de todo lo anterior al proceso de construccin de un testcomo la mejor estrategia para que las puntuaciones globales con l obtenidas sean tiles paranuestros objetivos.

1 As, como se puede apreciar en la figura 1.1 existe comunicacin en ambos sentidos entreaplicaciones psicomtricas y usos psicomtricos.

1.- LA MEDICIN PSICOLGICA

Figura 1.1.- Medida de la psique.

Figura 1.1. Relacin de la Psicometra con otros contenidos de la titulacin de Psicologa. (Adaptado de Meli, 1990. p. 19)

1.1.- Definicin y Objeto de estudio de la Psicometra

Como su propio trmino indica (definicin etimolgica) Psicometra es la disciplina quedesarrolla todos los aspectos relacionados con la medida (metra) de la psique (psico).

Como los atributos psicolgicos no son abordables deforma directa para medirlos, podemos decir que laPsicometra tiene como objeto material la medida de lapsique a travs de los comportamientos psicolgicos externosde sujetos o grupos sociales (ver fig. 1.1.). Por lo tanto, elobjeto material de la medicin psicolgica yconsecuentemente de la psicometra es tan amplio y variadocomo lo son la gran variedad de atributos de psicolgicos y decomportamientos que de ellos se deriven.

Pero la Psicometra no slo se encarga de solucionar elproblema de la medicin de atributos psicolgicos yaintegrados en teoras desarrolladas en otros campos de lapsicologa, sino que, a veces, informa a la psicologa dedeterminadas estructuras perceptivas, aptitudinales o depersonalidad 1(ver fig. 1.1).

De lo afirmado en el prrafo anterior no se desprende que la Psicometra est desprovista de unobjeto de estudio que le sea especfico dentro de la Psicologa. Al igual que ocurre con las disciplinas

8 La Medicin Psicolgica

mtricas de otras titulaciones (como Fsica, Qumica, Biologa, Astronoma, Medicina, Sociologao Pedagoga) la Psico-metra queda delimitada y diferenciada del resto de disciplinas psicolgicaspor su objeto formal: la elaboracin de teoras y la implantacin de metodologas para la medicinen Psicologa (ver fig. 1.1). As pues lo que delimite el objeto de estudio especfico de la Psicometrano es el atributo que se mide en cada caso (objeto material) ni el resultado de la medida (usopsicomtrico) sino la fundamentacin terica que justifica el uso de determinadas metodologaspara medir en los distintos contextos psicolgicos que se presenten, esto es el objeto formal de lapsicometra.

Dentro la especialidad de Psicologa se pueden encontrar otras disciplinas relacionadas con latarea de la medida, el diagnostico o la evaluacin de personas en las muy distintas manifestacionesdel comportamiento individual o colectivo ( p.e. Psicodiagnstico, evaluacin escolar, ... etc), peroel campo de la Psicometra queda delimitado por su matiz metodolgico que la hace responsable dela fundamentacin, elaboracin y evaluacin de las distintas pruebas y tcnicas de medicinpsicolgica. As pues, resumiendo todo lo anterior, la Psicometra tiene como objeto propio elestudio de los distintos aspectos tericos (Teora Psicomtrica) en los que se basan las AplicacionesPsicomtricas (Meli, 1990), consistentes en la construccin de escalas de medida que despuspueden ser utilizadas para medir a cualquier sujeto y/o estmulo de la poblacin en la que se haobtenido la muestra representativa para ensayar, depurar y calibrar el test (ver figura 1.1). En elmismo sentido Olea (1989) atribuye a la psicometra el objetivo de elaborar mtodos para y teorassobre la medicin psicolgica. En un intento de delimitar an ms el objeto de estudio de laPsicometra, Ponsoda (1984) afirma que la elaboracin de modelos formales con la finalidad deinvestigar algn sector de la psicologa entrara dentro del campo de la psicologa matemtica,mientras que si esos modelos formales se plantean como finalidad el escalamiento de algn tipo decomportamiento ms que su comprensin, estamos dentro del campo de la Psicometra.

Por el lado prctico de la disciplina psicomtrica conviene distinguir la aplicacin y el usodiagnstico de un test (uso psicomtrico) de la propia construccin, adaptacin o contrastacin delas bondades psicomtricas (Teora y Aplicaciones Psicomtricas) de dicho test (ver fig. 1.1). Lasaplicaciones psicomtricas tratan del proceso de elaboracin de un instrumento de medidasiguiendo la teora psicomtrica del modelo de medida correspondiente. Los usos psicomtricostratan de la utilizacin con fines de diagnstico de un instrumento de medida construidopreviamente. Los usos psicomtricos no son Psicometra pero se nutren de los productos de lasaplicaciones psicomtricas (ver figura 1.1.) y proporcionan, a su vez, a la psicometra masas de datosque depuran sus instrumentos de medida; as como peticiones que requieren investigaciones de lasque se obtengan productos (aplicaciones psicomtricas) que se necesiten en un momento dado. Enel mismo sentido, la Psicometra hace uso de herramientas matemticas y estadsticas (ver fig. 1.1.)planteadas en otras asignaturas metodolgicas; as como proporciona, para un posible usometodolgico general, modelos y tcnicas que se descubrieron, en principio, para solucionarnecesidades psicomtricas.

Cualquier libro que consultemos y que trate sobre la construccin de instrumentos de medida osobre el diseo de situaciones de medida, tratar de concienciarnos de la gran dificulta de lamedicin psicolgica, al tratar de abordar criterios o atributos internos al sujeto y, por lo tanto, nopuestos de manifiesto de forma directa sino indirectamente, esto es, a travs del comportamiento.Se suele poner la Fsica como ejemplo de reas del saber que no tienen este problema, debido a quesus medidas las realizan sobre atributos considerados externos. Esto explica que en el campo de lasolucin de los problemas metodolgicos de la medicin psicolgica las mayores aportaciones hayansido hechas por psiclogos, especialmente en el campo de la Teora Clsica de los Test. El modelolineal aditivo propio de la Teora Clsica de los Tests es un tipo de escalamiento muy adecuado a lasnecesidades y posibilidades del comportamiento psicolgico en cuanto al nivel de escala de medidaque con dicha teora (TCT) se obtiene.

Introduccin a la Teora de la Medida 9

1 Frecuentemente tambin los tems son una muestra representativa de un universo de posibles temsque constituyen el dominio psicolgico (atributo) a medir.

2 Dawes (1975) se refiere a este proceso de ligar el constructo con sus indicadores medicin dendices. Nunnally y Bernstein (1995) ponen en boca de Bollen y Lennox este tipo de relacin causal entre elconstructo como causa interna y los indicadores como manifestaciones comportamentales externas.

3 A los que nos solemos referir con trminos como constructo, componente, dimensin, factor, etc.

Resumiendo, despus de esta contextualizacin de la asignatura se puede entender mejor ladefinicin de la Psicometra como la disciplina que trata de los distintos modelos y tcnicas deescalamiento. Entendiendo por escalamiento el proceso emprico por el que, a travs de una muestrade sujetos1, elaboramos una escala o regla con la que podemos medir posteriormente a cualquiersujeto de la poblacin.

1.2.- Introduccin a la teora de la medida

Los distintos modelos de teora de la medida (Campbell, 1928, 1938; Stevens, 1946, 1951; Scotty Suppes, 1958; y Suppes y Zinnes, 1963) imponen restricciones a la medicin cuantitativa que lahacen inasequible en Psicologa, aunque til a la Fsica (Carmines y Zeler, 1994) . Habra queredefinir la tarea de medir para las ciencias psicosociales en aquellos casos en los que no se cumplenlos requisitos exigidos por Stevens en su clasificacin de las escalas de medida. En este sentido lamedida hay que considerarla como el proceso de ligar los conceptos abstractos de las teoras oconstructos con indicadores empricos. O de otra forma, como la puesta en prctica de un plansistemtico, explcito, para clasificar, y, en la mayora de los casos, cuantificar los datosparticulares en trminos de los conceptos ms generales del esquema terico2.

En este sentido, la medicin es un proceso que implica tanto consideraciones tericas comoempricas. Desde el lado emprico tenemos las repuestas observables -las respuestas marcadas en untest o cuestionario, el comportamiento registrado en un estudio observacional, etc -. Del ladoterico, tenemos conceptos no observables directamente3 o constructos, que estn representadosoperativamente por los comportamientos observables o indicadores medidos a travs de tests,cuestionarios u observacin directa. La tarea de medir es establecer los lazos entre ambos lados: elterico y el emprico.

Los psiclogos que observan la conducta humana aprecian ciertas regularidades a lo largo deltiempo, y en diferentes contextos, para muchos sujetos. Dado que frecuentemente no se conocen losprocesos psicolgicos que ocurren en el interior de cada sujeto (Prieto, 1997), se interpretan estasregularidades como constructos o especulaciones tericas hipotticas (Osterlind, 1989). Estosconstructos suelen concretarse en algn tipo de aptitudes o actitudes, rasgo de personalidad o derendimiento. Pero la operativizacin o definicin semntica (Lord y Novick, 1968) de estosconstructos psicolgicos tiene algunos problemas (Osterlind, 1989) que queremos analizar:

- No hay un procedimiento aceptado universalmente para medir un constructo. As, por ejemplopara conocer la habilidad de los sujetos de dividir por varias cifras: unos pueden optar por elegirtems con divisiones por distinta cantidad de dgitos, otros pueden preguntar por la secuencia depasos que seguira el sujeto, otros podran pedir la deteccin de errores en divisionesdesarrolladas, etc.- Con cualquiera de estos procedimientos el test estara constituido por una muestra limitada detems.- La unidad de medida utilizada (nivel de medida) puede ser distinta en cada caso.- Adems, como consecuencia de todo ello, las medidas estn sujetas a un cierto margen de error.Por todo ello, suele ser aconsejable no conformarse con la definicin operativa del constructo,

dada su subjetividad, y ratificarla a posteriori con una definicin estructural (Bollen, 1989) o


1 Dichos aspectos (relevancia y representatividad) de los tems sern desarrollados en los temas devalidez y de construccin de una prueba.

2 Qu ocurre con aquellos tests cuya medida favorece sistemticamente a unos grupos o estratos yperjudica a otros? No son errores aleatorios sino que son errores conceptuales y por lo tanto sistemticos. Asocurre con los tests que pretenden medir inteligencia general sin influencia cultural, pero cuyas medidas estnsesgadas en detrimento de tnias como gitanos y negros (con menor nivel cultural).

sintctica (Lord y Novick, 1968) que relacione el constructo con otros constructos o variablesobservadas de su entorno psicolgico. Esto aporta algunas garantas sobre la validez de los tests, perono est exento de problemas que trataremos posteriormente en un tema especfico sobre validez.

En resumidas cuentas, queremos precisar que el objetivo que perseguimos a la hora de medir esel de elaborar indicadores empricos de los constructos tericos objeto de medida. Para ello esimportante disponer de las pertinentes definiciones tanto sintcticas o estructurales comosemnticas u operativas de dichos constructos, para as construir grupos de tems -se entiende queagrupados por constructos- que sean relevantes y representativos1.

1.3.- El error de medida.

1.3.1.-Tipos de errores de medida y sus consecuencias

Como no siempre se es lo suficientemente cuidadoso en la medicin de las variables psicolgicas.Esta fase de medicin de variables psicolgicas (constructos), previa a todo anlisis estadsticodescriptivo o inferencial, condiciona de manera importante los resultados de toda investigacin. Sino se realiza adecuadamente el proceso de medicin, quedarn desvirtuadas de manera significativalas conclusiones psicolgicas obtenidas. En estas circunstancias, qu valor tendrn nuestrasdecisiones? Estaramos cometiendo errores de medida que haran ms confusa loa teora subyacenteal comportamiento psicolgico.

El trmino error de medida comprende errores de muy diferente naturaleza. Aqu, distinguiremos,de acuerdo con Jenck y colaboradores (1979, pgs.. 34-36), tres tipos de errores fundamentales: a)conceptuales, b) sistemticos y c) aleatorios.

Los errores conceptuales son consecuencia no tanto de medir mal una determinada variablecuanto de medir equivocadamente otra en su lugar. Se trata de un problema relativamente frecuenteen psicologa donde no suele estar muy claro qu es lo que estamos midiendo. Ocurre, por ejemplo,cuando utilizamos una prueba de razonamiento o de vocabulario como expresin de la inteligencia,o bien cuando tomamos los ingresos como indicador del nivel social. Son errores que quedaranenmarcados dentro del tema de la validez, que estudiaremos ms adelante.

Los errores sistemticos son aquellos que siempre se producen en una misma direccin. Porejemplo, una prueba puede medir siempre de ms, o bien, todos los individuos de un grupo hanrealizado un cierto test con diez minutos menos del tiempo especificado en el manual, o bien, unencuestador induce sistemticamente a una determinada respuesta. Todas estas situaciones darnlugar a respuestas sesgadas que repercutirn en los valores estimados como resultado del anlisis.Es obvio que la estadstica como tal poco tiene que hacer con este tipo de errores, donde slo cabeser cuidadoso en la planificacin y desarrollo del proceso de medicin.

Tanto los errores conceptuales como los sistemticos son errores sistemticos, ya que se cometensistemticamente y en el mismo sentido con todos los sujetos2. El mejor ejemplo de error sistemticoes el de el ejemplo de tiro a de la figura 1.6, en pag. 18, en el que todos los disparos dansistemticamente por encima de la diana. Pero no todos los errores sistemticos son conceptualessino que son ms procedimentales (no seguir las consignas de estandarizacin del test) queconceptuales.


Por ltimo, los errores aleatorios son consecuencia de los mltiples factores desconcocidos queinciden en toda medicin y que introducen en la misma una cierta variabilidad, como en las dianasb y c de la figura 1.5.

A diferencia de los errores sistemticos, los errores aleatorios no guardan relacin alguna con elatributo objeto de la medida. Se supone que estos errores aleatorios unas veces actan en un sentidoy otras en otro, de forma tal que se compensan entre ellos (los positivos con los negativos) y a lalarga su suma vale cero. Posiblemente un determinado sujeto tenga la misma inteligencia hoy quemaana, pero si le aplicsemos el mismo test en ambos das, presumiblemente obtenga puntuacionesdiferentes. Variables tales como estado de nimo, cansancio, grado de adivinacin, errores decodificacin ..etc, puedan afectar a los resultados de la prueba aplicada. Tales errores hacenreferencia a la precisin de las medidas y entran dentro del terreno de la fiabilidad, que ser objetode estudio en estos temas.

Los errores conceptuales y los errores sistemticos son consecuencia fundamentalmente de undiseo defectuoso del proceso de medicin. En el caso de los conceptuales, planteamientos tericosms rigurosos en torno a la naturaleza del constructo es lo que se hace exigible, mientras que en lossistemticos, se hace necesario una mayor estandarizacin de aquellas circunstancias que inciden enla medicin, en el sentido de mantener su constancia en todo momento.

Los errores aleatorios, aunque pueden reducirse con una mejora en el diseo de medida, nuncapueden ser eliminados por completo. Estos errores aleatorios son inherentes a las caractersticas dela medicin psicolgica. Nunca sern controlados en su totalidad, por lo que la estadstica ha dehacerse cargo de ellos. Su naturaleza de "aleatorios" con sus supuestos de media cero eincorrelacin los hace idneos para ser tratados estadsticamente y conocer su cuanta, cuestinque es ms difcil de cuantificar en los otros tipos de error.

1.3.2.- La estimacin del error aleatorio en la validacin de teoras.

La existencia de error conceptual en la medicin de un constructo implica la imposibilidad devalidar teora alguna en la que participe dicho constructo. Dicho de otra forma cuando un modelo(teora) estructural de medida no resulta vlido puede ser porque dicha teora sea falsa o porquealgunos de los constructor integrados en ella se miden con error conceptual, que es lo mismo quedecir que miden otro constructor distinto y que por lo tanto no se comporta como el quepretendamos medir ni es integrable en la misma teora que aqul.

Los errores sistemticos en sentido estricto, esto es aquellos que implican sumar o restar unaconstante a todos los sujetos a los que se mide con un test, no tiene ningn efecto sobre el modeloo teora estructural que se pretende contrastar.

Sin embargo la estimacin y posible atenuacin de errores aleatorios como son los erroresaleatorios de medida reflejados en la fiabilidad de los tests, siempre posibilita dejar como msevidente o clara la estructura o teora relacional que se da entre los constructos. La nocontemplacin de los errores aleatorios en la medicin psicolgica tiene el mismo efecto sobre lamanifestacin de la teora subyacente, que el que la niebla tiene para visualizar un coche (p.e.) oque el que el ruido de fondo tiene sobre la audicin de una meloda musical.

As podemos comprobar a modo de ejemplo (ver fig. 1.3) cmo la estimacin de la fiabilidad conla que se miden dos atributos psicolgicos permite mostrar con mayor evidencia la parte estructuralo d e v e r d a d e r a r e l a c i n s u b y a c e n t e e n t r e l o s c o n s t r u c t o s .


Figura 1.3.- Comparacin de los grficos a, b y c para comprobar cmo disminuye el parmetro deregresin en la medida en que no controlamos el error de medida.

Pero hay que ser precavidos porque al atenuar los efectos del azar (falta de fiabilidad) cualquierteora asume parmetros relacionales ms altos. Lo hay que ver es que se trate de una teorasubstantiva y de que se ajuste a los datos empricos.

1.4.- Conceptos de Fiabilidad y Validez.

De los errores que hemos visto anteriormente hay dos tipos que no interesan especialmente: losconceptuales y los de medida (aleatorios). El error conceptual lo identificamos como la diferenciaentre lo que tiene un sujeto de lo que medimos con el test y lo que tiene el sujeto de lo quepretendemos medir con el test (Vx-Vy), mientras que el error de medida lo identificamos como ladiferencia entre la medida emprica y verdadera de dicho sujeto en el atributo que se mide con el test(X-Vx). Asociados a estos dos tipos de error nos encontramos con las dos cualidades principales delos tests a las que vamos a dedicar mayor espacio en esta asignatura: validez (Vx-Vy) y fiabilidad (X-Vx). As pues, resumiendo, toda medida ha de ser til para medir lo que nos proponemos en cadacaso (validez) y no otra cosa por error conceptual, y adems ha de medirlo con precisin y no conerror de medida (fiabilidad).

A partir de ahora nos vamos a centrar en el concepto de fiabilidad como precisin, concepto quese manifiesta en dos situaciones distintas: como cercana entre lo que medimos y lo que tiene elsujeto de lo que medimos (fiabilidad absoluta) y como cercana entre medidas repetidas de un mismoconstructo a un mismo sujeto ( fiabilidad relativa). As pues, tenemos el concepto de fiabilidadabsoluta como precisin y de fiabilidad relativa como estabilidad de medidas. Pero en Psicometraesta cualidad de la fiabilidad, que puede asumir diferentes grados o niveles, ha de poder fijarse conun nmero o valor cuantitativo que nos de una idea ms precisa del grado en el que una medida es


S 2eS 2x'j (Xi&Vi)2

NS 2x

'j (Ei)2

NS 2x

' S2e

S 2x'2ex'1&2vx

fiable (ndice de fiabilidad). En este sentido, los indicadores o ndices que ponen de manifiesto estosconceptos de fiabilidad absoluta y fiabilidad relativa los vamos a llamar ndice de fiabilidad ycoeficiente de fiabilidad. Segn lo dicho, el ndice de fiabilidad sera el nmero que pone demanifiesto la cantidad de fiabilidad absoluta, y coeficiente de fiabilidad sera el nmero que ponede manifiesto la cantidad de fiabilidad relativa.

Pero conceptuar la fiabilidad directamente como error de medida (X-V) es problemtico por dosmotivos: su magnitud sera distinta cada vez que se mide con un mismo test, y, adems su clculoes imposible al desconocerse la puntuacin verdadera.

El primer problema se evitara calculando el error cuadrtico medio (o su raz cuadrada) de losposibles ensayos de medida. Pero, an suponiendo que el error tpico de medida fuera calculable (noolvidemos el segundo problema), su valor no tendra un significado estandard sino que dependerade la unidad de medida en la que el test ofrece las puntuaciones directas. Este problema se soluciona

dividiendo . Con lo cual tenemos la proporcin de error en las medidas como el mejorS Se x2 2

indicador de la falta de fiabilidad de un test (ver ecuacin 1.6). No se puede ni imaginar el pacientelector cul fue nuestra sorpresa al llegar a la conclusin anterior, pues coincide con lo q ue vamosa estudiar en el tema tres como proporcin de varianza no asociada o proporcin de error en lasmedidas realizadas con el test, que es igual a 1" menos la proporcin de acierto o de varianzaasociada ya que ambas proporciones son complementarias y suman 1".

(1.6)

Pero no sedesespere el lector si le decimos que ninguna de las expresiones de la igualdad anterior soncalculables empricamente ya que tratan con errores y puntuaciones verdaderas de cada sujeto, queson trminos desconocidos para el psicmetra humano y por lo tanto sin poderes divinos. Para queno cunda el pnico, os informamos que la solucin, que argumentaremos tambin en el tema tres,

est en que es igual a que es lo que vamos a llamar coeficiente de fiabilidad como indicadorvx2 xxde la fiabilidad relativa. Y su raz cuadrada, que no es otra cosa que volver a puntuaciones nocuadrticas lo que en su origen elevamos al cuadrado para obtener la varianza, es igual al ndice de

fiabilidad que es el concepto del que partimos en el prrafo anterior. Y dado 1.6 tenemos que +ex2= 1 xx

Resumimos los pasos seguidos en este apartado. El concepto de fiabilidad absoluta siempre irunido al de error de medida, pero como el error de medida es fluctuante preferimos como indicadorla varianza de los errores. Como esta varianza depende de la escala de medida en que estn loserrores dividimos estos por la varianza del test o varianza de las puntuaciones empricas y obtenemosun indicador estandard de la varianza de los errores en trminos de proporcin de varianza error (verecuacin 1.6) Calculamos su complementario o proporcin de varianza acierto. Para reconvertirdicho indicador a puntuaciones no cuadrticas (puntuaciones directas) calculamos su raz cuadraday obtenemos el nmero que vamos a utilizar como indicador de la fiabilidad absoluta o ndice defiabilidad. Tambin se ha explicado que como dicho indicador no puede ser calculadoempricamente, se obtiene a partir de raz cuadrada del coeficiente de fiabilidad.


Figura 1.4.- Diagrama path de la Fiabilidad Absoluta

Figura 1.5.-Diagrama path de la fiabilidad relativa

As pues, la fiabilidad, en cuanto precisin, es un concepto que no puede ser conocidoempricamente en trminos absolutos (Fiabilidad Absoluta), si entendemos por precisin el gradode correspondencia entre la medida emprica y la magnitud real, que llamaremos verdadera, deaquello que estamos midiendo. As, por ejemplo, sera preciso un examen que reflejara fielmente losverdaderos conocimientos del alumno sobre los contenidos del examen. Es obvio que la nicainformacin de la que disponemos en cualquier medida es la propia puntuacin observada, mientrasque desconocemos la verdadera magnitud de lo medido. Es por ello que se recurre a otro conceptode fiabilidad (Fiabilidad Relativa) que nos permite saber de forma indirecta si estamos midiendocon cierta precisin, ya que la fiabilidad relativa depende, como veremos despus, de la fiabilidadabsoluta. En este sentido, como no conocemos cules son los conocimientos de los sujetos(puntuacin verdadera) si no es a travs de su medida en un examen, para apreciar el grado deprecisin del examen tendr que examinar dos veces al sujeto y deducir la precisin del examen desu estabilidad cuando se mide una misma cosa (p.e. los conocimientos de Periquito Prez). Delmismo modo que detectamos la fiabilidad (precisin) del tirador haciendole disparar repetidas vecesa una diana (ver figura 1.6).

Hemos definido la Fiabilidad Absoluta como elacuerdo o correspondencia entre la puntuacin queverdaderamente posee el sujeto en el atributo (V) y lapuntuacin observada como resultado de la medicin(X) (ver en figura 1.4. su identificacin comocorrelacin (xv) o efecto (xv)) Que es en los modelosestructurales la dependencia entre el comportamientoy el factor o rasgo latente aptitudinal o depersonalidad.

La Fiabilidad Relativa (ver figura 1.5) hace referencia a la estabilidad o consistencia en lasmedidas. Aqu el trmino "fiabilidad" corresponde a su significado coloquial o ms frecuente. As,

se suele decir que es fiable aquello que se mantieneconstante en situaciones semejantes (como deberaocurrir con la nota del examen). Un test cualquiera(como p.e. un examen) es fiable si cada vez que seaplica a los mismos sujetos en las mismascircunstancias proporciona los mismos resultados.Y es a partir de la constancia como inferimos laprecisin del instrumento, que es el concepto querealmente nos interesa; cuanto ms constante -estable- , ms preciso. Como en la figura 1.6.cuanto ms cercanos entre s estn los disparosms fiable es el sujeto que dispara. Fiabilidad seidentifica con estabilidad y ausencia de fiabilidadcon variabilidad, porque suponemos que lapuntuacin verdadera estar dentro del rango devariabilidad observada, y deduciremos que

estamos midiendo con mayor precisin cuanto menor sea la fluctuacin entre las puntuacionesobservadas en circunstancias iguales.


1Que especifica, a este respecto, que un efecto complejo es igual al producto de los efectos simplesque lo constituyen.

Figura 1.6. cuatro pruebas de tiro distintas tanto en variabilidad alrededor del centro como en centrado respecto de la diana. (Adaptado de Trochin, 1997, pag. 1)

xx('xvxv '2xv

xv ' xx( (1.7)

Si nos preguntamos qu relacin hay entre ndice y coeficiente de fiabilidad, la respuesta quedainsinuada en las pginas anteriores cuando hemos hablado de precisin versus estabilidad de lasmedidas, proporcin de variabilidad verdadera en trmino de desviaciones tpicas versus proporcinde variabilidad verdadera en trminos de varianza. Esto es versus . xv xx

Efectivamente, como se puede comprobar aplicando la regla del trazado1 en la figura 1.5, comose puede apreciar, el coeficiente de fiabilidad es igual al producto del ndice de fiabilidad de lamedida de X por el ndice de fiabilidad de la medida de X , lo que es igual al cuadrado delndice si ambos ndices son iguales (ver ecuacin 1.7). Para una mejor comprensin de esta regla sepuede poner la analoga de la teora de la informacin aplicada a un ejemplo: Supongamos que unpadre narra a sus dos hijos (X y X) la novela recientemente filmada como pelcula Ala triste,despus de un tiempo se evala de alguna forma el porcentaje del mensaje emitido retenido por cadanio. El porcentaje de aspectos retenidos comunes para ambos nios es igual al producto delporcentaje de recuerdo -precisin- de X por el porcentaje de recuerdo precisin de X*. Msadelante al presentar la teora clsica de los test necesitaremos recurrir al supuesto de medidasparalelas, de igual fiabilidad de ambas medidas, para poder estimar el ndice de fiabilidad a partirdel coeficiente de fiabilidad (ver ecuacin 1.7). En la visin congenrica de la Tora Clsica de losTests (TCT) propia de los MEM no es necesario asumir esta restriccin de paralelismo de lasmedidas (Batista y Coonders, 2000).


El concepto de validez es algo ms complejo, aunque no lo parezca en esta primera aproximacinque hemos ofrecido. Parece una obviedad sin ms complicaciones afirmar como hemos hecho que"una medida es vlida si es til para medir aquello que pretende". Segn esta definicin, un metroes vlido para medir longitudes y una balanza lo es para medir pesos. Y no parece necesario en estecontexto replantearse la validez del metro o de la balanza, ya que las magnitudes fsicas estn ah,al alcance de la mano. Esto es que el valor verdadero del objeto (tamao o peso) se percibedirectamente con los sentidos y puede resultar fcil apreciar la covariacin entre las medidasobtenidas y el dicho valor verdadero. Pero en psicologa las cosas cambian sustancialmente porque...Dnde est aquello que pretendemos medir? Realmente, tal test mide la inteligencia? No medirrazonamiento o fluidez verbal? Y cuando mido ansiedad, estoy seguro de que no estar midiendodepresin?

En psicologa la cuestin es que las variables ms que darse en la naturaleza (peso, longitud,densidad) son variables creadas por nosotros mismos (esto no quiere decir que sean arbitrarias oirreales como esperamos poder mostrar). Se trata de conceptos -constructos- constituyentes de unateora. En estas circunstancias, supongo que el lector estar de acuerdo en que es ms difcil saber,cuando medimos, qu es exactamente lo que estamos midiendo. En una primera aproximacin,estamos considerando la validez (que llamamos terica) como la correspondencia entre lo que tieneel sujeto de lo que medimos y la magnitud en la que posee el concepto o constructo que se pretendemedir. Pero dado que el concepto o constructo que se pretende medir no se suele conocerempricamente y sin error, est claro que las evidencias sobre validez de las medidas obedece msa consideraciones tericas que empricas. As en el tema cinco, ms que presentar un ndiceincuestionable de la validez de un test, presentaremos distintos tipos de evidencias de validez enfuncin del uso que habitualmente se de a dicho test.

Por lo que respecta a la fiabilidad de las medidas, no nos preguntamos qu estamos midiendo sinocon cuanta precisin. Este grado de precisin es fcil de determinar (indirectamente) por laconstancia de los resultados. Hay un aspecto cuantitativo, emprico, al cual aferrarse como criteriode fiabilidad. Por el contrario, en la validez, el "qu se mide" otorga a la cuestin una dimensincualitativa, dependiendo la validez de nuestra especial consideracin sobre lo que son las cosas, estoes dependiendo de nuestro criterio de validez.

As, si recurrimos al ejemplo de los disparos de un tcnico a una diana (ver figura 1.6) con unrifle, nos encontramos con una situacin anloga a lo que ocurre cuando un psiclogo evala unatributo a un sujeto en repetidas ocasiones a travs de un test. El psiclogo es el tcnico, el test esel rifle y el centro es el valor del sujeto en el atributo que se pretende medir. La cercana entre lospuntos de cada nube es equiparable a la estabilidad entre las medidas -coeficiente de fiabilidad-. Lacercana entre la nube de puntos de cada diana se deber tanto a caractersticas del rifle (Qu pasarasi fuera de goma) como a fluctuaciones en el pulso del que dispara. As la falta de estabilidad entrelas medidas puede deberse tanto a imprecisiones en la materia prima que son los tems como afluctuaciones en las distintas circunstancias de aplicacin entre las que la actuacin del psiclogoes fundamental. Por otra parte, por lo que respecta a la validez, la cercana entre el centro de la nubey el de la diana es equiparable a la relacin o cercana entre lo que en realidad mide el test y lo quese pretende medir con su uso. Posibles explicaciones de falta de validez del rifle seran el tener altoo bajo el punto de mira as como disponer de un can curvado, de igual forma veremos muchasexplicaciones de faltas de validez pero todas ellas englobables como errores conceptuales alconfundir nuestro objetivo de medida con lo que en realidad medimos.

As pues, los conceptos de fiabilidad y validez son diferentes e independientes por lo que respectaa la validez terica como correspondencia entre el verdadero nivel del sujeto en lo que medimos yen lo que pretendemos medir. Pero, dado que esta validez terica es difcil de contrastar,frecuentemente hacemos uso de la validez emprica de los tests con respecto a determinados criterios.Es en este sentido en el que se suele decir que una deficiente fiabilidad hace que tambin se muestrebaja la validez emprica, aunque una baja validez emprica se puede producir por baja fiabilidad o


Figura 1.7.- Validez emprica baja con baja validez terica y alta fiabilidad

por baja validez terica. Nos serviremos de algunos ejemplos tpicos y tpicos para explicar el hechode que la fiabilidad es condicin necesaria aunque no suficiente para que se produzca validezemprica.

As, si representamos en un diagrama causal la medida emprica en el test como X; el constructoque en realidad mide el test o puntuacin verdadera en el test como Vx; el constructo o criterio quese pretende medir con el test como Vy y la medida emprica del criterio por Y; entonces, segn lassiguientes figuras; podemos encontrarnos con distintas situaciones en las que, utilizando la regla deltrazado del path anlisis, la validez emprica ( ) es igual al ndice de fiabilidad del test ( ) xy xvxmultiplicada por la validez terica ( ) y multiplicada por la fiabilidad del criterio ( ).v vx y yvy

En las dos figuras 1.7 y 1.8 presentamos, a modo de ejemplo, dos casos con resultados parecidospor lo que respecta al valor de su coeficiente emprico de validez pero opuestos por lo que respectaa su configuracin de fiabilidades y validez terica. As, en la figura 1.7, se representa el casosupuesto de que medimos la inteligencia de las personas en base a la longitud de cierta lnea de lamano izquierda. Est claro que aunque midamos con gran rigor dicha lnea de la mano ( ) xvx = 08.e, incluso, midamos con un test muy preciso la inteligencia ( ), de poco nos servir (para yvy = 0 98.despecho de los quiromnticos) pues parece ser que la relacin estricta de dicha linea de la mano conla inteligencia de los sujetos es bastante baja ( ). Este es un ejemplo de baja validezv vx y = 010.emprica como consecuencia de baja validez terica -ver figura 1.7-. Algo parecido ocurre en laprueba de tiro a de la fig. 1.6. Su autor tiene gran pulso (precisin en el disparo) pero no esconsciente de que en lugar de al centro sus disparos van por sistema a la parte superior de la diana.En resumidas cuentas en este ejemplo el problema es la baja validez del arma para dar al centro dela diana y de las lineas de la mano para el diagnstico de la inteligencia.

Igualmente, puede ser baja la validez emprica ( ) (ver figura 1.8) por existir una baja xy = 0 0882.fiabilidad del test ( ) -igualmente hubiera sido baja la validez emprica por baja xvx = 010.fiabilidad del criterio-, aunque sea alta la validez terica ( ). As ocurre si medimos lav vx y = 0 98.inteligencia de un sujeto con un test muy malo, en el que un da se le indica que es un genio y alsiguiente que es un deficiente mental (suponemos que no le ha pasado nada grave de un da paraotro). De poco nos servir este test para conocer la inteligencia de dicho individuo (supongamos queel valor criterial ha sido obtenido con una buena prueba) . Algo parecido a lo anterior suele ocurrir


Figura 1.8.- Validez emprica baja con alta validez terica y baja fiabilidad

Figura 1.9. Validez emprica alta exige altas fiabilidades de tests y criterio, y altavalidez terica o validez en sentido estricto.

con los tests proyectivos, por gozar de una (supuesta) gran validez terica, pero de una granimprecisin en la medida (baja fiabilidad). As como ocurre en la prueba de disparo b, en la queel arma est bien centrada (es vlida para dispara al centro de la diana) pero el sujeto que dispara esmuy inestable o el can es de plstico. En este mismo sentido, los diagnsticos obtenidos con lostests proyectivos o las entrevistas personales parecen instrumentos muy adecuados para medir lacomplejidad del ser humano, pero la subjetividad de sus diagnsticos los hace poco fiables.

Por ltimo, vase en la figura 1.9 cmo una alta validez emprica, implica tanto fiabilidades comovalidez terica, o validez en sentido estricto, buenas. Si un test de inteligencia, por ejemplo, predicede forma rigurosa el rendimiento en un examen ( ), es porque hay precisin en las xy = 084.medidas de ambos constructos ( y ), y estricta validez o utilidad del xvx = 0 95. yvy = 0 9.constructo-inteligencia de ese test para predecir los conocimientos que mide el examen( ).v vx y = 0 98.


Para concluir, es evidente que una dbil o fuerte ligazn entre X y Vx as como entre Y y Vy, noafecta de ninguna forma a la validez terica o validez en sentido estricto ( ), mientras quev vx yfiabilidades relativamente bajas de test o criterio s reducen . xy

Esto es, para que X e Y estn fuertemente relacionados, tambin lo estarn necesariamentelos pasos intermedios (recordemos la regla del trazado). Habr de ser alta tanto la dependencia deX con respecto a su constructo Vx -ndice de fiabilidad del test- , como de Y con respecto alsuyo (Vy) -ndice de fiabilidad del criterio-, as como de un constructo con respecto a otro ( ).v vx yEn resumidas cuentas, con la fiabilidad y la validez ocurre como cuando el ruido nos impide or lameloda, as como cuando la niebla nos impide ver la figura de un coche que se acerca por lacarretera; una baja fiabilidad nos puede oscurecer la validez terica con una baja validez criterialemprica.

Con este primer tema de introduccin a la psicometra, y en especial con su apartado deintroduccin a la medicin psicolgica, hemos querido poner de manifiesto la importancia delproceso de medicin en Psicologa. Por eso, a continuacin, vamos a dedicar un captulo a losconceptos de fiabilidad (cap II) y otro (cap III) al de validez, as como a sus manifestacionesprcticas y operativizaciones. Por ltimo terminaremos con la presentacin, todo lo prctica que seaposible, del proceso adecuado de construccin de un test para que tenga las aludidas cualidades(fiabilidad y validez).

psicome1

Documents