avances 228. amelia márquez

50
Octubre 2009 Núm. 228 AVANCES Cuaderno de Trabajo Universidad Autónoma de Ciudad Juárez Coordinación de Investigación y Posgrado del Instituto de Algunos fundamentos metodológicos en la Elaboración de Instrumento de Medición en Psicología y Pedagogía: base para la construcción de un instrumento de medición de competencias básicas universitarias Amelia Márquez Jurado

Upload: trantuyen

Post on 31-Dec-2016

223 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Avances 228. Amelia Márquez

Octubre 2009Núm. 228

AVANCESCuaderno de Trabajo

Universidad Autónoma de Ciudad Juárez

Coordinación de Investigación y Posgrado del Instituto de

Algunos fundamentos metodológicos en la Elaboración de Instrumento de Medición en

Psicología y Pedagogía: base para la construcción de un instrumento de medición

de competencias básicas universitarias

Amelia Márquez Jurado

Page 2: Avances 228. Amelia Márquez

Comité Editorial de Avances

Dra. Martha Patricia Barraza de Anda

Dra. Consuelo Pequeño Rodríguez Dra. Alba Yadira Corral Avitia

Mtra. Carmen Gabriela Lara Godina Mtro. Gerardo Sandoval Montes

Dra. Magali Velasco Vargas Dr. Ricardo Almeida Uranga

Dra. Sonia Bass Zavala Mtra. Carmen Álvarez González Mtra. Ma. Elena Vidaña Gaytán

Mtro. Oscar Dena Romero Mtra. Katya Butrón Yáñez

Directorio

Jorge Mario Quintana Silveyra Rector

David Ramírez Perea

Secretario General

Martha Patricia Barraza de Anda Coordinadora General de Investigación y Posgrado

Francisco Javier Sánchez Carlos

Director del Instituto de Ciencias Sociales y Administración

Consuelo Pequeño Rodríguez

Coordinadora de Investigación y Posgrado del ICSA

Universidad Autónoma de Ciudad JuárezInstituto de Ciencias Sociales y Administración

H. Colegio Militar # 3775Zona Chamizal

C.P. 32310Ciudad Juárez, Chihuahua, México

Tels. 688-38-56 y 688-38-57Fax: 688-38-57

Correo: [email protected]@uacj.mx

Page 3: Avances 228. Amelia Márquez

A v a n c e s

1

Algunos fundamentos metodológicos en la Elaboración de un Instrumento de Medición en Psicología y Pedagogía: base para

la construcción de un instrumento de medición de competencias básicas universitarias

Resumen

El asunto de las competencias universitarias, como base de la formación de los profesionales universitarios, presenta un vínculo importante entre el trabajo, la educación y la función del ser humano. Su base fundamental de apoyo surgió a partir de la necesidad de establecer un parámetro de desarrollo de formación de acuerdo a las necesidades productivas del mercado a nivel mundial, siendo su asunción y aplicación de acuerdo al desarrollo de cada nación. Los programas creados en relación con el tema del desarrollo de las competencias, lleva también implícita la necesidad de ser evaluados para así constatar la efectividad lograda de los objetivos de aprendizaje vinculados con el trabajo. Si bien se han diseñado pruebas tales como Ceneval, Excale, sin embargo, hasta la fecha no se cuenta con un instrumento de medición que evalúe –específicamente- las competencias básicas universitarias y que otorgue resultados de efectividad de los programas educativos con enfoque global. Pretendemos entonces, presentar algunos enfoques metodológicos que pueden servir como parámetro para la construcción de un instrumento de medición para tal efecto. Abstract

College competencies, as a base for university students formation, presents an important link among work, education and being human. Its support base arose from the necessity to establish a parameter of development and formation according to prevailing world’s market productive needs. Its use will be directly related to each country development stage. Developing competencies programs requires at the same time the need to have them evaluated so as to assess the effectiveness of learning objectives. Despite tests such as Ceneval and Excale have been designed, there are no measuring instruments that specifically evaluate basic university competencies that provide effective results with a global approach on education programs. Therefore, we present some methodological approaches that may be used as parameter for the construction of a measuring instrument.

Palabras Claves: Competencias Básicas Universitarias, Sistemas de Evaluación,

Psicometría, educación superior, Teoría Clásica de los Test, Teoría de Respuesta al Item.

Page 4: Avances 228. Amelia Márquez

A v a n c e s

2

Introducción

En el campo de la educación, las competencias han estado cobrando importancia

desde la década de los años sesenta, la evaluación de las mismas ha estado abierta a una

serie de reformas y cambios en su forma original, el nivel al que se ha aplicado es el básico

y bachilleratos. A nivel universitario se ha procedido básicamente a realizar el seguimiento

del rendimiento académico de los alumnos a través de las evaluaciones docentes, con

entrevistas y portafolio, más no con algún instrumento de medición específico para ello. El

presente artículo, pretende ofrecer algunos fundamentos metodológicos que pueden ser

aplicables para la construcción del instrumento de evaluación, con lineamientos teórico-

metodológicos científicos, mismos que proporcionan la confianza de su medición respecto

de un grupo –normalización- y sea susceptible de aplicarse a alumnos y evaluar su nivel de

desarrollo tanto en conocimiento como en aplicación del mismo en un nivel de praxis

laboral, social y familiar. Nos enfocamos en lo relativo al conocimiento de competencias así

como a los distintos sistemas de evaluación y teorías con las cuales se construye un

instrumento de evaluación. Asimismo se ejemplifica la construcción metodológica y teórica

a través de los resultados obtenidos en la construcción del instrumento de medición de la

competencia laboral denominada Actitud de chóferes de transporte público. De la misma

manera en que una competencia laboral es susceptible de ser medida, también los

dominios cognitivos, los valores, el nivel de inteligencia o cognición, así se infiere

susceptible de ser medida la formación de competencia básica universitaria.

Page 5: Avances 228. Amelia Márquez

A v a n c e s

3

Sistemas de evaluación

El sistema que se utiliza en psicología para medir una serie de parámetros

conductuales, cognitivos, emocionales, de habilidad, destreza etc., se le conoce como

psicometría, donde evaluación psicométrica –a través de una batería de pruebas- se

interpreta como el conjunto de procedimientos que conducen a la valoración cuantitativa de

fenómenos conductuales, cognitivos, emocionales, de personalidad, habilidad, destreza,

actitud, aplicados a los procesos laborales y de vida. Estos instrumentos aportan apoyos

importantes, como en el caso de la pedagogía en la cual se aplican para conocer el nivel de

coeficiente intelectual, la madurez visomotora, el desarrollo de personalidad, las

preferencias vocacionales, valores, actitudes, manejo de tolerancia a la frustración, manejo

de técnicas de estudio, dificultad en el aprendizaje, entre otras; en el área industrial y

laboral se especifican áreas de desarrollo potencial y a desarrollar respecto de capacidad,

manejo de inteligencia múltiple, manejo de tipos de liderazgo, capacidades motoras,

destrezas, habilidades, manejo de personalidad laboral, comunicación y desarrollo personal

y su influencia en las personas, entre otras; en el área jurídica se emplean las pruebas

psicométricas para la elaboración de perfiles de personalidad psicopática, evaluación del

estado mental y tipo de personalidad, dictámenes de tendencias psicopáticas v/s

normalidad, entre otros. En el área de salud se aplican para conocer el estado emocional

vinculado con el desarrollo de personalidad y actitud con un enfoque clínico; en las áreas

sociales se utilizan para conocer la percepción de la dinámica socio-familiar-cultural.

El sistema de evaluación a través de instrumentos de medición psicológica, también se ha

hecho presente, en el área educativa desde el momento en que la fundamentación teórico-

metodológica para la construcción de pruebas como Ceneval o Excale presentan los

Page 6: Avances 228. Amelia Márquez

A v a n c e s

4

mismos principios, de ahí que consideremos la posibilidad de llevar a cabo una prueba de

evaluación de competencias básica a nivel universitario. Por ejemplo en Estados Unidos

desde 1960 cuenta con un Sistema de Evaluación Nacional del Progreso Educativo (NAEP)

enfocado en el conocimiento y habilidades de los jóvenes, aunque esta evaluación se

realiza a nivel básico1. Para bachillerato cuentan con una evaluación denominada

Alfabetismo funcional o de competencia mínima, misma a la que los alumnos deben

someterse para recibir su diploma de egreso. Los riesgos que han detectado respecto de

esta evaluación: por una parte la ocupa la discriminación, con la cual algunos de los

alumnos consideran que se favorece a ciertos grupos raciales; la otra objeción se ubica en

la alta reprobación; otra más centrada en la calidad y enfoque del profesorado respecto del

contenido de las materias, las cuales se enfocan básicamente a preparar a los alumnos

para que aprueben dicho examen. Otra forma de evaluar el desempeño del alumnado por

competencias es el denominado evaluación de valor agregado en la cual se valora los

conocimientos adquiridos en las materias académicas y habilidades de la vida tales como

analizar una columna de periódico, una tabla matemática, esta valoraciones son aplicadas

antes y después de cada periodo escolar, considerando que la mejoría sustancial de un

alumno es el equivalente a un valor agregado. Para nivel universitario aún no se conoce

con certeza si la forma de evaluar el resultado de programas académicos centrado en la

búsqueda de generar en los alumnos competencias, esté basada en una evaluación de

desarrollo de acuerdo a la obtención de calificaciones y su seguimiento semestral.

Una vez más consideramos la posibilidad, dadas las características que engloban las

competencias, que puedan ser susceptibles de ser medidas a través de instrumentos de

1 Aiken, Lewis R., Test psicológicos y evaluación. pp. 239-240.

Page 7: Avances 228. Amelia Márquez

A v a n c e s

5

evaluación. La psicometría o instrumentos de medición se ocupan de la medición a través

de la asignación de cantidades a las características o propiedades de una persona, en

relación con el tema del que se ocupe dicho instrumento, así puede ser de actitudes y por

qué no de competencias no solo a nivel laboral, sino educativo. Su elaboración requiere del

seguimiento y apego a un método de construcción en el cual se involucra la estadística, la

matemática y la temática a tratar.

Competencias básicas universitarias

Los antecedentes de la Educación Basada en Competencias datan de medidos del

siglo XX en los Estados Unidos -aplicado a infantes-, para 1906 en la Universidad de

Cincinnati-Ohio se crearon convenios con empresas estableciéndose criterios de

desempeño en la práctica. Para 1930 este programa se había masificado y había cobrado

popularidad y sobre todo logrado beneficios mutuos. En 1973 el gobierno de Estados

Unidos el Departamento de Estado realizó un estudio orientado a la selección del personal2,

luego de un período de estudio se llegó a la conclusión que un buen desempeño en el

puesto de trabajo está más relacionado con características propias de las personas, a sus

competencias, que a sus aspectos como conocimientos o habilidades. 3 Siendo hasta la

década de los años ochenta que se inicia con la utilización del concepto de Competencias

erigiéndose como pioneros Estados Unidos, Inglaterra y Australia enfocando la mejora en

eficiencia, pertinencia y calidad de la capacitación laboral.

Uno de los indicadores que permiten observar la necesidad y el avance que en relación a

educación se están dando a nivel mundial, lo marca el informe que se generó en la

2 Tarea que le fuera encomendada a David Mc Clelland catedrático en Harvard, su análisis buscaba detectar las

características presentes en las personas a seleccionar y que predijeran el desempeño de su éxito laboral. 3 Larrain, U., Ana María, González, F. Eduardo, Formación Universitaria por Competencias. Dcto. pdf

Page 8: Avances 228. Amelia Márquez

A v a n c e s

6

Conferencia Mundial sobre la Educación Superior con Sede en la UNESCO (1988) en la

cual se hizo hincapié en que es necesario propiciar el aprendizaje permanente y la

construcción de las competencias adecuadas para contribuir al desarrollo cultural, social y

económico de la sociedad.4 Para Junio de 2000, en el informe de la UNESCO referido al

aspecto de Educación, menciona sobre la Educación Superior en países en desarrollo:

Peligros y Promesas que…La nueva economía demanda competencias interpretativas,

analíticas, de establecimiento de prioridades, evaluativas y otras de alto nivel de manejo

de la información... Todos necesitarán estas competencias. Estas pueden y deben

enseñarse en edades tempranas. Pero también deben ser enseñadas en los niveles

superiores. Este es otro reto a la educación superior donde la especialización y la

competencia técnica sombrean demasiado frecuentemente éstas competencias

generales”. De tal forma, el estudio de las competencias ocupa hoy un espacio de primer

orden y es tratado por su importancia por diversas instituciones y autores, entre los

cuales se puede reconocer determinadas tendencias en su tratamiento y definición. Este

enfoque se inicia de manera más o menos paralela en el Reino Unido y en Australia en

ambos casos constituyen un sistema de normalización, formación y certificación de

competencias instituido luego de haber realizado profundos estudios y análisis en sus

respectivos países.

De acuerdo a lo anterior, se considera que la vinculación de la educación con el campo

laboral se da entonces como una necesidad, considerando las competencias profesionales

como una base o referencia para crear una mejora en los enfoques educativos, en los

cuales no se busca privilegiar sólo la adquisición de conocimientos, sino también la forma

4 Las competencias básicas se apoyan en 47modelos universitarios de Australia, Canadá y los Estados Unidos.

Page 9: Avances 228. Amelia Márquez

A v a n c e s

7

en que éstos se aplican a la vida misma. Este parámetro facilita la evaluación de los

egresados de los sistemas de educación profesional, considerando así también los

requerimientos del entorno socioeconómico en el que se encuentra inserta la sociedad en la

que se está desarrollando, es decir, considerando el contexto en el que se desarrollarán

profesionalmente los egresados de cualquier país, dado que las necesidades laborales se

encuentran interrelacionadas. La competencia laboral se considera a partir de la conjunción

de conocimientos, habilidades y actitudes conducentes a un desempeño de calidad y

oportuno y funcional. Esta cultura de competencia establece la articulación entre trabajo-

educación-recurso humano.

En este enfoque globalizado y enfocado básicamente a los países en desarrollo, se observa

que existe un sesgo en cuanto al enfoque, dado que si bien hace referencia a la necesidad

de realizar cambios en los sistemas educativos para establecer la vinculación entre el

conocimiento y las necesidades laborales que preparen a las personas para una vida más

íntegra, en la cual se involucra trabajo-educación y recurso humano, no se consideran

todos aquellos elementos de función biológica que afecta y altera la capacidad perceptiva

del ser humano. Si bien es cierto que cada persona tiene una forma peculiar de percibir e

interpretar el mundo, existen elementos de función biológica insoslayables tales como los

trastornos por déficit de atención, hiperactividad, dislexia, del aprendizaje, negativismo

desafiante, disocial, fonológico, expresivo. Trastornos emocionales como la bipolaridad,

ansiedad, del estado de ánimo, y algunos más que se encuentran documentados con

detalle en el Manual Diagnóstico DSM-IV-R y que dan cuenta de su existencia en las

múltiples quejas que los docentes argumentan, no solo a nivel básico, sino universitario y

que las autoridades mundiales encargadas del manejo y función de educación no han

Page 10: Avances 228. Amelia Márquez

A v a n c e s

8

asumido con la necesidad y urgencia con la que se presenta o que no la han dimensionado

por desconocimiento de su etiología y evolución y solo consideran las consecuencias –

conducta- como algo inherente del ser humano.

Concepto de Competencia

En el mundo globalizado no basta con preparar profesionales especializados en

un área de conocimiento, cada vez con mayor necesidad se requiere que la formación

además de ser básica, proporcione al egresado las habilidades en su área de preferencia

de estudio, las capacidades para captar el mundo circundante y sus necesidades, es

decir, desarrollar la percepción, además para adaptarse a las circunstancias y responder

a ellas de forma rápida y eficiente, ordenar sus impresiones, comprender las relaciones

entre los hechos que observa, que vive y en consecuencia pueda actuar. Para lograr este

objetivo, se requiere, además de las capacidades y conocimientos logrados por el propio

individuo, una formación de saberes transversales los cuales puede estar actualizando

de forma cotidiana y de acuerdo a las necesidades del desarrollo de la comunidad. Por lo

que se requiere que la formación académica se constituya de la combinación de las

capacidades propias, la educación formal y el aprendizaje que obtenga del trabajo. Como

este supuesto involucra factores múltiples, que van desde las capacidades intrínsecas de

cada individuo5, hasta las condiciones socioeconómicas, de política gubernamental y

educativa las cuales proporcionarán en cada egresado diversos niveles de competencia,

se hace entonces, difícil expresar un solo concepto de competencia que sea válido a

nivel mundial, de ahí que se han adaptado conceptos de competencia de acuerdo a las

necesidades considerando, en general que …el concepto de competencia reconoce un

5 Dentro de las capacidades intrínsecas se encuentra el nivel de coeficiente intelectual, la madurez perceptiva,

capacidades motrices gruesas y finas, capacidades auditivas, visuales, táctiles, gustativas y olfativas, así como los aspectos afectivos, emocionales y conductuales.

Page 11: Avances 228. Amelia Márquez

A v a n c e s

9

equilibrio entre las necesidades de las personas, de las empresas, de la sociedad y, en

general de la realidad contemporánea global, entendiéndose en general …la

competencia como la capacidad de un sujeto para realizar una tarea que exige activar

una serie de recursos que se manifiestan en su comportamiento eficiente.6

Para tal efecto globalmente se han considerado, tres tipos de Competencias: 1) las

Básicas , en las cuales la persona constituye las bases de su aprendizaje –interpreta y

comunica información, razona de forma creativa y soluciona problemas entre otras y

están referidas fundamentalmente a la capacidad de “aprender a aprender”-. Requiere de

instrumentación básica como la idoneidad para la expresión oral y escrita y del manejo

de las matemáticas aplicadas y pone en movimiento diversos rasgos cognitivos, como la

capacidad de situar y comprender de manera crítica, las imágenes y los datos que le

llegan de fuentes múltiples; la aptitud para observar, la voluntad de experimentación y la

capacidad de tener criterio y toma de decisiones. Se suelen incluir en los currículos como

comunicación verbal y escrita, lectura y escritura, las nociones de aritmética, el trabajo en

equipo, la resolución de problemas y la enseñanza de lenguas extranjeras; 2) las

Personales, son aquellas que permiten realizar con éxito las diferentes funciones en la

vida -actuar responsablemente, mostrar deseo de superación y aceptar el cambio, entre

otras-. Estas constituyen un conjunto difícil de definir, pues están en función de las

capacidades y potencialidades de expresión de un grupo de características que se

manifiestan en dependencia del ambiente en que se desarrolle la actividad, tales como

seguridad en si mismo, capacidad para dominar los sentimientos y las tensiones

emocionales, curiosidad, argumentación crítica y capacidad analítica, y 3) las

6 Mertens (1996), citado en emergencias y Actualidades de las Competencias.

Page 12: Avances 228. Amelia Márquez

A v a n c e s

10

Profesionales son las que garantizan cumplir con las tareas y responsabilidades de su

ejercicio profesional. Se reconoce que las cualidades de las personas para

desempeñarse productivamente en una situación de trabajo, no sólo dependerán de las

situaciones de aprendizaje escolar formal sino también del aprendizaje derivado de la

experiencia en situaciones concretas de trabajo. 7

Considerando las necesidades del mercado, los centros educativos profesional y de nivel

medio superior, se dieron a la tarea de conservar los vínculos ya establecidos con las

empresas, así en Estados Unidos, se elabora el informe SCAN (1991)8, en el cual se

identifican cinco categorías generales de competencias o competencias transversales a

saber: 1) Gestión de Recursos consistente en el manejo de tiempo, dinero, materiales y

distribución personal ; 2) Relaciones Interpersonales, consistente en trabajo en equipo,

enseñanza a otros, servicio a clientes, despliegue de liderazgo, negociar y trabajar con

personas diversas; 3) Gestión de Información, consistente en buscar y evaluar información,

organizar y mantener sistemas de información, interpretar y comunicar, usar computadora;

4) Comprensión Sistemática, consistente en comprender interrelaciones complejas,

entender sistemas, monitorear y corregir desempeños, mejorar o diseñar sistemas y 5)

Dominio Tecnológico, consistente en seleccionar tecnologías, aplicarlas en la tarea, dar

mantenimiento y reparar equipos. Este enfoque vertido hacia el trabajo, puso en evidencia

la necesidad de que tanto la empresa, como el sector educativo y gubernamental pudieran

7 Elementos constitutivos. Competencias; 2003. http://www.edutec.es/edutec01/edutec/comunic/TSE09.html 8 El reporte SCAN Secretary’s Commission on Achieving Necessary Skills 1991, expresa que las competencias

laborales que se requieren, fácilmente se pueden relacionar con las competencias que los estudiantes construyen en la educación superior: En su investigación Workplace Basics 1990, Carnavale, Gainer y Meletzer identifican 7 competencias básicas que se requieren en el trabajo: Competencias laborales: Aprender a aprender; Competencia en lectura, para expresarse por escrito y en nuevas tecnologías; Comunicación: habilidades para saber escuchar y expresarse oralmente; Adaptabilidad: resolución de problemas y pensamiento creativo; Autogestión: autoestima, motivación y proyección de metas, servicio, desarrollo profesional; Eficiencia en trabajo con grupos: interdisciplinarios, habilidades para negociar y trabajar en equipos; Autoridad: habilidades para organizar y de liderazgo.

Page 13: Avances 228. Amelia Márquez

A v a n c e s

11

sintonizar sus programas de tal manera que pudieran los egresados de las universidades

ser competentes y no sólo conocedores.

En 1994 se forma el Comité Conjunto sobre Prácticas Educativas el cual fue conformado

por American Psychological Association (APA), Educational Research, Association (AERA)

y el National Council of Measurement Educatión (NCME), este comité tuvo a su cargo la

publicación del Manual de Estándares de Pruebas. En México el Centro Nacional para la

Evaluación de la Educación Superior (Ceneval) publicó la versión nacional de las normas

en el documento llamado Estándares de Calidad para Instrumentos de Evaluación

Educativa (2000)9. Para vigilar que la normatividad se cumpla en la construcción de

instrumentos de medición educativa, sean para exámenes de admisión, diagnóstico,

ubicación o certificación. El Instituto Nacional Peruano para la Evaluación de la Educación

instrumentó mecanismos de control en sus exámenes para la Calidad y el Logro Educativos

(Excale)10, buscando con ello asegurar el seguimiento de la norma, así como la validez de

los resultados e interpretaciones.

Así como en el campo de la psicología podemos destacar una rama o especialización

denominada Psicometría encargada del estudio de los métodos, técnicas y teorías

implicadas en la medición de variables psicológicas, en Educación no existe una

especialización tan concreta algo así como la Edumetría. Por lo tanto y dadas las

variables estudiadas en educación y su semejanza a las que se trabajan en psicología se

ha aplicado el mismo sistema teórico-metodológico para la medición de variables y 9 Instituto Nacional para la Evaluación de la Educación, Manual Técnico para la Validación de Reactivos, p. 3 10 Excale, contiene una tabla que resume las decisiones adoptadas por el Comité Académico respecto a la planeación

de la prueba. En ella se especifican las líneas de evaluación, las áreas temáticas, los temas y subtemas cuyo dominios serán evaluados, el número de especificación de reactivos necesario para evaluarlo, asi como el número y tipo de reactivos que será necesario construir para responder a cada especificación. La tabla de contenido presenta la estructura general del examen.

Page 14: Avances 228. Amelia Márquez

A v a n c e s

12

contenidos educativos, de ahí que se considere la funcionalidad y pertinencia en la

evaluación de competencias básicas universitarias.

La Ciencia y la empresa piden inteligencia en lugar de acumulación de saberes que

aportan un porcentaje menor al esperado por la empresa cuando de aplicación de los

mismos se trata. Para que los centros educativos pasen de ser transmisores de

información a formadores estimuladores de las múltiples inteligencias personales, se

requiere de un cambio en la currícula educativa, además de un cambio de paradigmas

sobre la enseñanza. Recientemente en el proyecto europeo sobre investigación de

universidades, se realizó una encuesta sobre las capacidades genéricas que las

empresas piden de los egresados universitarios, [arrojaron] las 17 siguientes

capacidades por orden prioritario.11

1. Capacidad de aprender.

2. Capacidad de aplicar los conocimientos en la práctica.

3. Capacidad de análisis y síntesis.

4. Capacidad para adaptarse a las nuevas situaciones.

5. Habilidades interpersonales.

6. Capacidad para generar nuevas ideas (creatividad).

7. Comunicación oral y escrita en la propia lengua.

8. Toma de decisiones.

9. Capacidad crítica y autocrítica.

10. Habilidades básicas de manejo de la computadora.

11 Mestizo Cósmico, Las competencias básicas para la sociedad del conocimiento, en www.mestizos.net

Page 15: Avances 228. Amelia Márquez

A v a n c e s

13

11. Capacidad de trabajar en equipo interdisciplinario.

12. Conocimientos generales básicos sobre el área de estudio.

13. Compromiso ético (valores).

14. Conocimientos básicos de la profesión.

15. Conocimiento de una segunda lengua.

16. Apreciación de la diversidad y multiculturalidad.

17. Habilidades de investigación.

Hasta ahora, parece que los centros universitarios se apegan más a las características

enmarcadas en los niveles 14 al 17, dejando de lado la formación para la creación de

autodisciplina, aplicación de su potencialidad, lo que se conoce como la aplicación de las

inteligencias múltiples.

Teoría de la Medida

En el lenguaje de la psicometría la medida, es considerada como un elemento

matemático imprescindible en el momento de la definición operacional de conceptos

teóricos12, para la formulación precisa de las hipótesis, la constatación estricta de los

datos y la verificación experimental de las teorías. Juega asimismo un papel importante

en Psicología aplicada.13 Algunos de estos planteamientos se realizan en escala

psicológicas como las de medición de personalidad, de actitudes, entre otras, algunas

otras podrían considerarse cognitivas como en el caso de la evaluación de aprendizaje, o

de medición de la capacidad intelectual. Luego entonces se puede decir en todo proceso

12 Los conceptos no se pueden medir directamente, se miden las definiciones operativas de ese concepto, por ello los

conceptos requieren operacionalización. El Concepto se puede situar en una escala en arreglo a su complejidad y esto depende de las facetas que contenga. http://perso.wanadoo.es/aniorte_nic/apunt_metod_investigac4_7.htm

13 Análisis Factorial; aptitud; cociente de inteligencia; inteligencia; psicología aplicada; psicología diferencial; psicología pedagógica; psicología del trabajo; psicodiagnóstico; psicotecnia; test psicológico.

Page 16: Avances 228. Amelia Márquez

A v a n c e s

14

en el cual se encuentre involucrada la creación de pruebas y el concepto de medida se

hace referencia a la utilización estadística en la medición de confiabilidad y validez y se

apoyan en representaciones empíricas, cognitivas y perceptuales. En psicometría se

considera el …medir [como] el contar, comparar una unidad con otra, dar una valoración

numérica, asignar un valor, asignar números a los objetos. Todo lo que existe está en

una cierta cantidad y se puede medir. Estos no se asignan de forma arbitraria sino que

se rigen por ciertas reglas, se establece un sistema empírico y éste da lugar a un sistema

formal.14

Dentro de la teoría de la medida para clarificar si la medición es realmente posible se

hizo necesario el desarrollo de una teoría acerca de lo que significa medir, especificando

los tipos de medidas posibles, cuales son deseables para una ciencia y a cuales se

puede pretender desde el punto de vista de la psicología y su aplicación a otras ciencias,

entre ellas la pedagogía. Se han generado por lo menos tres grandes perspectivas

históricas que en enfocan el concepto de la medición (Abad, 2007; Jáñez, 1989): el

Idealismo Platónico, la Teoría de las Escalas de Medida y la Teoría Representacional.

Desde el enfoque que se marca en el Idealismo Platónico, medir se caracterizaba por

asignar al objeto el número que representaba la cuantía verdadera de la propiedad que

se medía (es decir, su magnitud), considerando que en la realidad existen dichas

magnitudes. Tanto Pitágoras como Platón afirmaban que todas las cosas se podían

transformar en números, que los números representan cantidades, en cambio Aristóteles

afirmaba que la esencia de las cosas era cualitativa. En el s. XIX, Newton impone lo que

14 www:aniorte-nic.net

Page 17: Avances 228. Amelia Márquez

A v a n c e s

15

se ha conocido como el imperativo cuantitativo que ayudó a dar sentido a muchos

fenómenos psicológicos apoyándose en las matemáticas.

Aristóteles consideró la cantidad como la categoría fundamental de la realidad, así,

dividió las cantidades en discretas y continuas. Las discretas eran los números naturales

los cuales no los consideraba elementos de un sistema formal pero sus propiedades

comunes formaban clases o conjuntos, por ejemplo, el número 2 era lo común de todos

los pares de cosas. Las continuas, que llamaba magnitudes, las utilizaba para intentar

designar variables como la longitud, el tiempo, el peso, el volumen, etc. Dichas

categorías, se diferenciaban por el hecho de que un valor de una magnitud está

compuesto por partes aditivas mientras que un número natural está compuesto de una

única parte; según lo cual, las magnitudes pueden ser divididas infinitamente, por esa

razón las llamó variables continuas. Su estudio le llevó a trabajar con otro concepto que

denominó magnitud relativa, que se basaba en el uso de equivalencias y razones.

González Barberá (2006)15.

En el campo de la medida en psicología Fechner (1860) 16 fue una figura importante

dado su enfoque en la medida, en inicio física y posteriormente en la intensidad de las

emociones. Su enfoque de medición refleja una postura tradicional: la medida de una

cantidad consiste en descubrir cuantas veces una magnitud de referencia está contenida

en otra. Esta filosofía queda formalizada en los axiomas de cantidad de Hölder (1901),

que especifican cuando una magnitud es susceptible de ser medida. Para que lo sea, 15 http://www.ucm.es/info/funvalor/docs/medida.pdf, Gonzalez Barberá (2007) Naturalez de la Medida en Educación,

ED. Universidad Complutense de Madrir 16 El comienzo formal de la psicología experimental lo encontramos en la obra de Gustav Theodor Fechner (1801-

1887) que encontramos . Antes de Fechner, como dice Boring (1950), había solo fisiología psicológica y psicología filosófica. Fue Fechner "quien realizó con rigor científico los primeros experimentos que pusieron las bases para la nueva psicología y su metodología" (p. 275).

Page 18: Avances 228. Amelia Márquez

A v a n c e s

16

hace falta que se pueda definir la operación de concatenación entre cantidades. En el

caso de la longitud, sí se cumple que la longitud del objeto resultante de unir dos objetos

es la suma de sus correspondientes longitudes. Una propiedad que satisfaga estos

axiomas es denominada “extensiva” y posee una estructura aditiva (Narens y Luce,

1986).

En la Teoría de las Escalas de Medida Stevens (1946)17. Define medir como asignar

números a los objetos de acuerdo con una regla. Mediante esta definición lo que se

indica es que los números no representan cantidades, sino relaciones. Considerándose

la existencia de un homomorfismo18 entre el sistema de números asignados y el sistema

empírico del atributo representado, aunque el homomorfismo podía darse en cuanto a

otras características de los números distintas de la adición. De esta manera, se libró del

concepto de concatenación y redefinió la medición como un modo de representación. En

concreto, definió cuatro posibles reglas de asignación que daban lugar a cuatro escalas

de medida: A) la escala “nominal”, en la que sólo se considera la propiedad de identidad

de los números asignados (1 es distinto de 2, 2 es distinto de 3…); B) la escala “ordinal”,

en la que se considera además la propiedad de orden (1 es menor que 2, 2 es menor

que 3…); C) la escala de “intervalo”, en la que el cociente entre diferencias indica

cuantas veces está contenida una en la otra (la diferencia entre los números 10 y 4

contiene tres veces la diferencia entre 7 y 5); y D) la escala de “razón” en la que el

17 Stevens, S.S., (1946) On the Theory of Scales of Measurement, Cience. 18 Un homomorfismo, (o a veces simplemente morfismo) desde un objeto matemático a otro de la misma categoría,

es una función que es compatible con toda la estructura relevante. La noción de homomorfismo se estudia abstractamente en el álgebra universal. Una noción más general de morfismo se estudia abstractamente en la teoría de las categorías. Por ejemplo, si un objeto consiste en un conjunto X con un orden < y el otro objeto consiste en un conjunto Y con orden {, entonces debe valer para la función que, si u < v f ( u ) { f ( v ).

Page 19: Avances 228. Amelia Márquez

A v a n c e s

17

cociente entre los números indica cuantas veces está el menor contenido en el mayor (el

8 contiene cuatro veces el 2).

Las propiedades extensivas se corresponden con los niveles de medida de razón y de

intervalo (Jáñez, 1989). El planteamiento de Stevens es menos restrictivo que el de

Campbell y abre posibilidades a la medición científica en Psicología. Sin embargo,

Stevens no proponía qué relaciones empíricas debían satisfacer los objetos en cuanto al

atributo que se pretendía medir. Durante la segunda mitad del siglo XX se fraguó una

nueva teoría axiomática de la medición: la Teoría Representacional, que es el paradigma

dominante hasta la actualidad. 19 En esta teoría se establece un homomorfismo entre las

relaciones de los números que se asignan a los objetos -sistema relacional numérico- y

las relaciones empíricas entre los objetos -sistema relacional empírico-, donde medir

implica utilizar el sistema numérico para, mediante el homomorfismo, representar el

sistema de relaciones empíricas. En contraste con el trabajo de Stevens, se hace un

mayor énfasis en las condiciones que debe satisfacer ese sistema relacional empírico

antes de atribuirle una escala de medida.

Test instrumento de evaluación

En los Standards for Educational and Psychological Testing -AERA, APA y NCME-

(1999), definen Test como “un aparato o procedimiento evaluador por el que se obtiene

una muestra de la conducta de los examinados en un dominio específico, que es a

continuación evaluada y puntuada siguiendo un proceso estandarizado”. Al respecto

Anne Anastasie refiere que a pesar de sus diferencias superficiales –entre las diferentes

19 ésta se encuentra exhaustivamente desarrollada en los tres volúmenes de la obra “Foundations of Measurement”

(Krantz, Luce, Suppes y Tversky, 1971; Luce, Krantz, Suppes y Tversky, 1990; Suppes, Kranz, Luce y Tversky, 1989)

Page 20: Avances 228. Amelia Márquez

A v a n c e s

18

pruebas , sus objetivos y usos- todas esas pruebas constan de muestras de conducta del

individuo y cada una debe probar su valor con la demostración de una correspondencia

empírica entre el desempeño del examinado de la prueba y en otras situaciones o

desempeño laboral.20 Mientras que el término test se reserva por lo general para los

instrumentos en los que se evalúa lo correcta que es o la calidad de la respuesta, y los

términos escalas o cuestionarios se aplican a la medida de las actitudes, intereses o

disposiciones, lo común es utilizar el término Test para referirse a todos los anteriores

instrumentos evaluadores. Precisamente por seguir los procedimientos estandarizados,

una de sus fortalezas es que permiten que cada individuo obtenga la puntuación que le

corresponde, sin que resulte afectada por los juicios subjetivos que pueda tener el

evaluador sobre él (Colom, 1995).

Además de los test de personalidad, de inteligencia, de intereses, de motivación, de

actitudes, de percepción, también se considera un test un examen de opción múltiple e

incluso un examen de preguntas abiertas si se evalúan de forma estandarizada21.

También debe quedar claro que no todo procedimiento de evaluación es un test, por

ejemplo la mayoría de las encuestas no lo son, al no tener conjuntos de preguntas que

se planteen como indicadores de variables psicológicas latentes de los encuestados que

interese medir. Tampoco es un test una entrevista ordinaria, pues no tiene el carácter de

procedimiento estandarizado en la recogida y análisis de las respuestas, tampoco lo es

un examen para evaluar el contenido de una clase, o el cúmulo de conocimiento que

sobre ella hayan logrado los alumnos, tampoco lo es el registro de la habilidad de un

trabajador ante un determinado instrumento. Un test, entonces para que sea considerado

20 Anastasi, Anne, Urbina Susana, (1998), Test Psicológicos, p.33. 21 Utilización de los mismos criterios de aplicación, revisión y evaluación para todas las personas a las que se les sea

aplicado.

Page 21: Avances 228. Amelia Márquez

A v a n c e s

19

como tal requiere de la aplicación estricta tanto de teoría, metodología y técnica

específica para el contenido y contexto que se pretende medir.

Fiabilidad o Consistencia

Para determinar la calidad de un instrumento de medición se deben realizar

estudios de fiabilidad o consistencia y de validez. Los primeros tienen que ver con el

análisis del error de medida, refieren cuán importante es el error de medida en las

puntuaciones que son registradas en un determinado test. Las dos principales teorías

son la Teoría Clásica y la Teoría de la Respuesta al Ítem o también llamada la Teoría del

Rasgo Latente tienen sus propios indicadores de fiabilidad. Los estudios de fiabilidad se

refieren al atributo de consistencia en la medición, denota algo que es consistente, no

necesariamente consistentemente bueno o malo sino consistente22 y se obtiene a través

de la aplicación del Coeficiente de Consistencia Interna entre los cuales ubicamos los

que son aplicables en muestras contrastadas, formas alternativas, división por mitades y

la confiabilidad entre evaluadores. Así la falta de confiabilidad en un test está en relación

directa con la intervención del error, considerado éste como cualquier efecto irrelevante

para los fines o resultados de la medición. El error se considera de dos tipos: 1) error

constante o sistemático que es producido cuando las mediciones que se obtienen con

una escala son sistemáticamente mayores o menores que lo que realmente debe ser y 2)

error causal al azar o no sistemático que se produce cuando las medidas son

alternativamente mayores o menores de lo que realmente deben ser. En este último error

intervienen factores tales como las condiciones médicas de quien responde y que

pueden alterar la visión, la fatiga, incrementar la tensión emocional, la inatención, el fallo

22 Cohen, Ronald Jay, Mark, E., Swerdlik, (2001), Pruebas y Evaluación Psicológicas: introducción a las pruebas y a la

medición, p. 154

Page 22: Avances 228. Amelia Márquez

A v a n c e s

20

en la memoria, o también se pueden considerar –cuando ha habido varias aplicaciones,

la familiaridad que se tenga con el test-, asimismo se consideran intervenciones que

alteran la fiabilidad las condiciones externas de calor, luz, humedad, ventilación, frío, olor

del medio ambiente, comodidad de las sillas, entre algunas otras (Ray, 1972; Brown,

1982)23.

La confiabilidad de una prueba se obtiene a través del Coeficiente de Confiabilidad (r xx)

y del error estándar de la medida (EEM), el cual es obtenido a través de la siguiente

fórmula: (EEM = s 1rx) x donde s= Desviación estándar de los puntajes de la

distribución; rxx = Coeficiente de confiabilidad del test;1 = Constante. Una vez obtenido el

EEM, se debe elegir el nivel de confianza: Nivel de confianza del 68% = PD ± 1 EEM;

Nivel de confianza del 95% = PD ± 2 EEM.24

En la medición psicométrica, se aplican tanto la teoría, la metodología como las técnicas

a casi cualquier situación que se desee o necesite ser medida, sea en el ámbito de la

psicología, la pedagogía, el derecho, etc., y considerando el principio fundamental de la

competencia como…la capacidad de un sujeto para realizar una tarea que exige activar

una serie de recursos que se manifiestan en su comportamiento eficiente.25

Dentro de las competencias laborales ubicamos las transversales – la comunicación, la

resolución de problemas, el razonamiento, la capacidad de liderazgo, la creatividad, la

23 Aliaga, Tovar, Jaime, Psicometría, Test Psicométricos: Confiabilidad y Validez, véase en:

http://www.unmsm.edu.pe/psicologia/documentos/documentos2007/libro%20eap/05LibroEAPAliaga.pdf 24 Para el nivel de confianza del 68% la interpretación sería: "Podemos concluir, con un 68% de confianza, que el puntaje verdadero de un sujeto está en la zona o intervalo comprendido entre su puntaje directo u obtenido (PD) y ± 1

EEM". El nivel de confianza más usado en psicometría es el del 95%: "el puntaje verdadero de un sujeto se encontrara en el intervalo comprendido entre su puntaje obtenido o directo (PD) y ± 2 EEM".

25 Mertens (1996), citado en Emergencias y Actualidades de las Competencias.

Page 23: Avances 228. Amelia Márquez

A v a n c e s

21

motivación, el trabajo en equipo y especialmente la capacidad de aprender- y personales

- centradas en la capacidad para trabajar en equipos y de integración en equipos

multidisciplinares, adquisición de valores éticos en el manejo y uso de la información- ,

que fueron consideradas en la creación del instrumento para la medición de las

Actitudes26 de Conductores de Transporte Público (Márquez, 2004)27, en éste se aplicó

tanto la Teoría Clásica de los Test como la Teoría de la Medida. Se utilizó la técnica de

Rasgos Sumarizado descrito por Rensis Likert28, la confiabilidad se obtuvo a través de

la Consistencia Interna con Sistema de Muestras Contrastadas o Contraste de Grupos

Extremos los cuales se obtuvieron a partir del total de las 259 aplicaciones con 132

reactivos en una matriz de doble entrada, donde en la columna se situaron los reactivos y

en la línea cada uno de los sujetos participantes, se generó la sumatoria lineal, la cual se

agrupó por distribución de frecuencia, obteniendo así una distribución de puntuaciones

altas y bajas. Del total de la sumatoria se consideró el 25% de calificación más alta que

representaron los sujetos con una aceptable actitud –Grupo A- se consideró el grupo de

25% de calificación más baja que representaron una no aceptable actitud –Grupo B-.

Para aceptar como discriminativo positivo se consideró un mínimo de .70 que supone

una correlación de .836 con las puntuaciones verdaderas. Para la obtención del Poder

Discriminativo de cada reactivo se aplicó la formula:

26 Actitudes han sido definidas como aquella forma de pensar o de comportarse hacia una idea, objeto, persona o

grupo de semejantes (Mc Conell, 1978, p.91), quedan implícitos tres elementos el cognitivo, el afectivo y el comportamental. El Cognitivo seria aquello que se piensa acerca del objeto de la actitud. Desde un punto de vista cognitivo puede pensarse que algo esta bien o que esta mal independientemente de lo que luego se haga, porque puede suceder que afectivamente se sienta movido en otra dirección. El elemento afectivo haría referencia a aquello se que siente, que gusta o disgusta, sin embargo, pude sentirse que algo gusta o disgusta sin que necesariamente se actúe en la dirección que apunte ese sentimiento, porque racionalmente se considere que no es conveniente.

El comportamiento o reactivo en las actitudes, se quiere significar que no basta que algo parezca bien o mal, guste o disguste sino que esto lleva de una manera u otra a actuar en consecuencia.

27 Márquez, Jurado Amelia, Medición de Actitudes en Conductores de Transporte Público, Caso Concesionaria Fronteriza, Municipio de Cd. Juárez, (2004), pp. 44-46

28 Aiken, Lewis, R., (2003) Test psicológicos y evaluación, 294-300

Page 24: Avances 228. Amelia Márquez

A v a n c e s

22

A - B PD=

½ N

Para la obtención del Grado de Dificultad de los reactivos se aplicó la siguiente fórmula

A + B GD=

N X 100

Se corrió como dato adicional la media, la desviación estándar de cada ítem y la

distribución de frecuencia así como la t de Student, y la significancia de la matriz de dos

entradas. En el siguiente cuadro se hace referencia a los datos arrojados para las 5

dimensiones que conforman el instrumento. Los reactivos que presentan un (*) son

aceptables, los que presentan (**) son excelentes además de ser significativos al nivel de

aceptación de .05 o <.

Tabla # 1 Confiabilidad de las Dimensiones de la Escala de Actitud de CHTP

Alpha de División por Escla Reactivos Cronbach Mitades

Ansiedad y Tensión 110, 112, 114, 115, 116, 118, 119, 120, 121, 123 ** 0.84 0.89

Capacitación 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 ** 0.81 0.88

Compañerismo 99, 100, 101, 102, 103, 104, 105, 106, 107, 108 * 0.73 0.76

Responsabilidad 7, 8 ,12, 14, 33, 44, 52, 53, 55, 58 ** 0.80 0.81 Tolerancia 65, 70, 71, 72, 74, 77, 79, 83, 85, 86 * 0.78 0.83

Fuente: Márquez Jurado Amelia, Op. Cit. p. 56.

Page 25: Avances 228. Amelia Márquez

A v a n c e s

23

Para la obtención del Coeficiente Alpha de Cronbach29 se aplicó la siguiente fórmula:

r= k Σ S²i

α k-1 1-

S²sum

Donde k es el número de ítems de la prueba, i S es la varianza de los items (desde 1...i)

y 2

sum S es la varianza de la prueba total.

Para la obtención de la División por Mitades se sumaron las puntuaciones de los

reactivos pares y las puntuaciones de los reactivos nones, ambos se correlacionaron al

resultado se le aplicó la fórmula de corrección de Sperman-Brown:

r = nr xy

SB

1+(n-

1)rxy

Donde (r SB) es igual a la confiabilidad ajustada por la fórmula de Sperman-Barun,(rxy)

es igual a la (r) de Pearson en la prueba con la longitud original y (n) es igual al número

29 El coeficiente Alfa, desarrollado por Cronbach en 1951 y ampliado en lo subsecuente por otros como Kaiser y

Michael eb 1975; Noveick y Lewis en 1967, este coeficiente puede considerarse como la media de todas las correlaciones de división por mitades posibles, las buenas junto con las malas, corrgida por la fórmula de Spearman-Brown. Es apropiado para usarse en pruebas que contienen reactivos que no son dicotómicos, reactivos que pueden calificarse en forma individual o a lo largo de un rango de valores. Cohen Ronald Jay, E., Swerdlik, Op. Cit., 154, 166

Page 26: Avances 228. Amelia Márquez

A v a n c e s

24

de reactivos en la versión revisada dividido entre el número de reactivos en la revisión

original.

Una vez obtenido el índice de confiabilidad en cada una de las Dimensiones del

instrumento o escala de medición de Actitudes para Conductores de Transporte Público

se consideró que el instrumento mantuvo una confiabilidad equivalente a 0.84, 0.82,

0.73, 0.80 y 0.78 para cada una de las Dimensiones arriba referidas, lo cual se considera

suficiente para ser utilizado en las empresas que requieren seleccionar al personal,

conocer las actitudes presentadas por sus empleados, orientar la capacitación en función

de los resultados, contando con una confianza de .05 o <.

Hemos constatado que los indicadores de la fiabilidad presentan algunos cambios en las

diferentes teorías de los tests, sin embargo, se puede decir que es un concepto que si

está presente en toda prueba que pretenda tener la categoría de Test. Al respecto Muñiz

(1988) menciona, en relación con los Test que:

1) “Las consecuencias de los tests pueden ser de más o menos trascendencia para

quien los responde. Del resultado de un test puede depender la admisión o rechazo en

un proceso de selección, recibir una acreditación profesional, la calificación final en un

examen... Un primer aspecto a tener en cuenta es que antes de aplicar un test se ha de

tener información que justifique el uso que se va a hacer de sus puntuaciones. La

utilización de un test en un proceso selectivo requiere que previamente se haya mostrado

que el rendimiento laboral en el puesto depende del rasgo que vamos a medir.” En el

caso de las competencias básicas universitarias se considera que el desarrollo de los

Page 27: Avances 228. Amelia Márquez

A v a n c e s

25

alumnos debe estar acorde a las necesidades sociales, laborales e universitarias para

que su aprendizaje sea para la aplicación tanto en su vida personal, social como laboral;

2) “Todo test ha de muestrear adecuadamente el dominio que quiere medir. En un test

de calidad de vida, habrá que obtener respuestas que informen de la salud, del bienestar

laboral y económico y de todas las áreas que tengan que ver con la calidad de vida, no

puede quedar fuera, por ejemplo, lo relativo a la red familiar y social”. Si es en el caso de

las competencias básicas universitarias consideraríamos que debe muestrear los

factores cognitivo, habilidades de comunicación, capacidades para aplicar lo conocido al

área práctica, dominio del área a desarrollar, además de actitudes y valores.

3) finalmente se recomienda un “… estudio que muestre que las puntuaciones del test se

relacionan como cabe esperar, según la teoría psicológica, con otras medidas”. En el

caso de las competencias básicas universitarias se pretendería que las puntuaciones

fueran arrojando datos longitudinales de desarrollo, habiendo diferenciales ascendentes

del inicio de la carrera al término de la misma.

Validez

Refiere Morales Vallejo (2000)30 que para entender a lo que se le puede referir

como Teoría Convencional de la Validez, habría que considerar las recomendaciones

técnicas de la American Psychological Association (A.P.A.), en la década de los años

cincuenta estableció un comité el cual tenía a su cargo poner orden y estabilizar las

definiciones que existían sobre el concepto de Validez. Hacia la década de los años

sesenta la A.P.A. reconoce la Validez de Contenido, de Criterio tanto concurrente como

30 Morales, Vallejo,Pedro (2000) Medición de actitudes en psicología y educación, ED Comillas, 2ª ed, Madrid. Pp. 426-

427.

Page 28: Avances 228. Amelia Márquez

A v a n c e s

26

predictiva y de Constructo. La de Contenido se refiere a la relevancia de los ítems o al

grado en que los ítems de una escala representan un determinado universo temático –

representatividad y relevancia-, -validez lógica o intrínseca- son expresiones que se

emplean en el mismo sentido. La Validez de Criterio se refiere directamente a los

coeficientes de correlación con otras medidas o criterios, suele dividirse en concurrente

donde ambas medidas se obtienen simultáneamente y predictiva donde la medida en el

criterio es posterior. En el caso del concepto de Validez de Constructo surge, como

explica Nunnally (1978, p. 91-109) de la limitación de la validez de contenido cuando se

aplica a la medición de rasgos, actitudes, etc., aplicable a conceptos abstractos que

resumen consistencias conductuales y actitudinales. El proceso de validar un constructo

es, según Stenner, Smith y Burdick (1983) el proceso de adscribir significados a las

puntuaciones obtenidas con un determinado instrumento, siendo más necesario cuando

aumenta el grado de absorción de la variable medida.31

La descripción más genérica y aceptada sobre el concepto de validez es aquella que

refiere que una prueba es Valida cuando mide lo que dice medir. La validez está

establecida tanto sobre lo que una prueba dice que pretende medir, como a la referencia

que hacen los puntajes obtenidos, a conocer si es válido el uso que se le está dando al

Test así como la interpretación que se esté haciendo de los puntajes obtenidos y si se

pueden realizar generalizaciones a partir de los resultados obtenidos (Thorndike, 1989).

31 Morales Vallejo, Ibidem. pp. 427-428.

Page 29: Avances 228. Amelia Márquez

A v a n c e s

27

Para la obtención de la Validez de un instrumento o Test32 se requiere de la aplicación de

un Proceso de Validación en el cual interesan en principio, los errores constantes o

sistemáticos y en la confiabilidad interesan los errores aleatorios o no sistemáticos. En

términos estadísticos la Validez está definida como la proporción de la varianza

verdadera que es relevante para los fines del examen y es susceptible de ser medida

mediante la relación entre sus puntuaciones con alguna medida de criterio externo o

también con la extensión con la que la prueba mide un rasgo subyacente específico

hipotético, denominado en psicometría como Constructo. La validez de Constructo está

referida al grado en que cada prueba refleja el contenido que dice medir, elaborándose

operativamente de tal forma que se puedan realizar inferencias acerca de conductas o

atributos que pueden agruparse bajo la etiqueta de un contexto particular (APA).

La validez de Constructo está relacionada con cinco aspectos, a saber: 1) el contenido

referido a su relevancia y representatividad; 2) lo sustantivo referido a razones teóricas

de la consistencia observada de las respuestas; 3) lo estructural relacionado a la

configuración interna del test y dimensionalidad; 4) generalización referido al grado en

que las inferencias a partir del resultado del test se pueden generalizar a otras

poblaciones, situaciones o tareas y 5) consecuencia relacionado con la ética y el aspecto

de deseabilidad social y disminución de la aquiescencia33. (Messick 1995, citado en

Psicometría, Test Psicométricos).

32 En términos psicométricos, la validez es un concepto que ha pasado por un largo proceso evolutivo, desde aquella

posición que sostenía que “un test es válido para aquello con lo que correlaciona” (Guilford, 1946, citado en Muñiz, 1996, p. 52), hasta la más reciente que la entiende como un juicio evaluativo global en que la evidencia empírica y los supuestos teóricos respaldan la suficiencia y lo apropiado de las interpretaciones y acciones en base a los puntajes de las pruebas, que son función no sólo de los ítems sino también de la forma de responder de las personas así como del contexto de la evaluación. Aliaga, Tovar, Jaime, Psicometría, Test Psicométricos: Confiabilidad y Validez, Op. Cit.,

33 Aquiesencia: tendencia de algunos sujetos a responder afirmativamente (de acuerdo) con independencia del contenido del ítem incluso mostrando acuerdo con afirmaciones de signo opuesto. Se trata de un estilo o modo de responder que invalida la información que aparentemente está presente en las respuestas y en este caso una

Page 30: Avances 228. Amelia Márquez

A v a n c e s

28

En relación con la validación; el proceso que se siguió en la validación del instrumento

para medir Actitudes de Choferes de Transporte Público, se utilizó la Validez de

Contenido - la cual efectivamente, hace referencia al juicio concerniente a lo bien que

mide la prueba, lo que pretende medir… juicio basado en evidencia sobre lo apropiado

de las inferencias extraídas de las puntuaciones de prueba (Lewis Aiken, citado en

Márquez , 2004, p.41)-. El instrumento se validó utilizando el criterio de diagnóstico

realizado por un grupo de personas involucradas en la problemática tanto de la

elaboración de pruebas como en la selección y contratación de personal, ellos fueron

considerados como expertos en el área. A este grupo asignado se les ofreció: 1) las

definiciones específicas de términos y categorías del cuestionario; 2) se les pidió que

seleccionaran para cada reactivo la dimensión a la cual consideraban que pertenecía.

Para la selección de los jueces consideraron personas que por su trayectoria académica

y laboral conocieran del tema y pudieran emitir un juicio con base en conocimiento.

Además de constar que su relación fuera mínima o nula con los sujetos objeto de

aplicación de la muestra, con la cuan se alcanzó la objetividad del criterio.

Para la obtención de deseabilidad social, tomando en consideración que cualquiera de

los rasgos o características personales que típicamente expresan los ítems se pueden

situar a lo largo de un continum en cuyos extremos se encontraría la máxima

deseabilidad social y en la otra la mínima deseabilidad social. Para tal efecto se reunió a

un total de 10 jueces, los cuales deberían asignar a cada ítem o constructo una

respuesta afirmativa no indicaría acuerdo genuino con la afirmación contenida en el ítem sino que sería simplemente una manifestación de dicha tendencia del sujeto. Morales Vallejo Pedro (2000)p. 141-143

Page 31: Avances 228. Amelia Márquez

A v a n c e s

29

calificación. A diferencia del método utilizado por A. Edward 34 quien es considerado

como el autor inicial más conocido y citado por sus estudios sobre la deseabilidad social,

se les pidió a los jueces que con base en las definiciones operacionalizadas de cada

dimensión de las que consta el instrumento de medición de actitudes de choferes de

transporte público, designaran a cuál de ellas correspondía cada reactivo, se consideró

que si el contenido de cada uno estaba construido bajo un criterio de aceptación o

rechazo social estos deberían mantener sus características de apego a una normatividad

social, por lo que cada uno de los jueces en la lectura de los reactivos debería quedarle

claro a que dimensión de actitud se hacía referencia.

A diferencia de Edwards que considera la deseabilidad social a través de un grupo de

jueces los cuales marcan con un número de 5 a 0 la aceptación o el rechazo, siendo el

reactivo aceptado en mayor o menor medida de deseabilidad o aceptación de actitudes

positivas o negativas, en este caso se buscó comprobar si el reactivo respondía con

claridad a la dimensión a la que se estaba destinado, siendo esta parte una de las

necesidades básicas de validación que se pretendía y logró comprobar, dado que cada

una de ellas fueron elegidas con base en la experiencia empírica y documental surgida

de las actitudes de conductores de transporte público documentadas en publicaciones

periódicas, de esta forma los resultados se cuantificaron para considerar como válidos

sólo aquellos reactivos que cumplieron con la norma del 80 al 100 % de aceptación del

grupo de jueces.

34 Morales Vallejo, Pedro, Medición de Actitudes en Psicología y Educación p. 141, 243, 206, citado en Marquez Jurado Amelia, (2004) Op. Cit. p.37

Page 32: Avances 228. Amelia Márquez

A v a n c e s

30

Los resultados obtenidos en esta validación de deseabilidad social fue la siguiente: de

180 reactivos se eliminaron 57 los cuales no cumplieron con el criterio de validación. De

los 132 reactivos restantes 63 de ellos correspondieron a la dimensión de

responsabilidad; 23 a la de tolerancia; 12 a capacitación; 10 a compañerismo y 15 a

ansiedad y tensión. De las dimensiones inicialmente planteadas se agruparon los

reactivos correspondientes a manejo de sexualidad, respeto, abuso de sustancias y

responsabilidad en una sola dimensión determinándose de responsabilidad.

El Valor Diagnóstico o Predictivo del instrumento de medición se demostró en relación al

funcionamiento del instrumento aplicado, como un indicador de las actitudes en relación

con la correspondencia empírica estrecha entre las actitudes de los choferes y el apego a

las normas empresariales, municipales y estatales además del criterio utilizado para la

formulación del instrumento. Los resultados de evaluación posteriores a la aplicación de

la muestra se muestran en la Figura # 1, con resultados que arrojaron los siguientes

porcentajes de actitudes:

Figura # 1 Actitudes de Choferes de Transporte Público 11% Favorable 33% Ligeramente Favorable 39% Ligeramente Desfavorable 14% Desfavorable 3% Muy desfavorable

Page 33: Avances 228. Amelia Márquez

A v a n c e s

31

Siendo una de las consideraciones finales que el instrumento resultó adecuado para la

medición de actitudes de los chóferes, ofreciendo una muestra representativa del

ambiente actitudinal que presentaron los trabajadores de la Concesionaria Fronteriza35

Estandarización

Ronald Hay Cohen (1988) refiere que el proceso de aplicar una prueba a una

muestra representativa de personas que las responden con el propósito de establecer

normas se conoce como estandarización de una prueba. Un instrumento de medición se

reconoce que está estandarizado cuando presenta procedimientos claros y definidos

tanto para su administración, calificación y datos normativos...el establecimiento de un

conjunto estándar de instrucciones y condiciones bajo las cuales se administra la prueba

hace que las puntuaciones de la muestra de estandarización normativa puedan ser

comprobables con las puntuaciones de quienes responderán la prueba en el futuro.

Regresando a la construcción del instrumento de medición de actitudes de chóferes, se

aplicó a una muestra representativa de conductores, utilizando una muestra de

conveniencia. Como escenario de aplicación se utilizaron las instalaciones de la

empresa, dado que los empleados de transporte tienen horarios y rutas diversos los

cuales requerían de un espacio y tiempo específico para la realización de la prueba. Así

una categoría más de confiabilidad la constituyó la estandarización precisa con la que

cuenta este instrumento, otra de las ventajas establecidas cuando se cuenta con el

procedimiento de estandarización es que los resultado que se obtienen de su aplicación

35 Márquez, Jurado Amelia, (2004) Op. Cit. pp. 64, 88.

Page 34: Avances 228. Amelia Márquez

A v a n c e s

32

son susceptibles de ser comparables y comparables, así como medible al ser calificado

por cualquier persona –siempre que se siga el procedimiento-.

Como se establece en Standards for Educational and Psychological Testing “las normas

que se presenten deberán referirse a grupos descritos con claridad. Estos grupos

deberán ser aquellos con quienes los administradores de pruebas desearan de ordinario

comparar a las personas que sean examinadas.” (APA, 1985 citado en Ronald Hay C.)36

Normatividad

Cohen R. (2001) refiere…en un contexto psicométrico normas son los datos de

desempeño en la prueba de un grupo en particular de personas, que están diseñados

para su uso como referencia para evaluar e interpretar puntuaciones de prueba

individual, donde los miembros del grupo se les considera típicos con respecto a una

característica de las personas para quienes se diseña una prueba en particular. En el

caso de la prueba de actitudes, se consideró por mejor conveniencia, la obtención de

conversión de puntaje crudo a rango percentilar, el cual fue calculado por dimensión lo

que equivale a un estatus de Escala de medición37 dado que cuenta con la conversión de

36 Jay Cohen, Ronald, Swerdlik Mark, (1988) Pruebas y Evaluación Psicológicas, introducción a las pruebas y la

medición, p. 127-128 37 Una escala seria un instrumento de medición (Maynt,R., Holm,K,Hubner,P. 1983,p.63) en el cual se puede hace una

disposición de cosas distintas pero con un aspecto común(Sierra Bravo, R. 1992) de esta manera una escala de actitud seria la disposición de diferentes actitudes de mayor o menor intensidad a favor o en contra. Existen diversos tipo de escalas:Las escalas sumativas de Likert, las diferenciales de Thurston y las acumulativas de Guttman estos tres tipos de descalas tienen en común que le presentan al alumno una serie de ítems formulados como preguntas y según responda de una manera u otra se le asigna una puntuación en la actitud medida que le coloca en una escala continua de 1 a 5 normalmente. En las escalas diferenciales Thurston (1929) se caracterizan porque en ellas hay solo dos respuestas “de acuerdo” o “en desacuerdo”, previamente existe un grupo de expertos que ha dado una puntuación a cada uno de los ítems del cuestionario de acuerdo a la intensidad con la que se acerca mas a la actitud que se pretende medir. En las escalas summativas referidas por Likert (1932) miden actitudes a partir de la medición de las técnicas de la personalidad todos los ítems presentan una misma intensidad, la cual variara de acuerdo a la selección de la persona que responde. Las escalas acumulativas, tienen su origen en el modelo de Guttman (1950) también llamado escalograma los ítems tienen una determinada dificultad y el estar de acuerdo con uno implica estar de acuerdo con los precedentes, suelen tener muy pocos ítems y se utiliza para medir actitudes muy concretas.

pt.wikipedia.org/wiki/Escala_Likert

Page 35: Avances 228. Amelia Márquez

A v a n c e s

33

medida cruda a medida de actuación de una población o mejor conocida como

puntuación normalizada. Así este instrumento presenta una Normatividad Local. En

psicometría se sabe que la conversión de puntación bruta a percentil permite conocer en

que rango de aceptación o rechazo se encuentra la persona que está siendo evaluada o

seleccionada, respecto del grupo de la población local, en este caso el Municipio de Cd.

Juárez, estado de Chihuahua, México.

Para la obtención del Rango Percentil se utilizaron los datos obtenidos en cada una de

las dimensiones, aplicando la siguiente fórmula para todos los items: frecuencia (f);

frecuencia acumulada (fa); Punto medio de la frecuencia acumulada (Pmfa); Punto medio

de la frecuencia acumulada entre el número total de casos (Pmfa/n) y Punto medio de la

frecuencia acumulada entre el número total de casos por cien (Pmfa/n)(100), los

resultados obtenidos para la conversión de la puntuación directa a puntuación

normalizada se obtuvieron los siguientes resultados, presentado en la tabla # 2:

Page 36: Avances 228. Amelia Márquez

A v a n c e s

34

Tabla # 2 Datos Normativos para las Escalas de Actitud, Conductores de Transporte Público

N= 259 Rangos Percentiles

Puntaje Crudo Ansiedad

y Tensión Capacita

ción Compañe

rismo Responsabilidad Tenacidad Puntaje Crudo

18 ~ 1 ~ ~ ~ 18 19 1 ~ ~ ~ 1 19 20 ~ ~ ~ ~ ~ 20 21 ~ ~ ~ 1 1 21 22 1 1 1 ~ 1 22 23 ~ 1 1 1 1 23 24 ~ 2 ~ ~ 2 24 25 ~ ~ 1 1 2 25 26 ~ 3 2 ~ 3 26 27 1 3 3 2 3 27 28 1 4 3 2 4 28 29 2 6 ~ 3 6 29 30 3 8 4 5 8 30 31 7 10 6 8 11 31 32 9 13 8 11 14 32 33 11 16 10 14 17 33 34 13 21 17 18 20 34 35 16 26 25 21 25 35 36 19 31 31 26 33 36 37 24 36 37 33 42 37 38 31 42 45 38 50 38 39 38 49 54 44 58 39 40 48 59 63 51 66 40 41 57 69 71 57 74 41 42 63 76 79 63 79 42 43 68 83 86 70 83 43 44 73 87 90 76 87 44 45 77 89 92 81 90 45 46 81 91 94 85 92 46 47 86 94 96 89 94 47 48 89 96 97 92 96 48 49 91 97 98 95 98 49 50 96 99 99 98 99 50

Media 40.4 38.33 38.33 39.63 37.93 Media D.S. 5.7 5.63 4.87 5.8 5.56 D.S.

Fuente: Márquez Jurado, Amelia, Op.Cit. p. 59.

Page 37: Avances 228. Amelia Márquez

A v a n c e s

35

La Teoría Clásica de los Tests

Se considera que la Teoría Clásica de los Test es la que proporciona los modelos

para las puntuaciones que se obtienen del test, decimos entonces que modeliza matrices

de datos que contienen las respuestas que ya sea una muestra o grupo de sujetos han

dado a cada uno de los ítems que conforma el test. El análisis o modelado de estas

matrices de datos da como resultado: 1) la estimación del nivel en que poseen los

sujetos la(s) característica(s) que mide el test (valores escalares de los sujetos) y 2) la

estimación de los parámetros de los items (valores escalares de los items). El objetivo de

cualquier teoría de tests es realizar inferencias sobre el nivel en que los sujetos poseen

la característica o rasgo inobservable que mide el test, a partir de las respuestas que

éstos han dado a los elementos que forman el mismo. Por tanto, para medir o, mejor

dicho, estimar las características latentes de los sujetos es necesario relacionar éstas

con la actuación observable en una prueba y esta relación debe de ser adecuadamente

descrita por una función matemática.38

Dos son las principales teorías de los tests: la Teoría Clásica de los Tests (TCT) y la

Teoría de la Respuesta al Ítem o del Rasgo Latente. La primera está contenida en un

conjunto de artículos, publicados por Spearman entre 1904 y 1913. La publicación de

referencia es el libro de Gulliksen (1950). La TCT supone que cuando una persona i

responde a un test se generan tres puntuaciones: la observada (Xi), la verdadera (Ti) y el

error de medida (Ei), siendo no observables las dos últimas. (Ti) puede entenderse como

la media de las (Xi) si el sujeto respondiese al test infinitas veces en las mismas

circunstancias. Se asume que i i i X 00T 00E . Es decir, la puntuación (Xi ) incluye el nivel

38 http://www.uned.es/psico-3-psicometria/ttest.htm#que

Page 38: Avances 228. Amelia Márquez

A v a n c e s

36

real de la persona, que debiera no cambiar si se le aplicase otro test equivalente, y el

componente error. Los errores se suponen aleatorios, en ocasiones positivos y en

ocasiones negativos como ya se había mencionado. Se asume, en concreto, que su

media es cero. Se asume además que no existe correlación entre los errores y las

puntuaciones verdaderas, ni entre los errores entre sí. Con cada medida Xi se tienen dos

incógnitas (Ti y Ei), no siendo posible llegar a su obtención cuando se aplica un test. Una

medida de la precisión del test, que sí se podrá obtener, es el “error típico de medida” o

desviación típica de los errores de medida (Se). La TCT llega a medidas de la precisión

del test a partir de la definición de “formas paralelas”. Dos tests pueden considerarse

paralelos cuando “da lo mismo usar uno que otro” (Gulliksen, 1950, p. 11). Expresado

con más precisión, dos tests son paralelos sólo si cada persona tiene la misma

puntuación verdadera en ambos tests y los dos tienen el mismo error típico de medida.

La idea original de Spearman fue descubrir la vía para obtener indicadores de la

precisión del test a partir de los únicos datos disponibles (las puntuaciones observadas).

La correlación de Pearson entre las puntuaciones de una muestra de personas en dos

formas paralelas de un test es su “coeficiente de fiabilidad”, (rxx), que se interpreta como

la proporción de la varianza de las puntuaciones observadas que corresponde a la

varianza de las puntuaciones verdaderas. A partir del coeficiente de fiabilidad y de la

desviación típica de las puntuaciones observadas se puede obtener el error típico de

medida (Se), aplicando la expresión expuesta anteriormente. El nivel de fiabilidad o error

de medida tolerable depende, obviamente, del uso que se pretenda hacer del test, pero

hay cierto acuerdo en que, tanto el coeficiente de fiabilidad como otro indicador, muy

utilizado, el coeficiente Alpha de Cronbach, debieran estar por encima de 0.70.

Page 39: Avances 228. Amelia Márquez

A v a n c e s

37

La Teoría de la Respuesta al Ítem

La Teoría de la Respuesta al Ítem (TRI) también conocida como el rasgo latente,

que es un modelo probabilístico, surge para resolver las limitaciones de la TCT. La

principal es que las puntuaciones de las personas dependen de las características de los

ítems, y al contrario. Si al preparar un examen las preguntas resultan muy fáciles, se

obtendrán calificaciones más altas que si los ítems hubiesen sido más difíciles. Si se

aplica un examen a un grupo con mayor conocimiento o dominio sobre el tema se

obtendrán mas aciertos considerándose que las preguntas fueron fáciles que si hubieran

sido aplicadas a un grupo de menor perfil. Lo deseable es que las medidas no dependan

del instrumento, que sean “invariantes” y no dependan de los ítems concretos que se

apliquen. Esta importante propiedad la cumple la TRI y en ella descansan algunas de sus

aplicaciones más interesantes.

Aunque los primeros trabajos sobre la TRI aparecen en la década de los 50 (Lord, 1952),

el empuje definitivo se debe al libro de Lord y Novick (1968). La TRI es una teoría de los

tests que, como la TCT, va a proporcionar medidas de las personas y de las

características de los ítems, pero requiere aplicar la metodología estadística común para

la estimación de parámetros y determinación de la bondad del ajuste. Mientras en la TCT

no es posible comprobar si los datos de un test cumplen los supuestos de la teoría, en la

TRI el proceso de obtención de las características de las personas e ítems debe ir

precedido por un estudio del control de los supuestos y por la verificación del ajuste al

modelo. En la práctica, mientras la TCT requiere poco más que calcular medias,

varianzas y correlaciones, la TRI requiere cálculos complicados, obtención de

estimaciones por métodos numéricos y la utilización de software específico.

Page 40: Avances 228. Amelia Márquez

A v a n c e s

38

En la TRI, las puntuaciones de los n individuos en el test son las estimaciones de los n

parámetros 01, 02,… 0n. Análogamente, las características del ítem i son las

estimaciones de sus parámetros ai, bi y ci. Para obtener tales estimaciones se suelen

seguir los procedimientos estadísticos habituales. Se utiliza, con frecuencia, la

estimación máximo-verosímil. Es decir, se ofrece como solución los n valores de 0 y los k

valores de a, b y c que maximizan la probabilidad de las respuestas dadas por la muestra

al test. De las propiedades de los estimadores máximo-verosímiles se desprende que el

correspondiente estimador de 0, 000, sigue asintóticamente la distribución normal, con

media 0 y varianza V(000)=[I(0001 (Arnaiz, 1978), donde I(0) es la información que

suministra el test para la estimación del parámetro 0. La varianza del estimador o la

desviación típica, también llamada “error típico de medida” (Muñiz, 1997, p. 123), va a

ser la medida de la precisión o fiabilidad con la que el test mide, cuando se aplica la TRI.

De lo anterior se siguen dos consecuencias importantes: a) No sólo es posible, es

además lo habitual obtener la precisión de “cada” medida. En la TCT se obtiene la

precisión del test y se suele asumir que dicha precisión corresponde a todas las medidas

que se hagan con él. En la TRI, por el contrario, cada medida del nivel de rasgo, cada

estimación de 0, se hace con una determinada precisión, que viene indicada por su error

típico. Cuando la precisión es alta (es decir, cuando el error típico de medida se acerca a

cero), es baja la variabilidad de las estimaciones que produciría el test en caso de

aplicarse a una muestra de personas con nivel de rasgo 0. Cuando la precisión es baja,

ocurre lo contrario. b) Si a cada 0 se asocia su I(0), se obtiene la función de información

del test. Es una de las herramientas más útiles para la construcción de instrumentos de

Page 41: Avances 228. Amelia Márquez

A v a n c e s

39

medida, pues refiere qué niveles de rasgo pueden medirse mejor y peor con el test, y

cual es la máxima y mínima precisión alcanzable.

En el ámbito educativo, en lo que a psicometría se refiere se cuenta con una serie de

instrumentos, los cuales cuentan con características de validación, confiabilidad, validez

y estandarización, como es el caso de instrumentos para la medición del cociente

intelectual como Wppsi, Wisc-rm, Wais, Therman, Goodenaugh; de la personalidad como

16FP, MMPI-2, Barranquilla, Gordon; de madurez visomotora como Bender, Frosting;

para la medición de la orientación vocacional como Kuder; para el manejo y conocimiento

de técnicas de estudio como el CHTE, por referir algunos. En general, es a través de las

pruebas psicométricas que se puede conocer la capacidad, habilidad, destreza, valores,

actitudes, intereses, manejo de tolerancia a la frustración, inatención, problemas de

dislexia, dispraxia, nivel de avance educativo, entre otros. Ahora bien, en el ámbito de la

educación se cuenta con otros elementos para la medición de avances académicos,

como los exámenes –orales o escritos-, ensayos, evaluación del maestro respecto de la

destreza de desempeño, portafolio, etc. Todas estas formas de medición están referidas,

de manera evidente a conocer cuál es el nivel de desarrollo en que una persona se

encuentra o ha adquirido o desarrollado.

Conclusión

Si las competencias laborales pueden ser medidas, las actitudes, los valores, el

coeficiente, la tolerancia a la frustración, las técnicas de estudio. Las competencias

educativas también son susceptibles de ser medidas no solo a través de entrevista,

Page 42: Avances 228. Amelia Márquez

A v a n c e s

40

seguimiento de calificaciones, portafolio, sino a través de un instrumento de medición que

cuente con un sustento teórico-metodológico. Los enfoques correspondientes a

Competencias, Teoría de la Medida, teoría de la Respuesta al Item y de Teoría Clásica de

los Test, nos refiere a la construcción de instrumentos, con enfoque a prácticamente

cualquier tema que se requiera medir.

El sistema de evaluación a través de instrumentos de medición psicológica, también se han

hecho presentes en la educación, desde el momento en que la fundamentación teórico-

metodología para la construcción de pruebas como Ceneval o Excale presentan los mismos

preceptos teórico metodológicos, de ahí que destaquemos la fundamentación básica para

sugerir la construcción de un instrumento de medición de Competencias Básicas a nivel

universitario.

Page 43: Avances 228. Amelia Márquez

A v a n c e s

41

Bibliografía Bibliografía sobre Competencias Alfaro Rosca, Ma. Teresa, El aprendizaje de la Medicina en la universidad de Castilla la

Mancha. Una experiencia educativa basada en el aprendizaje de las competencias profesionales, en Educ. éd. v.8 supl.2 Barcelona sep. 2005. Dcto., pdf.

Aguerrondo, I. (1996): La Calidad de la educación: Ejes para su definición y evaluación.

Washington D. C. Año XXXVII # 116. OEA. Applied Psychological Measurement. AERA, APA y NCME (1999). Standards for

educational and psychological testing. Washington, DC: American Psychological Association.

Barrios, Edgar (2000): Gestión de las competencias. CINTERFOR/OIT.

http//www.cinterfor.org.uy Bogoya Maldonado, D. (1999): Proyecto sobre evaluación de competencias. Universidad

Nacional de Colombia. Memorias del Taller sobre Evaluación de Competencias Básicas.

Casaliz, P. (1996): La modernidad de la Universidad en el siglo XXI. Ponencia

presentada en Seminario Internacional Modelos de Universidades en América Latina. Bolivia.

CINTERFOR/OIT (2000): http//www.cinterfor.org.uy, Las 40 preguntas más frecuentes

sobre competencia laboral. Doa, E,. Alberto y otros (2000). El conocimiento y las competencias en las

organizaciones del Siglo XXI. Ed. Epsilon Libros, s.r.l. Universidad Metropolitana, Caracas, Venezuela.

Filmus, D. (1997): El papel de la educación frente a los desafíos de las transformaciones

científico- tecnológicas. ED Aique, Buenos Aires. González, V. (2002): ¿Qué significa ser un profesional competente?. Revista Cubana de

Educación Superior, Vol. 1/2002. Guedez, Victor: Las competencias en las organizaciones del siglo XXI. Ed. Epsilon

Libros, s.r.l. Universidad Metropolitana, Caracas, Venezuela, pag.156. Iñigo Bajos, Enrique. (2000): La formación de profesionales: una perspectiva desde el

mundo del trabajo. Tesis de Doctorado.

Page 44: Avances 228. Amelia Márquez

A v a n c e s

42

Irigoin, M., Vargas, F., Emergencias y actualidad de las Competencias Profesionales: apuntes para su análsis, Art., pdf, 6-7, 8/27.

Larrain, U. Ana María, González Eduardo, Formación Universitaria por Competencias.

Dcto. Pdf, p. 1 Magnusson, D. (1977): Teoría de los tests. México, Trillas. Marin, Rigoberto. «www.fca.uach.mx-

/semestre1/tecnologias%20y%20manejo%20%de20la%20informacion/Libro/171.htm1.» 2003. 5 de octubre de 2008.Meister, Jeanne C.: Universidades Empresariales. Cómo crear una fuerza laboral de clase mundial. 2000.

Merstens, Leonard. (2000): La gestión por competencia laboral en la empresa y la

formación profesional. OEI para la Educación, la Ciencia y la Cultura. (1997): Competencia laboral: sistemas, surgimiento y modelos. PISA (2006) Marco de la Evaluación, conocimientos y habilidades en ciencias

matemáticas y lectura, ED, Organización para la Cooperación y el Desarrollo Económico (OCDE) Manual Técnico para la Validación de Reactivos.

Tejada Fernández, J.: Acerca de las competencias profesionales. Rev. Herramientas.

España. Material fotocopiado.SCAN Secretary’s Commission on Achieving Necessary Skills 1991, EUA.

SCANS, Informe, Secretary´s Comisión on Achieving News Skills, 1992, EUA. Bibliografía referida sobre Teoría Clásica Abad, F.J. (2007). Introducción a la Psicometría. Proyecto docente. Madrid: Universidad

Autónoma de Madrid. Abad, F., Olea, J. y Ponsoda, V. (en prensa). The Multiple-Choice model: Some solutions

for the estimation of parameters in the presence of omitted responses. Abad, F.J. (2007); Jáñez, (1989): el Idealismo Platónico, la Teoría de las Escalas de

Medida y la Teoría Representacional. Madrid, Universidad Autónoma de Madrid. Aiken, Lewis, R., (2003) Test psicológicos y evaluación, ED., Printice Hall, 11ª edición,

México. Anastasi, Anne, Urbina Susana, (1998), Test Psicológicos, ED., Printice Hall, 7ª ed.,

México.

Page 45: Avances 228. Amelia Márquez

A v a n c e s

43

Arthur, Aron, Elaine N. Aron,(2001) Estadística para psicología, ED., Printice Hall, 2ª ed., México.

Ayerbe, I. (2006). La iniciativa privada y profesionalización de la Psicología aplicada en

España: Historia de TEA Ediciones (1952-2005). Sevilla: Universidad de Sevilla. educational and psychological testing. Council of Chief State School Officers, Meeting. 17 de junio.

Baker, F. (2001). The Basics of Item Response Theory. ERIC Clearinghouse on

Assessment and Evaluation, University of Maryland, College Park, MD. Brown, F.G. (1980): Principios de la medición en Psicología y Educación. México. Manual

Moderno. Campbell, N. R. (1928). An account of the principles of measurement and calculation.

Londres: Longmans, Green and Co. Camilli, G. (2006). Test fairness. En R.L. Brennan (Ed.) Educational Measurement. Westport, CT: Praeger. 4ª edición. Clauser, B. E., Margolis, M. J. y Case, S. M. (2006). Testing for licensure and

certifications in the professions. En Brennan, R. L. (Ed.). Educational measurement. Whasington: Praeger. 4ª edición.

Cohen, Ronald Jay, Mark, E., Swerdlik, (2001), Pruebas y Evaluación Psicológicas:

introducción a las pruebas y a la medición, ED Mc Graw Hill, 4ª ed., México. Colom, B.R. (1995). Tests, inteligencia y personalidad. Madrid: Pirámide. Colom, B. R. (2005). Psicología de las diferencias individuales. Teoría y práctica. Madrid:

Pirámide. Crocker, L. y Algina, J. (1986): Introduction to Classical and Modern Test Theory. New

York, Holt, Rinehart and Winston. Cordero, A. (1997): La evaluación psicológica en el año 2.000. Madrid: TEA Ediciones. Cronbach, L.J. (1972). Fundamentos de la exploración psicológica. Madrid: Biblioteca

Nueva. Cuadras. Embretson, S.E. (1985). Test design: Developments in Psychology and psychometrics.

New York: Academic Press.

Fraser, C.O. (1980). Measurement in psychology. British Journal of Psychology, 71, 23-24. Traducción en Muñiz, J. (1992), Teoría clásica de los tests. Madrid: Pirámide.

García Cueto, E. (1993): Introducción a la Psicometría. Madrid, Siglo XXI.

Page 46: Avances 228. Amelia Márquez

A v a n c e s

44

González Barberá (2007) Naturaleza de la Medida en Educación, ED. Universidad Complutense de Madrid.

Jañez, L. (1989). Fundamentos de Psicología Matemática. ED. Pirámide. Cap. 18,

Madrid. Jay Cohen, Ronald, Swerdlik Mark, (1988) Pruebas y Evaluación Psicológicas, introducción a las pruebas y la medición. ED., Printice Hall, México Lopez-Feal, R. (1986): Construcción de instrumentos de medida en Ciencias

Conductuales y Sociales. Barcelona, Alamex. Márquez, Jurado Amelia, (2004), Medición de Actitudes en Conductores de Transporte

Público, caso Concesionaria Fronteriza Municipio de Cd. Juárez. Tesis de Maestría en Salud en el Trabajo, UACJ, México.

Martínez Arias, M.R. (1995). Psicometría: Teoría de los tests psicológicos y educativos.

Madrid: Síntesis. Capítulo 10 y 11. Meliá, J.L. (1990). Introducción a la medición. ED.Cristóbal Serrano Villalba. Capítulos 1

y 2, Valencia. Morales, S, P. (2000). Medición de actitudes en psicología y educación. Madrid:

Universidad Pontifica Comillas. M.R. (1995). Psicometría: Teoría de los tests psicológicos y educativo. Madrid. Muñiz, J. (1992). Teoría clásica de tests. Madrid: Pirámide. Muñiz, J. (Coord.) (1996). Psicometría. Madrid: Universitas. Nunnally, J.C. (1987): Teoría psicométrica. México, Trillas. Original. Nunnally, J.C. (1989). Teoría psicométrica. México: Trillas. Santisteban, C. (1990). Psicometría. Teoría y práctica en la construcción de tests.

Madrid: Norma. Capítulos 10 a 14. Spearman, C. (1904), General Inteligence Objectively Determined and Measured,

American Journal of Psicology Suppes, Kranz, Luce y Tversky, 1989). Santiesteban, C. (1990): Psicometría: Teoría y práctica en la construcción de tests.

Madrid: Norma. Thorndike, R.L. y Hagen, E. (1977). Measurement and Evaluation in Psychology and

Education. New York: Wiley. Thorndike, R.L. (1991). Psicometría aplicada. México: Trillas.

Page 47: Avances 228. Amelia Márquez

A v a n c e s

45

Bibliografía referida sobre Teoría de la Respuesta al Item Abad, F.J, Garrido, J., Olea, J. y Ponsoda V. (2004). Introducción a la Psicometría.

Teoría Clásica de los Tests y Teoría de la Respuesta al Ítem. Documento inédito. Madrid: Universidad Autónoma de Madrid. (Manual).

Conejo, R. (2001). SIETTE: Un sistema de evaluación mediante test basado en la Teoría

de Respuesta al Ítem. Accesible en www.lcc.uma.es/ publicaciones/ LCC1031.pdf.

Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. New York: Holt, Rinehart and Winston. Capítulo 15.

Hambleton, R.K. (1989). Principles and selected applications of item response theory. En R.L.Linn, Educational Measurement. New York: Macmillan.

López Pina, J.A. (1995). Teoría de la respuesta al ítem: Fundamentos. Barcelona: PPU.

Martínez Arias. Muñiz,J.(1997).Introducción a la teoría de la respuesta a los ítems. Madrid: Pirámide. Muñiz, J. (1998). Teoría de respuesta a los items: Un nuevo enfoque en la evolución

psicológica y educativa. Madrid: Pirámide. Santisteban, C. y Alvarado, J.M. (2003). Psicometría (II). Teoría de la respuesta al Item.

ED. Complutense, S.A. , Madrid.

Tomás, J.M., Olivier, A. y Meliá, J.L. (1992). Teoría de la respuesta al ítem: Fundamentos, modelos y aplicaciones. Valencia: Cristóbal Serrano. Cap. 1,4 y 6.

Bibliografía básica recomendada para la Teoría de la Medida

Allen, M.J. y Yen, W.N. (1979): Introduction to Measurement Theory. Monterey, CA., Books-Cole.

Arnaiz, G. (1978). Introducción a la estadística teórica. 3ª edición. Valladolid: Lex- Nova. Amón, J. (1980). Estadística para psicólogos (Volumen 1). ED.Pirámide. Capítulo 2,

Madrid. Arce, C. (1994): Técnicas de construcción de escalas psicológicas.Madrid: Síntesis. Baird, J.C. y Noma, E. (1978): Fundamentals of Scaling and Pychophysics. New York, Wiley. Barbero, M.I. (1993): Métodos de elaboración de escalas. Madrid, UNED.

Page 48: Avances 228. Amelia Márquez

A v a n c e s

46

Bejar, I.I. y Braun, H.I. (1999). Architectural simulations: From research to implementation. (RM-99-2). Princeton, NJ: Educational Testing Service.

Borsboom, D. (2005). Measuring the mind: conceptual issues in contemporary

Psychometrics. New York: Cambridge University Press. Bravo, A. y Fernández, J. (2000). La evaluación convencional frente a los nuevos

modelos de evaluación auténtica. Psicothema, 12, Supl. nº 2, 95-99. Brusco, M.J. y Köhn, H.-F. (2008). Optimal partitioning of a data set based on the

pmedian model. sychometrika, 73, 89-115.

Castro, C.de (1980). Teoría de la medida en psicología y ciencias sociales. Caracas, Universidad Central de Venezuela: Ediciones de la Facultad de Humanidades y Educación.

Coombs, C.H., Dawes, R.M. y Tversky, A. (1981). Introducción a la psicología matemática. Madrid: Alianza Universidad. Capítulos 2 y 3.

Ceulemans, E. y Van Mechelen, I. (2008). CLASSI: A classification model for the study of sequential processes and individual differences therein. Psychometrika, 73, 107-124.

C.M. (1981). Métodos de análisis multivariante. Barcelona: Eunibar. Del Pino, G., San

Martín, E. De Castro, C. (1982): La medida en Psicología: Perspectiva Psicofísica. Revista de

Psicología General y Aplicada. P. 37. González, J. y De Boeck, P. (2008). On the relationships between sum score based

estimation and joint maximum likelihood estimation. Psychometrika, 73, 145-151. Haladyna, T.M. (1994): Developing and validating multiple-choice test items. Hillsdale,

NJ: LEA. Hambleton, R.K. y Sdwaminathan, H. (1985). Item response theory: Principles and

applications. Boston, MA: Kluwer- Nijhoff Publishing. Hambleton, R.K., y Swaminathan, H. y Rogers, H.J. (1991). Fundamental of item

response theory. Newbury Park: Sage. Holden, R.R., and Jackson, D.N., (1985) item subtlrty and face validity in pertsonality

assessment, journal of consuling and clinical psychology. Keeves, J.P. (1988): Educational research, methodology and measurement. Oxford,

Pergamon Press.

Page 49: Avances 228. Amelia Márquez

A v a n c e s

47

Muñiz, J. (1982): Medición psicológica: Métodos de escalamiento. Madrid. Universidad Complutense.

Muñiz, J. (1991). Introducción a los métodos psicofísicos. Madrid: PPU. Capítulo 1. Olea, J.; Ponsoda, V. y Prieto, G. (Eds.) (1999): Tests informatizados: fundamentos y

aplicaciones. Madrid: Pirámide. Pérez, C.; Padilla, J. L.; González, A. y Rojas, A. J. (1996). El uso de las técnicas de

escalamiento para la definición y medida del continuo psicosocial "individualismo-colectivismo". Boletín de Psicología, 25, 7-14.

Tomas, J.M.; Oliver, A. y Meliá, J.L. (1992). Teoría de la Respuesta al Item:

Fundamentos, Modelos y Aplicaciones. Valencia: Cristóbal Serrano. Torgerson, W.S., (1958) Theorynand Methods of Scaling, New York-. Wiley. Vargas, F. (1999): La formación basada en competencias: Instrumento para la

empleabilidad. Centro de Investigación y Documentación.

Artículos

Cortada de Kohan, N. (2004). Teoría de Respuesta al Ítem: Supuestos Básicos. Evaluar, 4, pp. 95-110.

Elosúa, P. y López, A. (1999). Funcionamiento diferencial de los ítems y sesgo en la adaptación de dos pruebas verbales. Psicológica, 20, pp. 23-40.

Fan, X. (1998). Item response theory and classical test theory: an empirical comparison of their item/person statistics. Educational and Psychological Measurement, 58(3), pp. 357-382.

Gómez Benito, J. y Navas, M.J. (1998). Impacto y funcionamiento diferencial de los ítems respecto al género en una prueba de aptitud numérica. Psicothema, 10(3), pp. 685-696.

Hambleton R.K. y Jones, R.W. (1993). Comparison of classical test theory and item response. Educational Measurement: Issues and Practice, 12(3), pp.38-47.

Harris, D. (1989). Comparison of 1-, 2-, and 3-parameter IRT models. Educational Measurement: Issues and Practice;. 1(8), pp. 35-41.

ITEMS: The Instructional Topics in Educational Measurement Series, by Mark Gierl.

Stenner, A.J., Smith III, M and Burdick, D.S.(1983)Toward a Theory of Construct Definition, Journal of Educational Measurement , 20, 305-316.

Prieto, G. y Dias, A. (2003) Uso del modelo de Rasch para poner en la misma escala las puntuaciones de distintos tests. Actualidades en Psicología,19(106), pp. 5-23.

Page 50: Avances 228. Amelia Márquez

A v a n c e s

48

Direcciones WEB

http://www.ucm.es/info/funvalor/docs/medida.pdf, http://www.uam.es/personal_pdi/stmaria/jmurillo/recursos/medida.htm http://www.canalsocial.net/GER/ficha_GER.asp?id=9589&cat=Matematicas http://www.uned.es/psico-3-psicometria/ttest.htm#que http://www.pt.wikipedia.org/wiki/Escala_Likert http://www.unmsm.edu.pe/psicologia/documentos/documentos2007/libro%20eap/05LibroEAPAliaga Tovar Jaime, Test psicométricos: Confiabilidad y Validez.pdf http://perso.wanadoo.es/aniorte_nic/apunt_metod_investigac4_7.htm http:// www:aniorte-nic.net http://www.mestizos.net