capítulo la construcción de las pruebas · 2006. 11. 29. · 03_cap2.p65 35 29/11/2006, 12:40...

22
Considerando que era necesario medir la suficiencia profesional de los docentes concursantes en 14 áreas distintas de especializa- ción y teniendo en cuenta el número rígido de preguntas y de áreas que estableció el decreto supremo 065-2001-ED, fue necesario bus- car una solución que se adecuara a la norma reglamentaria pero que, al mismo tiempo, posibilitara la medición de la suficiencia profesional de los docentes en 14 áreas específicas, lo que, eviden- temente, nos obligó a planificar pruebas con una estructura común pero con variaciones sustanciales en su contenido. Hipótesis de trabajo En secciones anteriores hemos abundado en argumentos que justi- fican este enfoque pero no hemos hecho explícitos los supuestos epistemológicos que orientaron el desarrollo del proyecto, el mis- mo que se ajustó a las características de una investigación evaluativa. Dichos supuestos han cumplido la función de hipóte- sis de trabajo, las mismas que a continuación haremos explícitas: Hemos asumido, en primer lugar, que la suficiencia profesional de un docente se puede medir, indiciariamente, mediante prue- bas de selección múltiple construidas teniendo como entradas áreas cognoscitivas explicitas que exploren: los conocimientos científicos que debe poseer un docente para tener qué enseñar en clase; los conocimientos pedagógicos que son necesarios para Capítulo II La construcción de las pruebas [35] 03_cap2.p65 29/11/2006, 12:40 p.m. 35

Upload: others

Post on 13-Feb-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • 35

    Considerando que era necesario medir la suficiencia profesionalde los docentes concursantes en 14 áreas distintas de especializa-ción y teniendo en cuenta el número rígido de preguntas y de áreasque estableció el decreto supremo 065-2001-ED, fue necesario bus-car una solución que se adecuara a la norma reglamentaria peroque, al mismo tiempo, posibilitara la medición de la suficienciaprofesional de los docentes en 14 áreas específicas, lo que, eviden-temente, nos obligó a planificar pruebas con una estructura comúnpero con variaciones sustanciales en su contenido.

    Hipótesis de trabajo

    En secciones anteriores hemos abundado en argumentos que justi-fican este enfoque pero no hemos hecho explícitos los supuestosepistemológicos que orientaron el desarrollo del proyecto, el mis-mo que se ajustó a las características de una investigaciónevaluativa. Dichos supuestos han cumplido la función de hipóte-sis de trabajo, las mismas que a continuación haremos explícitas:

    • Hemos asumido, en primer lugar, que la suficiencia profesionalde un docente se puede medir, indiciariamente, mediante prue-bas de selección múltiple construidas teniendo como entradasáreas cognoscitivas explicitas que exploren: los conocimientoscientíficos que debe poseer un docente para tener qué enseñar enclase; los conocimientos pedagógicos que son necesarios para

    Capítulo IILa construcción de las pruebas

    [35]

    03_cap2.p65 29/11/2006, 12:40 p.m.35

  • 36

    orientar la acción de dirección del aprendizaje en el aula, losmismos que por ser de carácter operativo constituyen el cómo dela enseñanza; y los conocimientos científicos humanísticos y tec-nológicos que configuran el contexto dentro del cual cobran sen-tido el qué y el cómo. Estos últimos constituyeron la definición delclásico concepto de cultura general que de este modo fuediversificado en cinco bloques que integraban especialidadesconsideradas afines.

    • En función de la información proporcionada por la escasa in-vestigación educacional relevante disponible en nuestro paíssobre formación magisterial, asumimos que las pruebas para elnivel secundario deberían tener un contenido que dé prioridadal qué sin descuidar el cómo y que las pruebas para los nivelesprimario e inicial enfaticen el cómo. El conocimiento del contextorecibió el mismo énfasis en todas las pruebas. Asimismo, el énfa-sis antes referido no se expresó en el número de preguntas sinoen la calidad de la información y el grado de dificultad de lasmismas.

    • Considerando el sentido prospectivo de la evaluación realizada,asumimos que las pruebas medirían lo que los docentes debe-rían saber aunque tuviéramos fundamento fáctico para presu-mir que una proporción importante de ellos realmente no satis-facía esta condición. Este deber saber el qué y el cómo de la ense-ñanza lo entendimos en función de los conocimientos de los quedebería disponer el docente para dirigir satisfactoriamente losaprendizajes requeridos no sólo por los currículos escolares vi-gentes sino también por las necesidades de participación plenaen el desarrollo social contemporáneo. De esta manera pretendi-mos estimar la distancia existente entre los niveles reales de for-mación alcanzados por los docentes a través de los estudios pro-fesionales y el nivel deseable que debería alcanzarse si es que losestándares de nuestro sistema educativo fueran satisfactorios ycompetitivos con los de la comunidad internacional.

    • Hemos asumido que las capacidades o competencias mentalesadecuadas para medir el potencial de los docentes para admi-

    03_cap2.p65 29/11/2006, 12:40 p.m.36

  • 37

    nistrar, transmitir y crear conocimientos son las de identificarinformación pertinente, analizarla lógicamente, construirinferencias, ejemplificar, contraejemplificar y establecer genera-lizaciones y conexiones significativas. Asimismo, una preguntabien construida debería medir al menos dos de las capacidadesantes enunciadas y, en el mejor de los casos, todas. De esta mane-ra las alternativas de respuesta, como fue en los hechos, debíantender a ser estructurales y no puntuales.

    • El universo temático sobre el cual era adecuado medir la sufi-ciencia profesional de los docentes estaba constituido por loscontenidos deducibles de los currículos oficiales que orientannuestro sistema de educación básica y el sistema de formacióndocente ejecutado bajo la conducción académica de la DirecciónNacional de Capacitación y Formación Docente. En menor me-dida, considerando que las 52 facultades de educación entoncesexistentes forman a no más del 26% de los docentes en servicio,fueron considerados dentro de este universo temático loscurrículos universitarios.

    • El grado de validez predictiva de las pruebas, el indicador másrelevante en este caso, sólo podría establecerse adecuadamentemediante el cumplimiento improbable de una segunda etapaconstituida por una investigación de seguimiento que permitie-ra decidir si los docentes que lograron las más altas calificacio-nes tuvieron después de su nombramiento un desempeño enaula distinguible como superior respecto del de los docentes queobtuvieron menores puntajes. (Es oportuno señalar que esta se-gunda etapa no estuvo dentro de las preocupaciones de las auto-ridades del Ministerio de Educación, ni de los organismos des-centralizados, ni de la cooperación internacional.)

    Estructura de las pruebas

    Sobre la base de los criterios anteriormente expuestos, la estructurade los contenidos de la prueba quedó definida tal como se detallaen el siguiente cuadro

    03_cap2.p65 29/11/2006, 12:40 p.m.37

  • 38

    Áreas Subáreas N.º de preguntas1) Cultura Cultura científica 5 general Cultura humanística 5

    Realidad nacional 52) Cultura Corrientes pedagógicas 5 pedagógica Contenidos curriculares 12

    del nivel, modalidad yespecialidadManejo de la normatividadcurricular del nivel,modalidad y especialidad 3

    3) Aptitud Situaciones de planificación docente de la enseñanza-aprendizaje

    de un determinado tema o área 4Estrategias didácticasaplicables a un tema determinado 4Uso de recursos didácticos paraun tema determinado 4Procedimientos e instrumentosde evaluación de un tema o áreadeterminado 3

    Total 50

    El paso siguiente fue examinar la situación planteada por elhecho de que los miembros del magisterio nacional nunca se ha-bían sometido a pruebas especializadas de suficiencia profesio-nal, lo que podía incluir factores de sorpresa y crear un desconcier-to que pudo utilizarse para sus propios fines por los diversos sec-tores interesados en el fracaso de las pruebas. Una razón que justi-ficaba otorgarle atención especial a este aspecto estuvo dada, porcitar un ejemplo, por la decisión de redactar la prueba de ingléstotalmente en dicho idioma, lo que carecía absolutamente de prece-dente dentro de las prácticas del Ministerio de Educación.

    Los temarios

    Para minimizar las sorpresas el mismo día del examen, el equipode trabajo consideró necesario elaborar temarios y publicarlos con

    03_cap2.p65 29/11/2006, 12:40 p.m.38

  • 39

    la suficiente anticipación a fin de que los concursantes estén altanto del universo cognoscitivo a partir del cual se iban a formularlas preguntas. Un factor que conspiró contra este propósito fue elplazo no mayor de ocho semanas que tuvimos para la realizaciónde todas las acciones demandadas por la evaluación. Pese a ello, elequipo de trabajo elaboró 14 temarios basados en los planescurriculares oficiales que el Ministerio de Educación distribuye entodo el ámbito nacional. Estos temarios fueron elaborados con elcriterio de seleccionar los conocimientos pedagógicos, huma-nísticos, científicos y tecnológicos mínimos que debería poseer eldocente para dirigir adecuadamente el aprendizaje de los conteni-dos que figuraban en los planes de estudio oficiales de los diferen-tes niveles y modalidades de nuestro sistema de educación básica.

    El criterio elegido para determinar el grado de dificultad, com-plejidad y profundidad de los contenidos temáticos fue de carácternormativo en tanto que las pruebas no se propusieron explorarsolamente lo que efectivamente sabían los docentes sino lo quedeberían saber, aunque aún no lo sepan, para ejercer satisfactoria-mente sus funciones en el aula. También fue necesario dar instruc-ciones precisas sobre el uso de hojas de respuesta, calificables me-diante una lectora óptica, a una población docente que no estabahabituada al manejo de estos instrumentos que garantizan la cali-ficación rápida y anónima del examen de cada postulante. Estadificultad era mayor entre los docentes de provincias y de áreasrurales que tienen menos contacto con las computadoras que losdocentes que trabajan en Lima. En consecuencia, se diseñó un fo-lleto que transmitiera a los concursantes, con la mayor claridadposible, los temarios, la estructura de las pruebas y las instruccio-nes para usar correctamente las hojas de respuestas.

    Se imprimieron 180 mil ejemplares de dicho folleto, los mis-mos que fueron distribuidos gratuitamente con la edición domini-cal del diario El Comercio, con dos semanas de anticipación a lafecha del examen. De este modo los concursantes tuvieron algunosdías para prepararse y rendir sus pruebas, así como para conocerde manera completa y transparente las reglas de administraciónde las pruebas junto con el universo temático de éstas. El cumpli-miento de la tarea, descrita en esta sección, disminuyó el grado desorpresa y desconcierto de los docentes, fortaleció la imagen de

    03_cap2.p65 29/11/2006, 12:40 p.m.39

  • 40

    eficiencia y transparencia del Ministerio de Educación y evitó quequienes perdieron privilegios expectantes con la aplicación exitosade las mencionadas pruebas tengan pretextos de obstaculizar elproceso.

    Por otra parte, los temarios han proporcionado al magisterionacional una ruta de mejoramiento personal a través del estudiode tópicos científicos, tecnológicos y humanísticos que son indis-pensables para poseer un grado de solvencia intelectual que ga-rantice eficiencia en el trabajo de aula.

    Los temarios como instrumentos de autoaprendizaje

    Aunque no hemos tenido oportunidad de hacer seguimiento algu-no debido a que esta actividad fue cancelada por el ministro quereemplazó a Nicolás Lynch Gamero, conjeturamos que los docen-tes con vocación intelectual, con sentido de responsabilidad y vo-luntad de servicio continúan usando estos temarios para orientarel mejoramiento de sus conocimientos. Los currículos emitidos porel Ministerio de Educación no sirven adecuadamente a este propó-sito porque se agotan en una fraseología imprecisa y oscura sobrecapacidades, competencias, habilidades y actitudes que no dejaespacio a la determinación actualizada y precisa de contenidoscognoscitivos cuya adquisición enriquezca la mente, desarrolle yflexibilice capacidades, independientemente de que los sujetos seano no conscientes de estos procesos. En efecto, es un hecho consta-table que los estudiosos y creadores de la ciencia y de la tecnologíaque han posibilitado el desarrollo social contemporáneo se ejerci-taron en el aprendizaje de clásicos, como Euclides, Aristóteles, Ga-lileo, Descartes, Leibniz, Kant, etc., realizando así un ejercicio men-tal que desarrolló plenamente sus funciones intelectuales y poten-ció su capacidad creadora, sin que hayan tenido necesidad algunade previamente planificar qué habilidades debían desarrollar.

    No podemos, al respecto, subestimar los avances de la psico-logía científica para identificar las capacidades intelectuales o com-petencias cuyo desarrollo está ligado a un mejor aprendizaje deconceptos científicos, pero tampoco podemos ignorar que lo logra-do en este campo es todavía muy pequeño. Esto significa que unprogramador curricular en algo ayuda al docente de aula cuando

    03_cap2.p65 29/11/2006, 12:40 p.m.40

  • 41

    indica las capacidades y habilidades identificables y distinguiblesque están asociadas al aprendizaje de un contenido cognoscitivo,pero es desorientador y recargado cuando asume que, práctica-mente, hay capacidades específicas con fronteras precisas y biendefinidas. Por ejemplo, cuando se separa en un currículo el pensa-miento crítico del creativo y ambos de la capacidad para solucio-nar problemas, siendo que esta última, en cualquier caso intere-sante de la historia de la ciencia, involucra a los dos primeros y,además, el segundo no se produce sin el primero en tanto que todacreación de lo nuevo se define por la superación de las limitacio-nes identificadas a través del enjuiciamiento crítico de lo anterior.

    La misma separación artificiosa se produce cuando seindependiza las capacidades para analizar, inferir e interpretarque en la práctica son aspectos de una misma capacidad generalhipotético-deductiva. Lo argumentado permite afirmar que loscurrículos que son detallistas en desagregar capacidades, compe-tencias, habilidades y destrezas son innecesariamente recargadosy olvidan los contenidos cognoscitivos que son la herencia cultu-ral que la educación debe transmitir para que las generacionesjóvenes aprovechen las experiencias de sus predecesoras. Asimis-mo, esta transmisión de cultura siempre ha producido un enrique-cimiento de gran magnitud que se patentiza en la diferencia entrela física de Arquímedes que permitió potenciar las catapultas y lade Planck y Einstein que han posibilitado colocar naves teledirigi-das en la Luna y Marte. Para estos logros portentosos del pensa-miento científico la psicología actual no tiene ninguna explicacióninteresante porque simplemente desconocemos inclusive los me-canismos mentales y cerebrales que hacen posible el aprendizajede Ö2 , el número Õ , etc., lo que no ha impedido que desde hace másde dos mil años los maestros adecuadamente formados enseñencon éxito a sus discípulos estos conceptos y otros muchos máscomplejos.

    En síntesis, los temarios que publicamos para las pruebas síconstituyen una ayuda para la mejor formación de los docentesporque definen estructuras temáticas actualizadas que no se pier-den en una fraseología psicologista y oscura que pretende detallarexhaustivamente las capacidades ligadas al conocimiento huma-no, siendo que la mejor psicología contemporánea sabe que sobre

    03_cap2.p65 29/11/2006, 12:40 p.m.41

  • 42

    ese tema es todavía poco lo que se puede decir con fundamento.Felizmente la transmisión y creación del conocimiento puedecontinuarse realizando mientras se mejoran los conocimientospsicológicos y neurológicos acerca de dicho proceso. El gran pro-blema para nuestro sistema educativo es que los curriculistas quelo dirigen creen que tal teoría psicológica completa existe y, prácti-camente, torturan a nuestros docentes y niños encasillándolos enesquemas recargados, rígidos e infundados que detallan supues-tas capacidades mentales independientes y de este modo entorpe-cen el aprendizaje de la ciencia y sólo prestan buen servicio alcentralismo autoritario que dispone ad líbitum de las vidas huma-nas y de las riquezas del país.

    Finalmente, cerramos esta sección reiterando que un plan deestudios que se agota en el detallamiento de capacidades, compe-tencias, habilidades, destrezas y actitudes, y que en la parte corres-pondiente a los contenidos fija temas, v. g. en matemática, tan ge-néricos como sistemas numéricos y funciones, distribuidos de modoatomizado y descontextualizado a lo largo de cinco años, no daninguna posibilidad de ejercitar las capacidades racionales por-que éstas no funcionan en el vacío sino actúan u operan sobremateriales cognoscitivos adecuadamente definidos y articuladoscon el cuerpo de la ciencia, el mismo que tiene una lógica propiaque no coincide necesariamente con la legalidad que rige los pro-cesos de aprendizaje como creyó erróneamente Piaget. En efecto, sedesarrolla la capacidad de interpretar, analizar, deducir, ejempli-ficar, contraejemplificar, etc., leyendo, por ejemplo, el diálogo Menónde Platón o un buen texto de geometría de Euclides, pero no en elvacío camuflado en una temática difusa, genérica y desconectadadel cuerpo de la ciencia vigente social e históricamente. Por el con-trario, un temario adecuado sí es un instrumento de autoaprendizajedebido a que define una agenda cognoscitiva, lógicamente organi-zada, que obliga al lector interesado en aprender a ejercitar y desa-rrollar sus capacidades racionales de manera efectiva aunque, almenos inicialmente, no sea consciente de la ocurrencia de este pro-ceso. Sin embargo, esto último no es una dificultad porque a losdocentes de aula lo que les es exigible como condición necesaria esun manejo, por ejemplo, de la aritmética, pero el conocimiento de

    03_cap2.p65 29/11/2006, 12:40 p.m.42

  • 43

    los procesos mentales que dicho manejo supone, solamente les esrequerido a los psicólogos, psiquiatras y neurólogos de punta.

    La centralidad del saber qué

    También es importante añadir que nuestra insistencia en el énfasiscognitivo de los temarios y de las pruebas estaba entroncada condos tesis que sostenemos en relación con la factibilidad, producti-vidad y riesgos de las acciones educativas: I) No es posible enseñarlo que no se sabe. Saber el contenido cognoscitivo teórico o pro-cedimental que se desea enseñar es condición necesaria para larealización de un acto educativo. El que no sabe aquello cuyo apren-dizaje debe dirigir, en términos educacionales, no tiene qué haceren el aula de clase. El daño que ocasiona quien no sabe lo que debeenseñar puede ser de consecuencias sociales irreversibles en lamedida que el aula se convierte en un mecanismo de fisión encadena de errores avalados por la autoridad del docente. II) El fac-tor determinante de la calidad de la enseñanza-aprendizaje en elaula es la riqueza de la formación científica, tecnológica y huma-nística del docente. El currículo o plan de estudios distribuido, eneste caso, por el Ministerio de Educación, cuando está adecuada-mente elaborado, es sólo un instrumento subsidiario. En efecto,docentes con sólida formación científica, tecnológica y humanísticapueden brindar educación de excelente calidad aunque el currícu-lo sea muy deficiente, pero docentes con una débil formación pres-tarán un servicio muy pobre aunque dispongan de los mejorescurrículos.

    Lamentablemente, la orientación de la formación magisterialimpartida por el Ministerio de Educación y por no pocas faculta-des de Educación sigue desde hace 25 años, de manera creciente,un sentido contrario al de las tesis I) y II) antes expuestas. Los resul-tados no se han hecho esperar. Considerando sólo a los países dela región de América Latina y del Caribe, hace largos años que nosdisputamos en comprensión de lectura y en matemática el últimolugar con Haití, según las evaluaciones realizadas por UNESCO aestudiantes de cuarto y sexto grado de primaria entre 1998 y el año2000. Si tomamos como referencia las pruebas PISA (Program forInternational Student Assesment) administradas en el bienio 2000-

    03_cap2.p65 29/11/2006, 12:40 p.m.43

  • 44

    2001 por la OECD a una muestra de 41 países del mundo, encon-tramos que ocupamos el último lugar en comprensión de lecturadel lenguaje social, del lenguaje científico y del lenguaje matemáti-co al nivel de cuarto año de secundaria (15 años).

    El banco de preguntas

    La constitución de un banco de preguntas es una tarea que debecumplirse sistemática y cuidadosamente en todo proceso de eva-luación masiva en el que están en juego no sólo las característicastécnicas de los instrumentos sino también las garantías de impar-cialidad, equidad y transparencia en la administración y califica-ción de las pruebas. En principio, las garantías anteriores no de-ben estar sustentadas principalmente en la honestidad y buenavoluntad de los constructores de preguntas sino en las reglas defuncionamiento del sistema de seguridad que deben impedir quetales garantías sean vulneradas, aunque la honestidad de algunosde los constructores pueda flaquear.

    En principio, el número de preguntas que constituye un bancodebe ser al menos cinco veces más amplio que el total de preguntasque se van a utilizar en la prueba. Eso significa que ningún cons-tructor debe tener una probabilidad mayor de 0,2 de que una desus preguntas sea parte de la prueba. Por tanto, considerando queel encargo inicial fue de 14 pruebas de 50 preguntas cada una,para ser administradas simultáneamente en la misma fecha, elnúmero aconsejable de unidades del banco debió ser de al menos3.500 preguntas. Sin embargo, considerando que para la forma-ción de este banco de preguntas se contó con sólo cinco semanas yque, además, las preguntas producidas por los constructores de-bían ser previamente sometidas a control de calidad, la cifra realque se obtuvo fue de 3.381 unidades. Para compensar esta insufi-ciencia del banco, ocasionada por los plazos perentorios, el equipoconstructor de las pruebas, que actuó en condiciones de aislamien-to absoluto desde una semana antes de la fecha de la administra-ción de las pruebas y hasta dos horas después de que éstas fueranrecogidas en los centros de administración, estaba capacitado paramodificar las preguntas y para construir nuevas si el caso lo reque-ría, de tal modo que la versión final de cada prueba difiriósignificativamente de la base de datos que ingresó al banco.

    03_cap2.p65 29/11/2006, 12:40 p.m.44

  • 45

    El equipo constructor de preguntas para el banco estuvo inte-grado por 115 especialistas de alto grado académico, profesores dediversas universidades del país en las áreas evaluadas por laspruebas, con excepción del área de educación religiosa, cuyos re-presentantes fueron designados por la Comisión Episcopal. A es-tos especialistas se sumaron 14 personas que trabajaban en el Mi-nisterio de Educación en las áreas de desarrollo curricular de cadauno de los niveles y modalidades que integran el sistema de educa-ción básica. Se optó por esta composición debido a que para prac-ticar una evaluación científicamente rigurosa y técnicamente efi-ciente era necesario, por un lado, recurrir a las personas que po-seen la formación científica, tecnológica y humanística de mejorcalidad del país que son, preferentemente, las que ejercen la docen-cia en los niveles de pregrado y posgrado de nuestras universida-des calificadas. Por otro lado, se requirió el concurso de las perso-nas que conocían los currículos que habían servido de base para laformación de los docentes y que, además, conocían los currículosque sirven como planes de estudio en el sistema de educación bási-ca. Esta información permitió deducir la pauta de lo que un docen-te debería saber para desempañarse satisfactoriamente.

    Armonizar las acciones de un equipo de trabajo de 129 perso-nas en menos de cinco semanas requirió de la realización de dosconferencias y un seminario-taller de construcción de preguntasde dos días, durante los cuales se realizaron las siguientes tareasacadémicas: I) hacer conocer al equipo de trabajo los fundamentosteóricos y los objetivos centrales del proceso de evaluación docen-te; II) poner a los constructores de preguntas en contacto con elmaterial que había servido de base a la elaboración de los temariosy con la versión preliminar de los mismos a fin de que tengandefinido el marco temático de las preguntas; III) exponer y debatirlas pautas para construir la estructura de las preguntas, de talsuerte que en las 14 áreas consideradas se utilicen preguntas queguarden entre sí un grado significativo de semejanza estructural;IV) se enfatizó la necesidad de evitar la presencia de preguntascuya estructura conduzca a medir el memorismo inorgánico que esel que se ejercita cuando la respuesta esperada se reduce a la iden-tificación de un dato aislado.

    03_cap2.p65 29/11/2006, 12:40 p.m.45

  • 46

    Privilegiando la tarea IV), se discutieron cinco modelos de es-tructura de preguntas, los cuales demandaban para obtener la res-puesta, en unos casos, el manejo de información lógicamenteestructurada, de tal manera que el examinado no debía responderreproduciendo datos aislados sino comprendiendo la organiza-ción lógica de los contenidos evaluados. En otros casos, la estruc-tura de la pregunta debía medir las capacidades para la discrimi-nación fina entre conceptos y situaciones, para la aplicación deconocimientos previos, para la deducción de consecuencias lógi-cas, para operar con ejemplos y contraejemplos, para detectar con-tradicciones y para manejar generalizaciones. Durante el semina-rio-taller también se informó sobre las pautas para manejar el siste-ma de formularios y de sobres en los que el constructor debía re-dactar y entregar las preguntas para garantizar la incorporaciónde su contribución al banco en condiciones operativas y de anoni-mato. Asimismo, se comunicó a los constructores las reglas de se-guridad a las que estaban sujetos al aceptar integrarse al equipo detrabajo encargado de la evaluación docente.

    Las medidas antes tomadas permitieron contar con el mejorbanco de preguntas posible dentro de los plazos perentorios y den-tro de un país en el que no existe tradición alguna de pruebasnacionales, procedimiento que en cambio es frecuente en Europa yen Estados Unidos. Como excepción, habría que reconocer que huboun intento del Ministerio de Educación de establecer pruebas na-cionales para los escolares al final del ciclo primario durante ladécada de 1950, por influencia del psicólogo alemán WalterBlumenfeld, fundador del Instituto Psicopedagógico Nacional ysimultáneamente profesor de las Facultades de Letras y de Cien-cias de la Universidad Nacional Mayor de San Marcos. La aplica-ción que se hizo entonces de pruebas nacionales se realizó con uncierto rigor técnico y sirvió para la elaboración de algunas tesisdoctorales de la época.

    El debilitamiento coyuntural de los requisitos teóricos

    Lamentablemente, este esfuerzo del profesor Blumenfeld se inte-rrumpió drásticamente con el cambio de ministro y con la posteriortransferencia del Instituto Psicopedagógico Nacional a la Facul-

    03_cap2.p65 29/11/2006, 12:40 p.m.46

  • 47

    tad de Educación de la Universidad Nacional Mayor de San Mar-cos que lo desactivó en 1968 bajo la presión de la delegación estu-diantil al Consejo de Facultad. Desde entonces no ha vuelto a exis-tir en el país órgano especializado alguno dedicado a la construc-ción y administración de pruebas educacionales. La informaciónanterior es relevante para que se entienda por qué el banco de pre-guntas que se constituyó en el lapso de cinco semanas estaba ine-vitablemente lejos de los requisitos técnicos que deben satisfacersepara construir pruebas con índices previamente establecidos devalidez y confiabilidad, que aseguren que los seleccionados a tra-vés de ellas sean efectivamente los que poseen, en mayor medida,las capacidades y competencias demandadas por los objetivos quese pretende lograr mediante la aplicación de las mismas. Al res-pecto, debemos anotar que un indicador que revela el muy precariodesarrollo científico de nuestro país en el manejo de pruebas edu-cacionales lo proporciona de manera privilegiada la UniversidadNacional Mayor de San Marcos que desde hace 33 años ha aplica-do pruebas de aptitud académica y de conocimientos a un númerototal aproximado de 1.815.000 adolescentes que han concursadopara ingresar a sus aulas, sin que hasta la fecha se haya conocidolos índices de validez y de confiabilidad de dichas pruebas quepermitan afirmar, con fundamento científico, que son instrumen-tos que realmente seleccionan a los postulantes que tienen, en ma-yor medida, las capacidades y competencias requeridas por losestudios universitarios. Hasta donde conocemos, no se ha realiza-do en el Perú investigación seria alguna en esa dirección y no exis-te artículo alguno publicado sobre el tema. En ese sentido, el tratoprivilegiado que conceden las autoridades de la Universidad deSan Marcos y los medios de comunicación, anualmente, a los ado-lescentes que obtienen los más altos puntajes en las referidas prue-bas carece de justificación científica y podría dar lugar a que es-tos jóvenes sufran grandes frustraciones, en tanto que los instru-mentos con los que han sido evaluados carecen de índices deconfiabilidad y de validez seriamente establecidos.

    La constitución de un banco de preguntas técnica y científica-mente satisfactorio presupone que cada unidad que se incorporaal acervo haya sido previamente probada y que se conozca su índi-ce de dificultad y su índice de discriminación, lo que presupone

    03_cap2.p65 29/11/2006, 12:40 p.m.47

  • 48

    que cada pregunta ha sido parte de un conjunto de administracio-nes piloto que toman un par de años y que se realizan dentro deltrabajo de órganos especializados como el Educational Testing Servicede Nueva Jersey.

    Las investigaciones para la determinación de los grados deconfiabilidad y de validez de las pruebas requieren estudios deseguimiento y administraciones reiteradas a las mismas muestrasy a muestras diversificadas, lo que hace posible obtener informa-ción fundada sobre la estabilidad de las pruebas, su validez con-currente y su capacidad predictiva. En la medida que nada de loantes descrito existe en el país, ni podría lograrse en dos meses poraproximación aceptable, el equipo de trabajo tuvo que limitarse aelaborar las pruebas con el banco de preguntas menos malo posi-ble. También es importante subrayar que en el vocabulario de laburocracia ministerial del sector y de las facultades de Educaciónexiste la expresión «pruebas validadas» cuyo significado es com-pletamente oscuro. Pero si tal expresión significara algo, ello debe-ría ser pruebas que cuenten antes de ser administradas con índicesde validez y de confiabilidad estadísticamente aceptables.

    Es claro que lo anterior es, por ahora, sólo una aspiración enun país en el que en las muy escasas oportunidades en las que setrabaja seriamente, contra el tiempo, con pruebas educacionales,estamos obligados a partir desde cero.

    Construcción y descripción del contenido por áreas de laspruebas

    Con el banco de preguntas constituido y organizado el equipo cons-tructor de las pruebas, integrado por 25 personas bajo condicionesde internamiento e incomunicación con el exterior, se dedicó a latarea de elaborar 26 pruebas. Para el efecto se seleccionó un localque brindara los servicios de alimentación, dormitorio y aseo paracumplir la tarea en jornadas continuas no menores de 16 horas. Aello se añadió un equipo de digitación y de procesamiento de datosque apoyó este trabajo dentro de los mismos lapsos. En el períme-tro externo se constituyó un personal de seguridad encargado degarantizar la incomunicación entre el equipo de trabajo y el exte-rior. Las pruebas de religión fueron confeccionadas paralelamenteen otro local bajo la responsabilidad de la Conferencia Episcopal.

    03_cap2.p65 29/11/2006, 12:40 p.m.48

  • 49

    Las primeras catorce pruebas se administraron el 2 de marzodel año 2002 y de acuerdo con la planificación realizada por elMinisterio de Educación, ese día debió concluir todo el proceso.Sin embargo, debido a los actos violentos promovidos por el SUTEPpara impedir la aplicación de las pruebas, en 14 de las 60 sedesprogramadas para la administración de las pruebas, estos actos deboicot tuvieron éxito, lo que dio lugar a que una semana después serealizara una segunda aplicación en todas las sedes afectadas porlos hechos antes indicados, lo que incluyó amplios sectores deLima como Comas y San Juan de Miraflores. Para el efecto, el equi-po de trabajo tuvo que confeccionar catorce pruebas más, eventua-lidad para la que no estaba programado el banco de preguntas,pero que afortunadamente fue afrontada con éxito debido a que elequipo constructor de las pruebas estaba constituido por especia-listas capaces de aportar en un plazo breve las nuevas preguntasque se requirieron para superar la limitación antes señalada.

    Asimismo, esta nueva aplicación planteó dos incógnitas eneste caso íntimamente relacionadas entre sí: la primera referida ala equivalencia en grado de dificultad de las pruebas aplicadas el9 de marzo con las aplicadas una semana antes y la segunda difi-cultad relacionada con el hecho de que era deseable que los exami-nados en la segunda fecha den examen en las condiciones mássemejantes posibles a las de la primera fecha, lo que suponía, ine-vitablemente, no sólo pruebas con equivalente grado de dificultadsino también con error estándar semejante, con coeficientes de dis-criminación de las preguntas similares y con índices de validezsemejantes. En la parte referente al análisis de los resultados exa-minaremos la manera cómo fue afrontada la problemática antesdescrita.

    Las pruebas que se construyeron en dos versiones fueron lassiguientes: educación inicial (A); educación primaria (B); educa-ción especial (C); educación secundaria - matemática (D); educa-ción secundaria - ciencias naturales (E); educación secundaria -ciencias sociales (F); educación secundaria - comunicación (G);educación secundaria - educación artística (H); educación secun-daria - idioma extranjero (I); educación secundaria - educaciónfísica (J); educación secundaria - variante técnica (K); educaciónocupacional (L); educación superior tecnológica (M); y educaciónreligiosa (N).

    03_cap2.p65 29/11/2006, 12:40 p.m.49

  • 50

    Las pruebas de educación inicial (A) y educación primaria (B)

    En relación con el área I), se propuso medir una cultura generalque revelara información científica en los campos de la genética,neurología, psicología de la inteligencia, interculturalidad e infor-mación estadística sobre la situación y los derechos de la infanciaen el Perú y en el mundo. En relación con las áreas II) y III) tuvieronuna orientación pedagógica y psicológica considerando que enestos niveles es dominante el manejo de conocimientos y recursosutilizables en la formación de la personalidad básica del niño y enla adquisición de capacidades y competencias para el proceso desocialización, ocupando un lugar menos importante el conocimien-to científico especializado no-psicológico y no-pedagógico. Asi-mismo, en las instrucciones para la construcción de las preguntaspara el banco se subrayó el hecho de que son los resultados de lainvestigación psicológica los que gravitan más fuertemente sobrelas orientaciones pedagógicas, didácticas y curriculares, las mis-mas que, en general, siguen los lineamientos aplicativos que sededucen de las teorías psicológicas que adquieren un estatuto pa-radigmático. Esto explica que en los medios académicos educacio-nales del mundo posean una presencia prominente los trabajos deVygotski, Skinner, Piaget y Bruner, entre otros, todos los cualeshan sido psicólogos y, en casos como el de Piaget, ni siquiera seocuparon personalmente de las aplicaciones educacionales de susteorías. Si nos remontamos algo más en el pasado, encontraremosque la situación de Köhler, Thorndike, Bühler y Pavlov fue muysemejante.

    La prueba de educación especial (C)

    Respecto del área I) midió conocimientos en neurología, psicologíacognitiva, lingüística y ética. En el área II) exploró conocimientosespecializados sobre psicología del aprendizaje, interculturalidad,drogadicción y enfoques sobre discapacidades. En el área III) seevaluó la capacidad para manejar alternativas de planificación yconstrucción curricular y conocimientos especializados en el ma-nejo de recursos pedagógicos para solucionar problemas propiosde la educación especial.

    03_cap2.p65 29/11/2006, 12:40 p.m.50

  • 51

    La prueba de educación secundaria —matemática (D)

    En el área I) exploró conocimientos de historia de la matemática yde grandes creaciones matemática. Asimismo, en esta área se eva-luó información sobre ecología y sobre la aplicación de la matemá-tica a la comprensión de problemas económicos. En el área II) seevaluó el conocimiento de corrientes en la enseñanza de la mate-mática y capacidad para manejar conceptos, demostraciones yaplicaciones en los campos del cálculo integral y diferencial, lateoría de conjuntos, la teoría de números y la lógica proposicional.En el área III) se examinaron dificultades en la enseñanza dealgoritmos matemáticos y en la aplicación de metodologías delaprendizaje. Se exploró el manejo de recursos pedagógicos, comolos mapas conceptuales, para solucionar problemas de planea-miento de la enseñanza y aprendizaje de la matemática.

    La prueba de educación secundaria —ciencias naturales (E)

    En el área I) exploró conocimientos de historia de la ciencia en loscampos de la física, química, biología y cosmología. También se eva-luó en esta área conocimiento y manejo de conceptos ecológicos ycapacidad para interpretar estadísticas económicas y educaciona-les. En el área II) se evaluó concepciones psicológicas que orientan laenseñanza de la ciencia y conocimientos especializados en las áreasde biología, física y química. En el área III) se evaluó el manejo demetodologías, diseños curriculares y recursos didácticos para resol-ver problemas de aprendizaje en la enseñanza de las ciencias y ad-ministrar instrumentos de evaluación del rendimiento.

    La prueba de educación secundaria —ciencias sociales (F)

    En el área I) se evaluó conocimientos de antropología, filosofía dela historia, derechos humanos, ecología y manejo de estadísticassociales. En el área II) se evaluó corrientes pedagógicas en la ense-ñanza de las ciencias sociales, manejo curricular, historia del Perú,historia del pensamiento social, geografía y ecología. En el área III)se evaluó la capacidad para planificar la enseñanza de las cien-cias sociales, el dominio de recursos didácticos y de materiales

    03_cap2.p65 29/11/2006, 12:40 p.m.51

  • 52

    educativos, la capacidad para construir mapas conceptuales y elmanejo de instrumentos de evaluación.

    La prueba de educación secundaria —comunicación (G)

    En el área I) se evaluó conocimientos sobre literatura hispano-americana y universal, derechos humanos, multilingüismo, ecolo-gía y capacidad para interpretar estadísticas educacionales. En elárea II) se evaluó las corrientes pedagógicas más influyentes en laenseñanza de los mecanismos del acto comunicativo y en el buenuso del castellano. Igualmente, se evaluó corrientes en crítica lite-raria e información sobre literatura peruana e hispanoamericana.En el área III) se evaluó el uso de recursos didácticos para la ense-ñanza del lenguaje audiovisual, la crítica literaria, la apreciaciónestética, el procesamiento de información y el manejo de mapasconceptuales.

    La prueba de educación secundaria —educación artística (H)

    En el área I) se evaluó conocimientos de los géneros artísticosclásicos, filosofía del arte, historia del arte e información sobrelas grandes producciones universales en los campos de la literatu-ra, pintura, escultura, música, etc. En el área II) se evaluó conoci-mientos sobre el arte peruano, en la arquitectura, escultura, expre-sión corporal, composición artística, música popular y técnicas yconceptos para analizar y apreciar las expresiones artísticas engeneral. También se evaluó el conocimiento de las relaciones entreel arte y la actividad lúdica. En el área III) se evaluó la capacidadpara organizar la enseñanza del arte a través de unidades didácti-cas, ejercitación en técnicas de producción artística, organizaciónde exposiciones y de actuaciones y apreciación de espectáculosartísticos.

    Prueba de educación secundaria-inglés (Proficiency Test for EnglishTeachers) (I)

    Esta prueba en su conjunto evaluó en primer término la capacidadpara leer y comprender textos escritos en inglés en los niveles bási-

    03_cap2.p65 29/11/2006, 12:40 p.m.52

  • 53

    co e intermedio. En el área I) se evaluó cultura general en funciónde conocimientos de la evolución histórica de la lengua inglesa,sus expresiones literarias más notables y el sentido social y educa-cional de la enseñanza del inglés en el Perú. En el área II) se evaluóla capacidad para la comprensión del inglés en su uso social y ensu uso científico, especialmente en el campo pedagógico y en elmanejo de razonamientos considerando tanto los aspectossintácticos como los semánticos. También se evaluó los conoci-mientos sobre currículo y diversificación curricular, los conoci-mientos didácticos para la enseñanza de una segunda lengua ylas características del acto comunicativo. En el área III) se evaluó elconocimiento de recursos didácticos para facilitar la enseñanza dela gramática, la fonética y la sintaxis del inglés. También se evaluóel manejo de carteles, material audiovisual e instrumentos de eva-luación del aprendizaje.

    Prueba de educación secundaria —educación física (J)

    Esta prueba evaluó en el área I) conocimientos sobre las bases cien-tíficas de la educación física, explorando clasificaciones,indicadores de salud, información sobre adicciones y capacidadpara comprender información expresada en forma gráfica. En elárea II) se evaluó conocimientos de corrientes pedagógicas, conoci-mientos sobre el currículo de educación física en primaria y secun-daria y conocimientos sobre la jerarquización de las competenciasmotrices que deben lograr los educandos. En el área III) se evaluó lacapacidad para solucionar problemas de dirección de la ejecuciónde ejercicios físicos, del entrenamiento, de la práctica del deporte ydel atletismo. Asimismo, se evaluó conocimientos de higiene y fi-siología ligados a la realización del ejercicio físico.

    Prueba de educación secundaria con variante técnica (K)

    En el área I) se evaluó información sobre historia de la racio-nalización del trabajo, economía política, organismos internacio-nales ligados a los derechos laborales y de la infancia, característi-cas del mercado laboral. En el área II) se evaluó corrientes pedagó-gicas que han enfatizado el trabajo y la actividad como medios de

    03_cap2.p65 29/11/2006, 12:40 p.m.53

  • 54

    aprendizaje, la organización de talleres de aprendizaje y entrena-miento, el manejo de hojas de instrucción, de perfiles profesionalesy la administración curricular en términos que establezcan pro-porciones adecuadas entre los conocimientos científicos huma-nísticos y tecnológicos así como la práctica correspondiente. En elárea III) se probó la capacidad para resolver problemas de uso deunidades didácticas, de estrategias de enseñanza de los roles labo-rales, de organización de cursos y módulos de entrenamiento, deaplicaciones de informática, de construcción y aplicación de ins-trumentos de evaluación del aprendizaje y de desempeños y deelaboración y ejecución de proyectos.

    Prueba de centros de educación ocupacional (L)

    En el área I) se evaluó conocimientos históricos sobre la evolucióny avance de la tecnología. Se evaluó conocimientos sobre derechoshumanos, mercado de trabajo, el proceso de descentralización delPerú, problemas de la infancia y ecología. En el área II) se evaluóconocimientos sobre las relaciones entre corrientes psicológicas ypedagógicas, las características del autoaprendizaje, los módulosde educación tecnológica, perfiles profesionales, definiciones decompetencias laborales y la diversificación curricular orientada ala educación tecnológica enfatizando el autoestudio. En el área III)se evaluó capacidades para la planificación de la enseñanza técni-ca, la programación, el uso de medios audiovisuales y la elabora-ción de diseños de instrucción. También se exploró la capacidadpara dirigir la enseñanza de módulos específicos y la manera comodebe evaluarse el logro de competencias, habilidades y destrezas.

    Prueba para Institutos Superiores Tecnológicos (M)

    En el área I) se evaluó conocimientos sobre concepciones psicoló-gicas sobre inteligencia, derechos humanos, historia de la educa-ción técnica, ecología y el proceso de descentralización del Perú.En el área II) se evaluó conocimientos sobre clasificaciones del apren-dizaje, perfiles profesionales, clasificación de los roles y funcionesen el campo laboral, organización del trabajo en taller, definiciónde competencias laborales y emisión de certificaciones laborales.

    03_cap2.p65 29/11/2006, 12:40 p.m.54

  • 55

    En el área III) se midió capacidad para el diagnóstico situacionalen base al análisis FODA, para la planificación curricular, para laelaboración de diseños de instrucción, para diseñar el control de lacalidad de los productos, para aplicar los recursos informáticos ala racionalización y reingeniería de los procesos, para jerarquizarlos niveles de calificación, usar instrumentos de evaluación y emi-tir certificaciones.

    Prueba de educación religiosa (N)

    En el área I) se evaluó conocimientos de filosofía antigua y de filo-sofía escolástica, conocimientos sobre las relaciones entre religióny desarrollo económico, religión y problemas de género, religión ypolítica social en el Perú, en Latinoamérica y en el mundo. En elárea II) se evaluó concepciones psicológicas sobre el aprendizaje,conocimientos sobre la exégesis de libros del antiguo y del nuevotestamento, conceptualizaciones acerca del funcionamiento insti-tucional de la Iglesia católica poniendo énfasis en los Concilios ytesis filosóficas sobre la libertad, la responsabilidad moral y el sen-tido de la educación religiosa orientada por la jerarquía de la Igle-sia católica dentro del currículo de la educación primaria y de lasecundaria. En el área III) se evaluó capacidad para planificar laenseñanza, utilizar módulos de aprendizaje y dirigir el trabajo enel aula, enfatizando el rol de la educación en valores. También seexploró la capacidad para aplicar la diversificación curricular a laeducación religiosa y para utilizar instrumentos de evaluación delaprendizaje. Respecto a esta prueba aclaramos que el equipo acargo de la misma respetó en su totalidad la estructura general delas pruebas antes analizada. Asimismo, sus integrantes estuvie-ron presentes en el seminario-taller de construcción de preguntasmencionado líneas arriba y, por tanto, participaron de la conferen-cia y de las instrucciones sobre la estructura de las preguntas. Sinembargo, como hemos anotado antes, la designación de este equi-po de trabajo y la supervisión del cumplimiento de sus funcionesfue de estricta responsabilidad de la Conferencia Episcopal.

    03_cap2.p65 29/11/2006, 12:40 p.m.55

  • 56

    03_cap2.p65 29/11/2006, 12:40 p.m.56