memoria francisco javier ros castellón
TRANSCRIPT
-
UNIVERSIDAD DE GRANADA DEPARTAMENTO DE ESTADSTICA E INVESTIGACIN OPERATIVA
Modelo Logit para el Estudio del Fracaso
Escolar en ESO Mster en Estadstica Aplicada
Francisco Javier Ros Castelln
Granada, 2012
-
MODELO LOGIT PARA EL ESTUDIO DEL FRACASO ESCOLAR EN EDUCACIN SECUNDARIA
OBLIGATORIA
Trabajo Fin de Mster presentado por Francisco Javier Ros Castelln y
realizado en el Departamento de Estadstica e Investigacin Operativa para
optar al ttulo de Mster en Estadstica Aplicada.
Granada, septiembre de 2012
Francisco Javier Ros Castelln
Profesor tutor
Don Pedro Antonio Garca Lpez
-
TABLA DE CONTENIDOS
INTRODUCCIN
ALGO FALLA EN EL INSTITUTO .................................................................................................1
OBJETIVOS DE ESTE TRABAJO FIN DE MSTER ............................................................................2
ORGANIZACIN DE ESTA MEMORIA Y APORTACIONES...................................................................3
PROBLEMAS ABIERTOS ..........................................................................................................4
CAPTULO 1. FRACASO ESCOLAR EN EDUCACIN SECUNDARIA
EL FRACASO ESCOLAR, UN ASUNTO PREOCUPANTE......................................................................6
CUANTIFICACIN DEL FRACASO ESCOLAR ..................................................................................9
CAPTULO 2. DESCRIPCIN DE LA BATERA BADyG-M RENOVADO Y LAS PRUEBAS DE
EVALUACIN DE DIAGNSTICO (PED)
SOBRE BADYG-M RENOVADO ............................................................................................. 13
Descripcin de las pruebas ........................................................................................ 14
Normas de correccin ............................................................................................... 19
SOBRE LAS PRUEBAS DE EVALUACIN DE DIAGNSTICO (PED) .................................................... 22
Competencias evaluadas ........................................................................................... 22
Instrumentos utilizados ............................................................................................. 23
CAPTULO 3. FUNDAMENTOS TERICOS
MODELOS DE RESPUESTA DISCRETA ...................................................................................... 27
Introduccin a los Modelos de Respuesta Binaria ...................................................... 28
MODELOS LOGIT CON VARIABLES EXPLICATIVAS CUANTITATIVAS .................................................. 38
Modelo de regresin logstica simple ........................................................................ 39
-
Modelo de regresin logstica mltiple ...................................................................... 41
Modelos con interaccin ........................................................................................... 44
Ajuste de modelos logit ............................................................................................. 46
Inferencia en regresin logit ...................................................................................... 49
Validacin y diagnosis de modelos logit ..................................................................... 56
Seleccin de modelos logit ........................................................................................ 60
CAPTULO 4. APLICACIN AL ESTUDIO DE LA PREDICCIN DE FRACASO ESCOLAR EN
EDUCACIN SECUNDARIA OBLIGATORIA
ESTUDIO DE LA CAPACIDAD PREDICTIVA DEL BADYG-M SOBRE EL FRACASO ESCOLAR ....................... 63
Datos del estudio ...................................................................................................... 64
Seleccin de variables y ajuste del modelo logit ........................................................ 70
Parmetros del modelo ............................................................................................. 72
Bondad de ajuste ...................................................................................................... 73
Interpretacin del modelo ......................................................................................... 76
Validacin y diagnosis ............................................................................................... 77
Observaciones ........................................................................................................... 78
ESTUDIO DE LA CAPACIDAD PREDICTIVA DE LAS PED SOBRE EL FRACASO ESCOLAR ............................ 79
Datos del estudio ...................................................................................................... 80
Seleccin de variables y ajuste del modelo ................................................................ 83
Bondad del ajuste...................................................................................................... 84
Observaciones ........................................................................................................... 86
CONCLUSIONES FINALES ...................................................................................................... 86
Anexo I
Anexo II
Bibliografa
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
1
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Introduccin
ALGO FALLA EN EL INSTITUTO1
ANDALUCA ARRASTRA UNA TASA DEL 34,7% DE ABANDONO EDUCATIVO TEMPRANO
EL RETO ES MEJORAR EL RENDIMIENTO EN SECUNDARIA, QUE ES MS BAJO QUE EN LOS COLEGIOS
MANUEL PLANELLES Sevilla 9 MAR 2012 - 14:24 CET
Las seales estn ah, en las distintas evaluaciones a las que se somete el sistema
andaluz de enseanza. El rendimiento de los estudiantes de los institutos es peor
que el de los alumnos en los colegios. La ltima consecuencia de esta situacin
lleva a que Andaluca sea la tercera comunidad autnoma con mayor tasa de
abandono educativo temprano de todo el Estado. Este ndice es el porcentaje de
poblacin de 18 a 24 aos que no ha completado la ESO y no sigue estudiando. La
media espaola de abandono en 2010 el ao analizado por el ministerio era
del 28,4. La de Andaluca estaba en el 34,7. El sistema funciona como una cadena:
esos chicos que salen de las aulas sin titulacin son los que luego lo tienen ms
complicado para encontrar un empleo al entrar en el mercado laboral.
1 Artculo aparecido en ElPais.com el sbado 10 de marzo de 2012 Manuel Planelles. http://ccaa.elpais.com/ccaa/2012/03/09/andalucia/1331293691_414305.html
-
2 UNIVERSIDAD DE GRANADA Objetivos de este Trabajo Fin de Mster
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Este artculo, aparecido en ElPais.com el pasado 9 de marzo de 2012, sirve para
introducir la situacin actual en los centros de Educacin Secundaria y nos invita a
reflexionar sobre lo que podemos aportar cada uno de nosotros para mejorar esta
situacin.
La Educacin es uno de los pilares bsicos de cualquier sociedad actual, por lo que el
fracaso escolar es, sin lugar a dudas, un problema de primer orden, y muy
especialmente en Espaa y ms concretamente en Andaluca. Adems, esta sensibilidad
se ha visto favorecida por la aparicin de numerosos anlisis y estudios que intentan
averiguar sus causas.
Es por todo esto que, como docente en un instituto de Educacin Secundaria y alumno
de este Mster en Estadstica Aplicada, he intentado aunar estos dos aspectos para
intentar dar una propuesta de trabajo que pueda aportar un poco de luz sobre este
problema. Qu podemos hacer para mejorar esta situacin en los institutos?
Con este Trabajo Fin de Mster pretendemos ofrecer un mecanismo de deteccin precoz
de alumnado con altas probabilidades de fracaso escolar para que los centros puedan
articular mecanismos de actuacin preventivos que ayuden a paliarlo. Para ello nos
basaremos, fundamentalmente, en una batera de test para medir las capacidades y
habilidades acadmicas de los alumnos, conocida como BADyG-M Renovado; y en las
Pruebas de Evaluacin de Diagnstico realizadas por la Consejera de Educacin de la
Junta de Andaluca desde hace varios aos.
OBJETIVOS DE ESTE TRABAJO FIN DE MSTER
El objetivo principal de este trabajo es el estudio de la capacidad predictiva de la BATERA
DE APTITUDES DIFERENCIALES Y GENERALES (BADYG-M RENOVADO) y las PRUEBAS DE
EVALUACIN DE DIAGNSTICO (PED) sobre el fracaso escolar en alumnado de Educacin
Secundaria Obligatoria. As, se pretende detectar, en base a estas pruebas, futuros casos
de fracaso escolar, entendido ste como el abandono del sistema educativo sin la
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
3
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
consecucin del ttulo de Graduado en ESO, a fin de prevenirlo y establecer un plan de
actuacin con el alumnado afectado.
La prueba BADYG-M Renovado es uno de los instrumentos ms utilizados en Orientacin
Escolar para medir las capacidades y habilidades acadmicas de los alumnos, numerosos
trabajos dentro de la investigacin as lo corroboran.
Respecto a las Pruebas de Evaluacin de Diagnstico, PED, decir que su realizacin
responde al propsito de la Consejera de Educacin de conocer e informar acerca de los
progresos conseguidos por el alumnado y los centros educativos de la Comunidad
Autnoma de Andaluca. Estas pruebas proporcionan informacin relevante en la que
basar las medidas necesarias para superar las diferencias existentes entre el nivel
competencial que se espera que el alumnado desarrolle y el que realmente ha alcanzado
en el momento de completar dicha prueba.
Para finalizar destacaremos el hecho de que se pretende que el resultado de este
trabajo sea eminentemente prctico para el profesorado de Educacin Secundaria de
manera que aporte un procedimiento claro y asequible para la prediccin de futuros
casos de fracaso escolar. Es por esto que nos centraremos nicamente en variables
controlables desde los centros educativos mantenindonos al margen de aquellas no
controlables tales como situacin familiar, entre otras.
ORGANIZACIN DE ESTA MEMORIA Y APORTACIONES
Este trabajo est organizado en 4 captulos estando el ltimo dedicado al objetivo
fundamental de este trabajo, el estudio con datos reales de la capacidad predictiva de la
batera BADyG-M Renovado y las Pruebas de Evaluacin de Diagnstico (PED) sobre el
fracaso escolar en ESO.
-
4 UNIVERSIDAD DE GRANADA Problemas abiertos
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
El Captulo 1, Fracaso Escolar en Educacin Secundaria, est dedicado al fracaso escolar,
su problemtica, formulacin, incidencia en Espaa en general y en Andaluca en
particular, y el problema de su cuantificacin.
En el Captulo 2, Descripcin de la batera BADyG-M Renovado y las Pruebas de
Evaluacin de Diagnstico, se ofrece una visin general de las distintas pruebas de
diagnstico utilizadas en el estudio. En primer lugar se describe la BATERA DE APTITUDES
DIFERENCIALES Y GENERALES, BADyG-M Renovado, a fin de conocer sus caractersticas,
estructura y test y variables que la forman. A continuacin se procede igualmente con
las PRUEBAS DE EVALUACIN DE DIAGNSTICO, PED.
En el Captulo 3, Fundamentos tericos, se hace una recopilacin de las tcnicas
estadsticas que se usarn en nuestro estudio, en nuestro caso se trata de la regresin
logstica.
En el Captulo 4, Aplicacin al estudio de la prediccin de fracaso escolar en Educacin
Secundaria Obligatoria, se proceder al anlisis de los datos. En primer lugar
realizaremos el estudio usando la batera BADyG-M Renovado, pasaremos despus al
estudio de nuestro problema usando las PED. Concluiremos este captulo con el
establecimiento de propuestas de ampliacin, entre las que destacaremos una
propuesta de intervencin experimental.
En cuanto a las aportaciones de este trabajo destacaremos dos. En primer lugar el uso
de las pruebas BADyG-M Renovado y las PED como predictoras de fracaso escolar y, en
segundo lugar, la disponibilidad de datos reales de seis promociones que pueden servir
de base para estudios posteriores.
PROBLEMAS ABIERTOS
Una vez finalizado este trabajo quedan abiertos varios problemas.
1. Confirmacin de los resultados obtenidos mediante la inclusin de nuevas
promociones al estudio.
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
5
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
2. Una vez confirmada la validez del mtodo de diagnstico de futuros casos de
fracaso escolar queda pendiente la elaboracin de un plan de actuacin con el
alumnado para intentar evitar su fracaso efectivo.
3. Seguimiento y evaluacin de la efectividad del plan de actuacin sobre
alumnado en riesgo de fracaso escolar.
-
6 UNIVERSIDAD DE GRANADA El Fracaso Escolar, un asunto preocupante
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Captulo 1
Fracaso Escolar en Educacin Secundaria
EL FRACASO ESCOLAR, UN ASUNTO PREOCUPANTE
Est socialmente aceptado que la Educacin es uno de los pilares bsicos de cualquier
sociedad actual, por lo que el fracaso escolar es considerado como un problema de
primer orden llegando incluso a ser motivo de alarma social, y muy especialmente en
Espaa donde sus tasas estn por encima de la media europea y de los pases de la
OCDE2. Adems, esta sensibilidad se ha visto favorecida por la aparicin de numerosos
anlisis y estudios que intentan averiguar sus causas.
El fracaso escolar es un concepto vinculado a la extensin de la escolarizacin
obligatoria. Si bien en Espaa, antes de 1970, no tena sentido hablar de fracaso escolar
debido a que no exista una escolarizacin mnima para toda la poblacin es hacia el
final de la dictadura, con la Ley General de Educacin (LGE) de 1973, cuando se modific
2 Organizacin para la Cooperacin y el Desarrollo Econmicos.
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
7
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
esta situacin estableciendo la Educacin General Bsica (EGB) como el nivel educativo
mnimo para toda la poblacin, que se poda obtener a los 14 aos. Al finalizar este nivel
se obtena el Ttulo de Graduado Escolar y no obtener este ttulo era sinnimo de
fracaso escolar. Con la Ley Orgnica de Ordenacin del Sistema Educativo (LOGSE) se
prolonga la educacin obligatoria hasta los 16 aos, a partir de este momento el fracaso
escolar es el resultado de no lograr el ttulo de Educacin Secundaria Obligatoria (ESO).
Desde el punto de vista del individuo, tal como se expone en (Fernndez Enguita, et al.,
2010),
Las oportunidades sociales de las personas dependen cada vez ms de su
cualificacin, de su capital humano, de su capacidad de obtener, manejar e
interpretar la informacin, de emplear y adquirir el conocimiento. () Quienes
obtengan el mximo de su formacin inicial accedern por ello mismo a empleos
ms enriquecedores () y tendrn ms y mejores oportunidades de formacin
ulterior, sea en el trabajo, volviendo a las aulas o con sus propios medios. En
cambio, quienes desaprovechen esa formacin inicial o no logren beneficiarse de
ella tendrn ms probabilidades de acabar en el desempleo o en puestos de
trabajo poco cualificados, en los que hay poco que aprender y menos
oportunidades de acceder a la formacin ulterior y de aprovecharla.
Parece pues que se abre una brecha cada vez mayor entre el trabajo cualificado y el no
cualificado, de manera que a quien comience bien continuar mejor, y viceversa.
Adems, es un lema de las polticas europeas que, como tal, se recoge en la LOE as
como en otras leyes educativas autonmicas (Andaluca, Cantabria, Catalua), lograr el
xito educativo para todos, garantizando a todos la adquisicin de un conjunto de
competencias consideradas imprescindibles para la integracin social (Bolvar Bota &
Lpez Calvo, 2009).
Dentro del Programa Educacin y Formacin 2010, la UE estableci cinco objetivos en
materia de educacin que deberan alcanzarse como muy tarde en 2010: situar la tasa
de abandono escolar por debajo del 10%; reducir a un 17% el porcentaje de alumnos
con problemas de comprensin lectora; lograr que el 85% de los jvenes (a los 22 aos)
-
8 UNIVERSIDAD DE GRANADA El Fracaso Escolar, un asunto preocupante
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
completen la Educacin Secundaria; aumentar en un 15% el nmero de diplomados en
Matemticas, Ciencias y Tecnologas; y lograr que el 12.5% de la poblacin adulta
participe en formacin continua. La situacin de Europa y Espaa en relacin con estos
objetivos se recoge en la Tabla 1 (Bolvar Bota & Lpez Calvo, 2009). Como vemos,
Espaa tiene un serio problema de abandono escolar sin titulacin en Educacin
Secundaria Obligatoria, en torno al 30%, que junto con el bajo porcentaje de
reincorporacin posterior al sistema educativo tiene graves consecuencias sociales y
laborales para el alumnado que no ha alcanzado la formacin adecuada.
TABLA 1. GRADO DE CONSECUCIN POR ESPAA DE LOS OBJETIVOS EUROPEOS (COMMISSION OF THE EUROPEAN
COMMUNITIES, 2009)
Objetivo UE 2010 Europa, 2009 Espaa, 2009
Abandono escolar 10% 15% 31%
Reducir el nmero de jvenes de 15 aos con dificultades para leer
15.5% 19.8% 21.1%
Titulados Secundaria 85% 76.7% 61.8%
Aumentar Licenciados Matemticas, Ciencias y Tecnologas
15% 27% 16%
Formacin continua 12.5% 9.9% 5.1%
Inversin pblica educativa - 5.2% 4.4%
Por otra parte, en la comunicacin de la Comisin Europea al Parlamento Europeo, al
Consejo, al Comit Econmico y Social Europeo y al Comit de las Regiones, de 31 de
enero de 2011, sobre cmo abordar el abandono escolar prematuro3 (una contribucin
clave a la agenda Europa 2020), se analiza su impacto en las personas, la sociedad y la
economa, se resumen sus causas y se ofrece una descripcin general de las medidas
actuales y futuras a escala de la UE para abordar esta cuestin (Comisin Europea, 2011)
Como vemos existe una gran preocupacin por parte de diversas instituciones con
responsabilidades en temas educativos por abordar este problema con grandes
implicaciones sociales y econmicas.
3 El trmino abandono escolar prematuro incluye todas las formas de abandono de la educacin y la formacin antes de concluir el segundo ciclo de enseanza secundaria o su equivalente en formacin profesional.
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
9
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
CUANTIFICACIN DEL FRACASO ESCOLAR
A la hora de cuantificar el fracaso escolar surge el problema de cmo definirlo de
manera que se elimine toda ambigedad sobre el mismo. Hasta ahora nos hemos
referido al fracaso escolar como la no consecucin del ttulo educativo, que podemos
definir como FRACASO ESCOLAR ADMINISTRATIVO. Marchesi (Marchesi, 2000) da una
definicin concreta y fcil de cuantificar: porcentaje de alumnos que no obtiene la
titulacin que acredita haber finalizado satisfactoriamente la educacin obligatoria.
Si bien esta expresin del fracaso escolar es ampliamente aceptada, no se corresponde,
en general, con la que se utiliza en los datos oficiales que, normalmente, hacen
referencia a los alumnos que no titulan sobre el total de los evaluados en 4 de ESO, que
denominaremos NDICE DE NO TITULACIN ( ). Reservamos el trmino NDICE DE FRACASO
ESCOLAR ( ) para la proporcin de alumnos que abandona el sistema educativo sin
obtener el ttulo de Graduado en Educacin Secundaria Obligatoria (ESO). As pues,
tenemos que:
Las tres posibles salidas del alumnado tras su evaluacin en 4 ESO son titular, repetir o
abandonar el sistema educativo sin obtener el ttulo de Graduado en Educacin
Secundaria. Solo estos ltimos estn incluidos en el ndice , mientras que incluye
como a los alumnos que no titulan un ao pero que repiten y al siguiente pueden
hacerlo. Observamos, por tanto, que es una estimacin por defecto del fracaso
escolar (no incluye a los alumnos que repiten), mientras que lo es por exceso
(incluye como fracaso a alumnos que repiten y an pueden titular). De donde se deduce
que, si tomamos como referencia los alumnos de 4 ESO, .
-
10 UNIVERSIDAD DE GRANADA Cuantificacin del Fracaso Escolar
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Pero nuestro sistema educativo es ms complejo ya que debemos tener en cuenta que
existe un porcentaje de alumnos que no permanece en el sistema educativo hasta el
final de la ESO, abandonando antes de llegar a ser evaluados en 4 ESO.
TABLA 2. FLUJO DE ALUMNOS DE UNA COHORTE A LO LARGO DE LOS TRES LTIMOS CURSOS DE LA ESO
En la Pero nuestro sistema educativo es ms complejo ya que debemos tener en cuenta
que existe un porcentaje de alumnos que no permanece en el sistema educativo hasta el
final de la ESO, abandonando antes de llegar a ser evaluados en 4 ESO.
Tabla 2 se representa el flujo de alumnos de una cohorte a lo largo de los tres ltimos
cursos de la ESO. Cada curso tiene tres entradas y tres salidas posibles. Las salidas son
las mismas que hemos considerado antes, los alumnos pueden promocionar de curso
Evaluados en 4 ESO
Repiten
Titulan Abandonan
Curso 06-07 Curso 07-08 Curso 08-09 Curso 09-10
2 ESO
2 ESO
A2 N3
3 ESO
3 ESO
3 ESO
A3 N4
4 ESO
4 ESO
4 ESO
A4
N2
Repiten
Repiten
Repiten
Repiten
Repiten
Repiten
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
11
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
(en 4 ESO supone titular), pueden repetir de curso o abandonar el sistema educativo
( ). En cuanto a las entradas, los alumnos pueden proceder de la promocin desde el
curso anterior, de la repeticin del mismo curso y de nueva matrcula ( ).
A partir de este diagrama hay que incluir dentro de la suma de todos los abandonos
( ). Por otra parte, el nmero total de alumnos de esa cohorte, al que se
deben referir los resultados del abandono ( ), es la suma de las entradas de los alumnos
nuevos, que incluye los que entran en 2 ESO procedentes de 1 ESO ( ).
De modo que, mientras la frmula de no cambia, la de queda en la forma:
Destaquemos el hecho de que contina siendo una estimacin por defecto del
fracaso escolar, por las mismas razones que antes, pero la relacin entre y se
vuelve ms compleja.
La diferencia entre ambos ndices nos proporciona informacin sobre el sistema de
escolarizacin. Cuando es menor que ( ), el sistema favorece el
abandono y dificulta la repeticin, y viceversa, cuando es mayor que (
), el sistema prima la permanencia del alumno, disminuyendo el abandono a
expensas de una mayor repeticin.
En lo que se refiere a los ndices utilizados para calcular el fracaso escolar, parece
evidente que el ndice de no-titulacin ( ) no es un buen indicador del fracaso escolar.
En primer lugar, premia, con un ndice artificialmente bajo, las estrategias que
favorecen el abandono temprano del alumno (que no son contabilizadas como fracaso
escolar), mientras que castiga aquellas que favorecen la permanencia del alumno.
Paradjicamente, estas ltimas obtienen mejores resultados, tanto medidos mediante
, como a travs de . En segundo lugar, no es un ndice por exceso del fracaso
escolar, pero tampoco se puede asegurar que lo sea por defecto, de modo que, al
utilizarlo, no se sabe ni la cuanta ni el signo del error cometido.
Frente a , el ndice de fracaso-escolar que proponemos ( ) tiene la ventaja de ser
un ndice por defecto, lo que nos permite, al menos, conocer el sentido del error
-
12 UNIVERSIDAD DE GRANADA Cuantificacin del Fracaso Escolar
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
cometido. Por otro lado, su clculo resulta sencillo a partir de los datos de matrcula,
repeticin y promocin.
En nuestra opinin, es recomendable el clculo de ambos ndices y el de su diferencia
( ), lo que, permite distinguir dos tipos de sistemas de escolarizacin: los que
priman la permanencia del alumno, a expensas de prolongar su vida escolar y los que
favorecen el abandono del alumno sin llegar a titular.
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
13
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Captulo 2
Descripcin de la batera BADyG-M Renovado y las Pruebas de
Evaluacin de Diagnstico (PED)
A continuacin se describen las pruebas usadas en nuestro estudio, su organizacin,
caractersticas, test que las forman Para ello hemos usado los siguientes textos de
referencia: para la Batera de Aptitudes Diferenciales y Generales BADyG-M Renovado,
el manual tcnico de dicha batera (Yuste, et al., 2002); y para las Pruebas de Evaluacin
de Diagnstico (PED) el ltimo informe de resultados publicado por la Agencia Andaluza
de Evaluacin Educativa (Agencia Andaluza de Evaluacin Educativa, 2011).
SOBRE BADYG-M RENOVADO
La Batera de Aptitudes Diferenciales y Generales BADyG-M Renovado (Yuste &
Martnez, 2003) ha sido durante aos el instrumento ms usado, tanto por los Equipos
de Orientacin Educativa y Psicoeducativa (EOEPs) como por los Orientadores Escolares
-
14 UNIVERSIDAD DE GRANADA Sobre BADyG-M Renovado
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
de los Institutos de Educacin Secundaria, para realizar evaluaciones psicopedaggicas
(Monsalvo Dez & Carbonero Martn, 2009). Esta batera est formada por varias
pruebas que pasamos a describir (Yuste, et al., 2002).
DESCRIPCIN DE LAS PRUEBAS
RELACIONES ANALGICAS,
Se trata de encontrar relaciones analgicas entre conceptos. Una nos la dan completa y
a la otra le falta un trmino que hay que buscar entre las cinco posibles respuestas
numeradas con letras.
Es una prueba especfica de Razonamiento y Comprensin verbal. Consta de 32
elementos ordenados segn un ndice de dificultad, con cinco alternativas de respuesta.
Las analogas se usan tradicionalmente como la mejor manera de medir la llamada
Aptitud o Inteligencia Verbal. Se utilizan contenidos verbales, conceptos, y se pide
reconocer relaciones analgicas entre parejas, lo que conlleva una operacin de
reconocimiento de significados y relaciones de segundo orden entre ellos. Porque se
trata no solamente de establecer relaciones semnticas (que podramos denominar de
primer orden), sino de determinar la similitud o adecuacin de las relaciones
establecidas.
No es fundamentalmente una prueba de comprensin, de vocabulario, sino de
Razonamiento Inductivo.
La puntuacin de la prueba de Analogas, , indica la aptitud para inducir relaciones
analgicas entre conceptos. Al mismo tiempo est presente un factor semntico de
conocimiento de vocabulario.
El reconocimiento de relaciones implica un pensamiento abstracto, ya que no se trata
nicamente de establecer relaciones ms o menos concretas y observables, sino de
identificar la similitud entre parejas de conceptos relacionados.
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
15
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
SERIES NUMRICAS,
Se trata de completar cada serie numrica con el siguiente elemento. Los nmeros estn
ordenados siguiendo una secuencia lgica que se debe descubrir.
Es una prueba especfica de razonamiento serial numrico o aptitud para determinar
regularidades lgicas en una secuencia de nmeros. Al mismo tiempo, al utilizar cdigos
numricos, necesita una bsica capacidad para el clculo mental, puesto que las
regularidades lgicas se refieren a operaciones (sumas, restas, multiplicacin, divisin)
entre series lineales de nmeros. Consta de 32 elementos ordenados segn un ndice de
dificultad, con cinco alternativas de respuesta.
Con esta prueba se pretende medir, con contenidos numricos, la capacidad de
Razonamiento consistente en detectar los periodos de repeticin o secuencias en que se
ordenan series numricas lineales. El nmero, como contenido de informacin se presta
especialmente bien a realizar complejas y variadas series, por representar a su vez una
serie lineal de longitud infinita, de distancias iguales entre cada elemento serial.
MATRICES LGICAS,
Se trata de buscar en cada ejercicio el dibujo que debe ir donde est la interrogacin,
teniendo en cuenta que estn ordenados siguiendo una lgica.
El Razonamiento menos automatizado, menos trabajado culturalmente, se suele medir
con contenidos figurativos, con series o matrices de figuras. Representan una modalidad
de contenido que no se utiliza explcitamente en los programas educativos para ensear
ninguna asignatura ni impartir conocimientos. Aunque el reconocimiento de las formas
de las figuras geomtricas y sus propiedades s se ensea y se utiliza en geometra, en
dibujo. La estricta ausencia de influjo cultural de este tipo de contenidos tambin la
podemos, por tanto, cuestionar. Pero es indudable que no se utiliza en procesos que
requieran Razonamiento lgico y por ello s podemos afirmar que estn ms libres que
otros tipos de contenidos de influjo cultural. Consta de 32 elementos ordenados segn
un ndice de dificultad, con cinco alternativas de respuesta.
-
16 UNIVERSIDAD DE GRANADA Sobre BADyG-M Renovado
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Esta prueba mide la capacidad para el razonamiento inductivo, para relacionar
lgicamente complejos conjuntos de datos codificados visualmente en forma de figuras
geomtricas.
COMPLETAR ORACIONES,
Se trata de encontrar el concepto o palabra que complete o cierre mejor el sentido de
una oracin.
La prueba de Completar Oraciones consta de 32 elementos ordenados segn un ndice
de dificultad, con cinco alternativas de respuesta.
Requiere operaciones de reconocimiento de vocabulario y rememorar experiencias o
conocimientos previos.
Esta prueba mide un aspecto importante de la Inteligencia Verbal y requiere sobretodo
reconocimiento integrado de situaciones sobre las que se deben tener algunos
conocimientos previos.
PROBLEMAS NUMRICOS,
Se trata de comparar las cantidades resultantes de resolver problemas numricos para
determinar cul es la mayor. Cuando las dos son iguales, la respuesta correcta ser la
tercera alternativa.
La prueba no mide nicamente rapidez de clculo, sino tambin razonamiento
numrico, la aplicacin de operaciones numricas en problemas numrico/verbales.
Consta de 32 elementos ordenados segn un ndice de dificultad, con tres alternativas
de respuesta.
No se pretende medir el nivel de conocimientos matemticos adquiridos, sino ms bien
la correcta automatizacin de las operaciones matemticas bsicas junto a un
reconocimiento de smbolos aritmticos bsicos. Las operaciones y problemas
planteados en cada nivel suelen haberlas aprendido y practicado desde varios aos
atrs, con mayor o menor complejidad.
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
17
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
En esta prueba, de manera ms acusada que en las dems (a excepcin de ,
Discriminacin de Diferencias), est presente tambin una componente de rapidez, pues
en la prctica los sujetos de mejor puntuacin suelen ser los que ms avanzan (a
excepcin de los que responden al azar), y existe una diferencia mucho ms clara entre
los que acaban y los que no lo hacen.
Nunca se pretende medir nivel de conocimientos matemticos, sino asimilacin de los
aprendidos con anterioridad (al menos dos aos antes ya se suelen trabajar en el
currculum).
La prueba de Resolucin de Problemas, , mide la rapidez y seguridad en el clculo, en
la resolucin de sencillos problemas bsicos aritmtico/geomtricos y en la
comprensin del planteamiento o comprensin de los elementos simblicos aritmticos
con los que se plantea cada problema.
ENCAJAR FIGURAS,
Se trata de buscar la figura que complete perfectamente la parte que se ha recortado de
una superficie.
Consta de 32 elementos ordenados segn un ndice de dificultad, con cuatro alternativas
de respuesta.
Esta prueba se refiere a la facilidad para visualizar cambios de posicin de figuras
macizas bidimensionales que no cambian de forma.
Esta prueba, , mide la capacidad para realizar giros espaciales con figuras
geomtricas, manteniendo sus relaciones de tamao, distancia y posicin relativas para
comprobar la adecuacin de una figura con la superficie de la que se ha recortado.
MEMORIA DE RELATO ORAL,
Se trata de responder a una serie de preguntas acerca de un texto ledo.
Consta de 32 elementos, con tres alternativas de respuesta.
-
18 UNIVERSIDAD DE GRANADA Sobre BADyG-M Renovado
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Las preguntas se dirigen a comprobar la retencin de los detalles del relato, algunos
numricos y la mayora verbales. No se trata de comprobar si los sujetos han entendido
lo ledo, porque el relato es sumamente fcil de seguir, sino de comprobar si recuerdan
detalles concretos.
Esta prueba, , mide la capacidad para recordar a corto plazo datos de un relato
verbal, datos la mayor parte relacionados, dentro del sentido global de la lectura que se
ha escuchado. Es pues una memoria verbal y numrica por el tipo de contenidos a
recordar, frente a otra posible memoria que llamaramos viso/espacial. Es memoria
inmediata, por el corto tiempo en que se pide recuerden los datos, en contraposicin a
la memoria a largo plazo y es auditiva, porque se escucha el relato a recordar, frente a
otra posible modalidad de presentacin de los estmulos, a base de un relato escrito.
MEMORIA VISUAL ORTOGRFICA,
Se trata de buscar la palabra que est ortogrficamente mal escrita. Los acentos o tildes
estn todos bien.
Consta de 32 elementos ordenados segn un ndice de dificultad, con tres alternativas
de respuesta.
La prueba de Memoria Visual Ortogrfica, , mide la retencin en la memoria a largo
plazo de la correcta escritura de las palabras que, aunque fonticamente se pronuncien
igual, se escriben de distinta manera. No depende su reconocimiento de reglas claras
que podran haberse memorizado. S depender su reconocimiento correcto de la mayor
o menor frecuencia en la percepcin de esas palabras, es decir de si un sujeto, en sus
lecturas, las ha observado ms o menos veces que otros sujetos.
DISCRIMINACIN DE DIFERENCIAS,
Se trata de buscar en cada grupo de tres dibujos el que tiene alguna diferencia pequea,
con respecto a los otros dos.
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
19
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Discriminar con rapidez pequeas diferencias visuales es una operacin mental muy
bsica relacionada con procesos atencionales de recepcin y comparacin de
informacin visual.
Los elementos de esta prueba tambin estn ordenados por un ndice de dificultad, pero
tienen todos ndices bastante aproximados: al ser muy breve el tiempo concedido para
la ejecucin, se convierte en test de rapidez perceptiva de diferencias. Consta de 32
elementos ordenados segn un ndice de dificultad, con tres alternativas de respuesta.
Esta prueba, , mide la rapidez perceptiva, la rapidez del sujeto en operaciones
simples de comparacin de detalles entre figuras.
NORMAS DE CORRECCIN
NORMAS GENERALES
Cada una de las pruebas tiene 32 aciertos como mximo posible.
Todas las pruebas, excepto la de Problemas Numricos, , tienen como frmula de
correccin el Nmero de Aciertos, .
donde en caso de acierto del tem ( ) y en caso contrario.
En la prueba de Problemas Numricos, , a los aciertos se le restan la mitad de los
errores, .
con si el tem es correcto y en otro caso; y en caso de error del
tem y en caso contrario.
-
20 UNIVERSIDAD DE GRANADA Sobre BADyG-M Renovado
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
OBTENCIN DE PUNTUACIONES GLOBALES
INTELIGENCIA GENERAL, IG
Se obtiene sumando los aciertos de las seis pruebas bsicas:
1. Relaciones Analgicas,
2. Series Numricas,
3. Matrices Lgicas,
4. Completar Oraciones,
5. Problemas Numricos,
6. Encajar Figuras,
El mximo posible de aciertos es de 192.
La puntuacin de Inteligencia General es una estimacin global teniendo en cuenta las
seis pruebas bsicas de la batera: dos pruebas verbales, dos numricas y dos espaciales.
RAZONAMIENTO LGICO,
Se obtiene sumando los aciertos de las tres primeras pruebas:
1. Relaciones Analgicas,
2. Series Numricas,
3. Matrices Lgicas,
El mximo posible de aciertos es de 96.
La puntuacin de Razonamiento no es ms que la suma de las tres pruebas que lo miden
ms directamente, con tres tipos diferentes de contenidos: Analogas Verbales, ,
Series Numricas, , y Matrices Lgicas, .
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
21
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
El significado de esta puntuacin global viene determinado por las tres pruebas que
componen su puntuacin.
OBTENCIN PUNTUACIONES DE RAPIDEZ Y EFICACIA
RAPIDEZ
La Rapidez se contabiliza sumando las respuestas emitidas en las seis pruebas bsicas.
siendo , , el nmero de respuestas emitidas en cada prueba.
EFICACIA
La Eficacia se obtiene con la siguiente frmula:
, siendo la puntuacin
directa en Inteligencia General como suma de aciertos de las seis pruebas bsicas, y
la puntuacin de Rapidez como suma de las respuestas emitidas en las seis pruebas
bsicas4.
En el BADyG-M Renovado se mide la Rapidez y Eficacia como datos que pueden ser
tiles en una orientacin escolar individualizada. Es cierto que medir la Rapidez como
nmero de elementos emitidos o contestados en las seis pruebas bsicas de la batera
presenta varios problemas, e incluso puede ser totalmente artificiosa cuando el sujeto
no realiza en realidad las operaciones que supuestamente debe realizar, por ejemplo
cuando responde al azar alguna o muchas de las preguntas. Pero el significado de esta
puntuacin de Rapidez puede tener significado ms interesante cuando se relaciona con
la Eficacia o Porcentaje de Aciertos. De esta manera podemos catalogar a los sujetos que
hacen las pruebas en cuatro categoras, con significados diferenciados: sujetos rpidos y
eficaces, sujetos rpidos e ineficaces, sujetos lentos y eficaces, y sujetos lentos e
ineficaces.
4 Para obtener un porcentaje sin decimales se multiplica por 100 y se redondea la puntuacin al entero ms prximo.
-
22 UNIVERSIDAD DE GRANADA Sobre las Pruebas de Evaluacin de Diagnstico (PED)
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
SOBRE LAS PRUEBAS DE EVALUACIN DE DIAGNSTICO (PED)
La realizacin de estas pruebas responde al propsito de la Consejera de Educacin de
conocer e informar acerca de los progresos conseguidos por el alumnado y los centros
educativos de la Comunidad Autnoma de Andaluca. Estas pruebas proporcionan
informacin relevante en la que basar las medidas necesarias para superar las
diferencias existentes entre el nivel competencial que se espera que el alumnado
desarrolle y el que realmente ha alcanzado en el momento de completar dicha prueba.
Se contina con la generalizacin de la aplicacin de los cuestionarios de contexto
(alumnado, familia, centro) a todos los grupos que realizan la prueba. La finalidad de
estos cuestionarios es elaborar un ndice socioeconmico y cultural (ISC) de los centros
(al igual que PISA y otras evaluaciones internacionales), que permita el anlisis de la
relacin entre el rendimiento obtenido en las Pruebas de Evaluacin de Diagnstico y la
situacin socioeconmica y cultural del alumnado y el centro. Este ndice abre
importantes vas para la investigacin e innovacin educativas, que repercutirn en la
mejora de la calidad de la enseanza.
COMPETENCIAS EVALUADAS
Tanto en Educacin Primaria como en Educacin Secundaria Obligatoria se han evaluado
las siguientes competencias bsicas:
Razonamiento Matemtico
Comunicacin Lingstica (Lengua Espaola)
Conocimiento e Interaccin con el Mundo Fsico y Natural, Comunicacin
Lingstica en Lenguas Extranjeras (Ingls), Social y Ciudadana, Cultural y
Artstica.
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
23
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Si bien las competencias en Razonamiento Matemtico y en Comunicacin Lingstica
(Lengua Espaola) se evalan todos los cursos, las dems van rotando cada ao.
Para cada competencia bsica se elabor un cuadernillo de 18 temes que se aplic en
dos sesiones de 60 minutos de duracin, separadas por un periodo de descanso de 30
minutos.
INSTRUMENTOS UTILIZADOS
INSTRUMENTOS DE EVALUACIN
La evaluacin de competencias bsicas en el alumnado de Educacin Primaria y
Educacin Secundaria Obligatoria requiere el empleo de instrumentos que incluyan
temes adecuados al tipo de competencias que han sido consideradas, que tengan en
cuenta los contextos o situaciones definidos para que el alumnado demuestre su
dominio y aplicacin, y cuya administracin resulte viable en el marco de la evaluacin
del sistema educativo.
La Evaluacin de Diagnstico de Andaluca opta por la realizacin de pruebas escritas (de
lpiz y papel) de carcter homologado, basadas en situaciones-problema y
administradas colectivamente. Se trata de pruebas construidas a partir de casos que
sirven como base para la interrogacin y que, en la medida de lo posible, remiten a
situaciones similares a las que el alumnado puede encontrar en su vida escolar o
extraescolar.
Las cuestiones, por tanto, basndose en los contenidos curriculares, tratan de evaluar
las capacidades del alumnado para la aplicacin de los mismos a situaciones escolares y,
especialmente, a situaciones en las que habr de desenvolverse en la vida real.
Las situaciones-problema se construyen sobre la base de uno o varios de los siguientes
tipos de informacin:
Textos escritos continuos o discontinuos en los que se recogen informaciones
diversas: anuncios, textos extrados de los medios de comunicacin,
-
24 UNIVERSIDAD DE GRANADA Sobre las Pruebas de Evaluacin de Diagnstico (PED)
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
instrucciones, carteles informativos, trascripcin de dilogos, narracin de
hechos, descripcin de situaciones reales o simuladas, textos literarios, textos
cientficos, etc.
Textos orales breves para la competencia en Comunicacin lingstica (lengua
espaola), que persiguen una finalidad comunicativa, proporcionados en
soporte CD.
Imgenes diversas, incluyendo fotografas, mapas, dibujos, esquemas o
cualquier otra forma grfica de representacin de diferentes realidades.
Las preguntas formuladas a partir de cada situacin-problema han ido dirigidas, en
lneas generales, a comprobar el grado de dominio de las competencias objeto de la
Evaluacin de Diagnstico, es decir, a la capacidad para transferir conocimientos y
habilidades de diferentes mbitos curriculares aplicndolos a los problemas planteados
en una diversidad de situaciones. Cada situacin o caso representa un estmulo a partir
del cual se plantea un racimo de cuestiones que podrn encuadrarse en algunos de los
siguientes formatos:
Preguntas de respuesta cerrada, bajo el formato de eleccin mltiple. Se trata
tanto de preguntas de respuesta dicotmica, como de preguntas con escala de
respuesta graduada, de tal manera que cabe pensar en una respuesta correcta,
una o ms respuestas parcialmente incorrectas y una respuesta totalmente
errnea. La posibilidad de utilizar preguntas cerradas con respuestas en escala
graduada posee el atractivo de adaptarse a las pretensiones de una evaluacin
formativa, dado que permite aportar informacin no slo sobre si un alumno o
alumna posee o no la competencia que se le demanda para responder, sino
tambin en qu grado la ha desarrollado, aportando informacin relevante
sobre la medida en que su competencia en el elemento en cuestin es
deficitaria y sobre el tipo de apoyos o refuerzos que requiere.
Preguntas que exigen el desarrollo de procedimientos y la obtencin de
resultados. Este tipo de cuestiones contempla generalmente la necesidad de
alcanzar un resultado nico, aunque podran describirse diferentes caminos para
llegar al mismo. Tanto el procedimiento como el resultado son valorados,
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
25
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
posibilitando el establecimiento de diferentes niveles de respuesta en funcin
del grado de desarrollo competencial.
Preguntas abiertas que admiten respuestas diversas, las cuales, aun siendo
correctas, pueden diferir de unos sujetos a otros. La elaboracin de criterios de
correccin permite graduar las respuestas estableciendo, tambin en este caso,
niveles de ejecucin intermedios entre las respuestas correcta e incorrecta.
CUESTIONARIOS DE CONTEXTO
Adems de los cuadernillos de las pruebas, existen unos Cuestionarios de Contexto para
el alumnado, sus familias y los centros educativos, ya que los resultados en pruebas de
rendimiento estn modulados por factores contextuales, de recursos y de procesos. La
finalidad es extraer informacin sobre una serie de variables socioeconmicas y
culturales que sirven de base para el clculo de los ndices correspondientes.
Estos datos son de utilidad para contrastar los resultados obtenidos por el alumnado en
las pruebas con su ndice Socioeconmico y Cultural. Con la misma finalidad, estas
variables son utilizadas en Cuestionarios de contexto tanto de evaluaciones nacionales
(Evaluacin General de Diagnstico del Instituto de Evaluacin) como internacionales
(PISA, PIRLS, TIMSS).
A continuacin, se recogen las variables que contienen cada uno de los Cuestionarios:
VARIABLES DEL CUESTIONARIO DE FAMILIA
Expectativas de la madre y del padre sobre los estudios del hijo o hija
Hbitos lectores de la madre y del padre
Nmero de libros en el hogar
Recursos domsticos
Nivel educativo de la madre y del padre
Estatus ocupacional de la madre y del padre
VARIABLES DEL CUESTIONARIO DE ALUMNADO
Sexo
-
26 UNIVERSIDAD DE GRANADA Sobre las Pruebas de Evaluacin de Diagnstico (PED)
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Fecha de nacimiento
Hbitos lectores
Tiempo dedicado a otras actividades: viendo TV, videojuegos, ordenador
Si recibe ayuda para hacer tareas
Seguimiento del estudio por parte de los padres
Uso del ordenador (casa y colegio)
Tipo de informacin que busca en Internet
Expectativas de estudios
Gusto por el estudio
Autoconcepto como estudiante
Cumplimiento de las normas del centro
Relacin entre compaeros y compaeras
VARIABLES DEL CUESTIONARIO DE CENTRO (AULA)
Nmero de alumnos y de alumnas del grupo
Nacionalidad y lengua verncula del alumnado
Nmero de alumnos y alumnas con Adaptaciones Curriculares Individualizadas
Porcentaje de hogares desfavorecidos/ acomodados
Existencia de biblioteca de centro y de aula
Reuniones del profesorado y temas que se tratan
Trabajo en equipo
Estrategias didcticas utilizadas
Modelos de pruebas/ evaluacin del alumnado
Satisfaccin con el centro/ alumnado/ familia
Clima de clase
21
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
27
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Captulo 3
Fundamentos tericos
En este captulo trataremos de manera genrica los modelos de respuesta discreta para
pasar despus al estudio completo de los modelos de regresin logstica binaria, desde
su formulacin, interpretacin, ajuste, contraste de bondad de ajuste, validacin hasta
su diagnosis.
MODELOS DE RESPUESTA DISCRETA
Los modelos de regresin tienen como objetivo describir el efecto de una o ms
variables (independientes) sobre una o ms variables de respuesta (dependientes).
Cuando la variable respuesta es discreta, normalmente una variable categrica con dos
o ms posibles clasificaciones o niveles de respuesta, la herramienta estadstica
apropiada para modelizar su comportamiento a partir de un conjunto de variables
independientes (predictoras), que pueden ser tanto discretas como continuas, sern los
MODELOS DE RESPUESTA DISCRETA. Estos modelos son un caso particular de los Modelos
Lineales Generalizados introducidos por Nelder y Wedderbum en 19725.
5 Para mayor informacin sobre los mismos puede consultarse las referencias (McCullagh & Nelder, 1983) y (Agresti, 2002).
-
28 UNIVERSIDAD DE GRANADA Modelos de Respuesta Discreta
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Existen distintos tipos de modelos de respuesta discreta que dependen, entre otros
aspectos, del tipo de respuesta. En particular, si la variable dependiente es dicotmica
se trata de MODELOS DE RESPUESTA BINARIA, mientras que si tiene ms de dos categoras
de respuesta se trata de MODELOS DE RESPUESTA MLTIPLE. Segn la funcin utilizada
para la estimacin de la probabilidad tenemos el modelo lineal, el modelo logit, modelo
probit y modelo de valores extremos.
En nuestro estudio, que se desarrollar en el ltimo captulo de este trabajo, la variable
respuesta a estimar ser dicotmica, el fracaso escolar futuro de nuestro alumnado (que
tomar el valor 1 si el alumno o alumna en cuestin presenta fracaso escolar y 0 en caso
contrario) en base a determinadas variables dadas por las bateras pasadas a los mismos
(BADyG-M Renovado y PED), por lo que se ajustar un modelo de respuesta binaria; en
concreto, un modelo logit.
INTRODUCCIN A LOS MODELOS DE RESPUESTA BINARIA
Los modelos de regresin ms utilizados, en la mayora de los campos de aplicacin,
para analizar este tipo de respuestas son los modelos de regresin logstica (logit), para
los que las variables explicativas pueden ser tanto cuantitativas como cualitativas.
Aunque la regresin logstica es la tcnica ms usual para el anlisis de datos de
respuesta binaria, existen otros modelos alternativos, pertenecientes todos ellos a la
familia de los modelos lineales generalizados que contiene tambin a otros modelos
estndar de regresin como, por ejemplo, la regresin lineal y el anlisis de varianza
para variables respuesta continuas.
PLANTEAMIENTO DEL PROBLEMA
El objetivo es construir un modelo estadstico para estimar una variable respuesta
discreta binaria en funcin de una o varias variables explicativas que podran ser
cuantitativas o cualitativas.
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
29
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Comenzaremos por el caso ms simple en el que se quiere explicar una variable
aleatoria de respuesta binaria , con dos posibles categoras de respuesta en
funcin de una variable no aleatoria cuantitativa .
Si representamos a las dos categoras de por los valores y , la variable tiene
distribucin de Bernoulli de esperanza
Entonces la distribucin de en cada valor observado de es tambin Bernoulli de
esperanza
y varianza
De este modo, representa la dependencia de la probabilidad de respuesta
respecto de los valores de la variable explicativa.
Si denotamos por a la distribucin de condicionada a , , el paso
siguiente es construir un modelo adecuado para de la forma
INVIABILIDAD DEL MODELO DE PROBABILIDAD LINEAL
El modelo ms sencillo sera el modelo de regresin lineal
donde los errores son variables aleatorias no observables, independientes, con
esperanza cero, cuya distribucin tambin es Bernoulli con valores si
, y si , a los que corresponden las mismas probabilidades
y que la variable .
Dado que tiene esperanza cero, se tiene
-
30 UNIVERSIDAD DE GRANADA Modelos de Respuesta Discreta
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Por lo tanto, el modelo de regresin lineal es de la forma:
(1.1)
y recibe el nombre de MODELO DE PROBABILIDAD LINEAL.
Este modelo presenta importantes defectos estructurales que lo hacen inviable para
explicar el comportamiento de las probabilidades de respuesta, y se enumeran a
continuacin:
1. Las probabilidades son valores entre cero y uno, mientras que las funciones
lineales de variables cuantitativas pueden tomar valores en toda la recta real.
Por lo tanto, el modelo (1.1) puede predecir valores imposibles fuera del
intervalo para valores de suficientemente pequeos o grandes. Esto se
debe a que la esperanza de una variable dicotmica no puede estar explicada
linealmente por una variable cuantitativa sobre un rango de valores no acotado.
Por lo tanto, el modelo (1.1) slo podra ser vlido sobre un rango finito de
valores de .
2. No se satisface la condicin de homocedasticidad ya que la varianza de la
variable respuesta, , no es constante sobre
los valores observados de . Como consecuencia los estimadores de mnimos
cuadrados ordinarios de los parmetros del modelo lineal seran insesgados
pero no eficientes (no tendran varianza mnima dentro de la clase de los
estimadores lineales insesgados). Para resolver este problema y obtener
estimadores ms eficientes, se podran usar mnimos cuadrados ponderados.
Cada observacin se ponderara por el inverso de la varianza condicionada
tomando como valor inicial el estimador de mnimos cuadrados ordinario,
y usando este procedimiento iterativamente. Esta aproximacin de mnimos
cuadrados ponderados iterativamente converge a los estimadores de mxima
verosimilitud (MV) pero continan las dificultades cuando se sale del
intervalo .
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
31
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
3. Al no tener distribucin normal, no se pueden usar las distribuciones
muestrales de los estimadores de mnimos cuadrados ordinarios para hacer
inferencia sobre el modelo.
4. El modelo lineal implica variaciones iguales de la probabilidad de respuesta
frente a variaciones iguales de la variable explicativa. Esto no es ni mucho
menos realista porque es de esperar que los cambios en tengan menos
impacto sobre cuando la probabilidad de respuesta est prxima a cero o a
uno que cuando est prxima a . Como ejemplo, supongamos que en un
estudio epidemiolgico se quiere explicar la probabilidad de desarrollar cncer
de hgado en funcin de la cantidad de alcohol ingerida. Lgicamente un
aumento en tres cervezas en la consumicin diaria influir menos sobre esta
probabilidad para un alcohlico que para una persona que se toma una cerveza
diaria.
Estos problemas presentados hacen que estos modelos no sean utilizados y, en su lugar,
nos planteemos ajustar un modelo no lineal que implique una relacin entre y
que sea curvilnea, montona, y acotada entre cero y uno. Las funciones de distribucin
de variables continuas definidas sobre toda la recta real podran ser transformaciones
adecuadas que cumplen estos objetivos. A continuacin estudiaremos que tomando la
funcin de distribucin logstica se obtienen los MODELOS DE REGRESIN LOGSTICA, con la
funcin de distribucin de una Normal se tienen los MODELOS PROBIT y con la funcin de
distribucin de Gumbel los MODELOS DE VALORES EXTREMOS.
MODELOS DE RESPUESTA BINARIA USUALES
Teniendo en cuenta lo razonado anteriormente, buscamos un modelo de la forma
con variables aleatorias independientes de esperanza cero, o equivalentemente,
(1.2)
donde es una funcin de distribucin estrictamente creciente, que a su vez puede
expresarse en la forma
-
32 UNIVERSIDAD DE GRANADA Modelos de Respuesta Discreta
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
MODELOS LOGIT
El modelo de regresin logstica simple es de la forma
(1.3)
El modelo puede escribirse equivalentemente en la forma
donde la transformacin recibe el nombre de logit y
representa la ventaja de respuesta para el valor observado .
CARACTERSTICAS DE LA CURVA DE RESPUESTA LOGSTICA
1. La curva logstica representada por la ecuacin (1.3) implica una relacin
estrictamente montona no necesariamente creciente entre la probabilidad de
respuesta y la variable explicativa que tiene forma de S y con valores en el
intervalo .
2. Si , cuando y cuando
Si , cuando y cuando
Esto significa que las rectas e son asntotas horizontales de la curva
logstica. Adems, implica que la curva es creciente y que es
decreciente.
3. La tasa de cambio (crecimiento o decrecimiento) en por cada unidad de
cambio en n oes constante como en el caso de la regresin lineal.
Efectivamente, la tasa de cambio es la pendiente de la recta tangente a la curva
logstica en cada punto
Observemos que esta funcin depende de y alcanza su valor mximo
cuando , que corresponde al punto de inflexin de la
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
33
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
curva logstica . Esto quiere decir que la tasa de crecimiento o
decrecimiento aumenta al aumentar y, adems, tiende a ser muy pequea
para valores de prximos a cero o a uno.
4. Cuando el modelo logit (1.3) se verifica con , la curva logstica se convierte
en una lnea recta y la variable respuesta es independiente de .
5. Para mayor intuicin debemos tener en cuenta que la curva logstica es la
funcin de distribucin de una variable aleatoria con distribucin de
probabilidad logstica. Para comprobarlo, recordemos que la funcin de
distribucin de una variable aleatoria logstica con parmetro de localizacin y
parmetro de escala es
siendo una distribucin simtrica con media y desviacin estndar .
Por lo tanto, se tiene lo siguiente:
a) Si , la curva logstica (1.3) es la funcin de distribucin de una
variable aleatoria logstica de parmetros y .
b) Si , la curva es la funcin de
distribucin de una variable aleatoria logstica de parmetros
y .
MODELOS PROBIT
Sea la funcin de distribucin de una normal estndar (media cero y varianza uno)
dada por
El modelo probit simple es de la forma
(1.4)
y se obtiene tomando como funcin , en la ecuacin general (1.2) de un modelo de
respuesta binaria, la funcin de distribucin .
-
34 UNIVERSIDAD DE GRANADA Modelos de Respuesta Discreta
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Una forma equivalente para el modelo probit es
(1.5)
CARACTERSTICAS DE LA CURVA DE RESPUESTA PROBIT
1. La curva del modelo probit (1.4) para conlleva una relacin estrictamente
montona no necesariamente creciente entre la probabilidad de respuesta y la
variable explicativa, con forma de S y valores en el intervalo .
2. Si , cuando y cuando
Si , cuando y cuando
Por lo tanto, las rectas e son asntotas horizontales. Adems, se
puede comprobar fcilmente que implica que la curva es creciente y
que es decreciente.
3. Igual que con la curva logstica, la tasa de cambio en por cada unidad de
cambio en no es constante. En este caso se tiene
siendo la funcin de densidad de una variable aleatoria con distribucin
normal estndar. Observemos que la tasa de cambio alcanza su valor mximo
en la media de la normal estndar , es decir, cuando
y .
4. Cuando el modelo probit se verifica con , la curva de respuesta (1.4) se
convierte en una lnea recta y la variable respuesta es independiente de .
5. Si , la curva de respuesta (1.4) del modelo probit es la funcin de
distribucin de una variable aleatoria con distribucin normal de media y
desviacin estndar .
Si , la curva es la funcin de distribucin de
una variable aleatoria normal de media y desviacin estndar .
COMPARACIN DE LAS CURVAS DE RESPUESTA PARA LOS MODELOS LOGIT Y PROBIT
Las curvas de respuesta de los modelos logit y probit son muy similares.
La tasa de cambio mxima de ambas curvas de respuesta se alcanza en . Para
el modelo logit este valor mximo es , mientras que para el modelo probit es,
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
35
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
aproximadamente, , de modo que coinciden cuando el parmetro del modelo
logit es veces el del modelo probit.
Por otro lado, las medias de las distribuciones de probabilidad asociadas a ambas curvas
de respuesta son iguales. Para , la desviacin estndar de la distribucin logstica
asociada al modelo logit es , mientras que la de la normal asociada al modelo
probit es . De este modo, ambas desviaciones estndar coinciden cuando el
parmetro del modelo logit es veces el del modelo probit.
Como consecuencia, cuando tanto el modelo logit como el probit se ajustan bien, el
estimador del parmetro del modelo logit es, aproximadamente, veces el
del modelo probit. Finalmente, como las colas de la normal son ligeramente ms
estrechas que las de la distribucin logstica, se aproxima ms rpidamente a y a
con el modelo probit que con el modelo logit.
Un caso particular de las curvas de respuesta logit y probit apareen representadas
grficamente en la Figura 1.
FIGURA 1. CURVAS LOGIT (LNEA CONTINUA) Y PROBIT (LNEA DISCONTINUA) CON Y
MODELOS DE VALORES EXTREMOS
Tanto con el modelo logit como con el modelo probit la curva de respuesta para es
simtrica respecto de . Esto significa que el grado de aproximacin de a
y a es el mismo. En este sentido, los modelos logit y probit no son apropiados para
-
36 UNIVERSIDAD DE GRANADA Modelos de Respuesta Discreta
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
explicar probabilidades de respuesta que se alejen lentamente de cero y se aproximen
rpidamente a uno, o viceversa.
Esto justifica considerar curvas de respuesta de la forma
que son asimtricas respecto de , y se alejan de ms bruscamente que se
acercan a .
La forma lineal equivalente a este modelo de respuesta binaria es
(1.6)
que recibe el nombre de modelo log-log complementario correspondiente a la
transformacin del lado izquierdo de la ecuacin (1.6).
El modelo alternativo en el que se aleja rpidamente de y se acerca lentamente a
es:
(1.7)
O, equivalentemente, en forma lineal
que recibe el nombre de modelo log-log de la transformacin del lado izquierdo de la
ecuacin anterior.
CARACTERSTICAS DE LA CURVA DE RESPUESTA DE LOS MODELOS DE VALORES EXTREMOS
1. Tanto para el modelo log-log complementario como para el modelo log-log, e
igual que para los modelos logit y probit, las curvas de respuesta para
implican una relacin estrictamente montona entre la probabilidad de
respuesta y la variable explicativa, con forma de S y valores en el intervalo .
De nuevo, las rectas e son asntotas horizontales.
2. Para el modelo log-log complementario se tiene lo siguiente:
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
37
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Si , cuando y cuando . En este caso la
curva es estrictamente creciente.
Si , cuando y cuando , y la curva de
respuesta es estrictamente decreciente.
3. Para el modelo log-log se verifica:
Si , cuando , cuando , y la curva es
estrictamente decreciente.
Si , cuando , cuando , y la curva es
estrictamente creciente.
4. La tasa de cambio en para el modelo log-log complementario es
que alcanza su valor mximo en el punto de inflexin de la curva
al que corresponde .
5. Anlogamente, la tasa de cambio en del modelo log-log es:
que alcanza su valor mximo en el punto de inflexin de la curva
, al que corresponde .
6. De nuevo, convierte a los modelos de valores extremos en una recta e
implica que la variable respuesta es independiente de la variable explicativa .
7. Para justificar la nomenclatura de modelos de valores extremos, observemos
que la curva de respuesta del modelo log-log dada por (1.7) es la funcin de
distribucin de una variable aleatoria con distribucin de probabilidad de
Gumbel o de valores extremos6.
Un ejemplo de curvas de respuesta de modelos de valores extremos aparece en la
Figura 2.
6 Recordemos que una variable aleatoria con distribucin de Gumbel de parmetros y tiene funcin de distribucin
con esperanza y desviacin estndar . Por lo tanto, la curva de respuesta del modelo log-log es la funcin de distribucin de una Gumbel de parmetros y si , o si .
-
38 UNIVERSIDAD DE GRANADA Modelos Logit con variables explicativas cuantitativas
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
FIGURA 2. CURVA DE RESPUESTA LOGIT CON Y (TRAZO CONTINUO), CURVA LOG-LOG CON Y
(TRAZO DISCONTINUO A RAYAS) Y MODELO LOG-LOG COMPLEMENTARIO CON Y (TRAZO
DISCONTINUO PUNTEADO)
MODELOS LOGIT CON VARIABLES EXPLICATIVAS CUANTITATIVAS
Una vez introducidos los distintos modelos para explicar una variable de respuesta
binaria a partir de un conjunto de variables explicativas, pasamos a continuacin al
estudio detallado de los modelos de regresin logstica en el caso de variables
explicativas cuantitativas7 observadas sin error.
7 Si se tiene alguna variable independiente categrica, es necesario definir una serie de variables
nuevas, artificiales, que servirn para poder pasar de una variable categrica con categoras a
variables indicadoras de la presencia de cada categora, por separado. Dichas variables de
diseo, tambin conocidas como variables ficticias o dummies, son introducidas en el modelo
como variables continuas, tal y como se explica a continuacin.
Para crear las variables de diseo asociadas a una variable con categoras podemos elegir
entre dos posibles mtodos: el mtodo parcial y el mtodo marginal.
El mtodo parcial consiste en elegir una categora de referencia dentro de las posibles y
construir para cada una de las restantes una variable que valga 1 en la categora considerada y 0
en el resto. Por ejemplo, si tenemos una variable con las categoras bajo, medio y alto,
podramos elegir bajo como categora de referencia y crear dos variables de diseo: una que
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
39
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
Comenzamos por la formulacin del modelo e interpretacin de sus parmetros,
despus abordaremos el problema de su estimacin y contrastes de bondad de ajuste, y
finalizaremos con la validacin y seleccin del modelo ms apropiado.
MODELO DE REGRESIN LOGSTICA SIMPLE
Consideremos, en primer lugar, el caso de una variable explicativa cuantitativa .
Recordemos que el modelo de regresin logstica para una variable aleatoria binaria
es un modelo lineal para el logaritmo de la ventaja de respuesta en cada valor
observado de la variable explicativa.
(3.1)
que, equivalentemente, se puede expresar de la siguiente forma en trminos de la
probabilidad de respuesta en :
Curva de respuesta que es estrictamente creciente si , y estrictamente decreciente
para .
valga 1 cuando se de la categora medio y 0 en los otros dos casos y una segunda variable que
valga 1 cuando se de la categora alto y 0 en los otros dos casos. Estas dos variables son las que
entran en el modelo.
El mtodo marginal es similar en su concepto, salvo que en esta ocasin todas las dummies
toman el valor -1 cuando se da la categora de referencia, en lugar de 0.
Un caso especial es el de las variables ordinales, ya que adems de poder usar los mtodos
anteriores, contamos con la posibilidad ordenar las categoras, asignar puntuaciones y tratarla
como continua.
Lo comn en epidemiologa es utilizar el mtodo parcial, que permite interpretar los parmetros
en trminos de cocientes de ventajas de forma sencilla.
-
40 UNIVERSIDAD DE GRANADA Modelos Logit con variables explicativas cuantitativas
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
La curva tiene forma de S y est acotada dentro del intervalo , siendo las rectas
e asntotas horizontales. Su crecimiento es montono, pudiendo ser
creciente, si , o decreciente, si . Por tanto, con la probabilidad de
respuesta tender a 1 para y a 0 para . La situacin se invierte si .
Si la curva es en realidad una recta e es independiente de .
En este modelo el riesgo relativo de respuesta para dos valores distintos y
del predictor se define como:
y el cociente de ventajas de respuesta dados dos valores distintos y del
predictor se define como:
Ambos conceptos estn relacionados por la expresin:
De esta forma, si la probabilidad de respuesta es cercana a 0, el riesgo relativo
puede ser aproximado mediante el cociente de ventajas.
INTERPRETACIN DE PARMETROS
1. Si , entonces , que quiere decir que la variable es
independiente de puesto que no depende de .
2. El parmetro es el valor comn del logaritmo de las ventajas de respuesta
frente a respuesta cuando ; es decir, cuando la respuesta es
independiente de la variable explicativa. Su exponencial es, por tanto, la ventaja
de respuesta .
3. La frmula general del modelo logit simple (3.1) implica que por cada unidad de
incremento en , el logit de respuesta aumenta aditivamente en unidades.
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
41
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
De la misma frmula se obtiene la siguiente expresin para la ventaja de la
respuesta en cada observado:
que significa que la ventaja de respuesta aumenta multiplicativamente por
cada unidad de incremento en . De hecho,
4. El cociente de ventajas de respuesta para dos valores diferentes y de
es de la forma
La ventaja o preferencia de la respuesta frente a la toma valores en el
intervalo . Por lo tanto, el cociente de ventajas tiene el mismo
rango de variacin y la siguiente interpretacin:
si, y slo si,
si, y slo si,
En este caso la ventaja de respuesta es veces mayor para
que para .
si, y slo si,
En este caso la ventaja de respuesta es veces mayor para
que para .
5. La exponencial del parmetro , , es el cociente de ventajas de respuesta
para dos valores de que se diferencian en una unidad. Es decir,
MODELO DE REGRESIN LOGSTICA MLTIPLE
Consideremos ahora el caso de variables explicativas cuantitativas no aleatorias
. Para cada combinacin de valores observados , ,,
de las variables explicativas, la variable respuesta tiene distribucin de Bernoulli
-
42 UNIVERSIDAD DE GRANADA Modelos Logit con variables explicativas cuantitativas
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
siendo
El modelo de regresin logstica mltiple para la variable respuesta en trminos de
valores observados de las variables explicativas es de la forma:
donde son errores aleatorios que se consideran centrados e
independientes, de modo que
Denotando a partir de ahora , , y con
, el modelo quedar resumido como:
(3.2)
donde es el vector columna de parmetros .
Equivalentemente, el modelo de regresin logstica mltiple se puede ver como un
modelo de regresin lineal mltiple para la transformacin logit,
(3.3)
A partir de los parmetros podemos calcular los cocientes de ventaja de respuesta
como las exponenciales de dichos parmetros. Es lo que conocemos como ODDS
RATIO (OR). La interpretacin de estos parmetros vara ligeramente segn la naturaleza
de la variable que le acompaa. Si la variable es continua, el cociente de ventajas
representa la variacin en la ventaja de respuesta por cada unidad de aumento
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
43
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
de la variable cuando el resto de variables permanece constante8. Al aumentar en una
unidad dicha variable y dejar el resto fijas, la ventaja de respuesta queda
multiplicada por la exponencial de (OR). Por lo tanto, si (equivalentemente,
), significa que dicha variable en concreto no afecta a la respuesta. Si
( ) se tiene que la ventaja de respuesta disminuye. En trminos
epidemiolgicos se dice que esa variable es un factor protector. Si ( ), la
ventaja aumenta y se tiene un factor de riesgo.
INTERPRETACIN DE PARMETROS
1. Si entonces , que quiere decir que la
variable es independiente de las variables explicativas.
2. El parmetro es el valor comn del logaritmo de las ventajas de respuesta
frente a respuesta cuando la respuesta es independientes de las
variables explicativas.
Por otro lado, es el valor del logaritmo de la ventaja de respuesta para
un individuo con .
3. El cociente de ventajas de respuesta para dos combinaciones diferentes
de valores de las variables explicativas, y
, es de la forma
Para dos valores y que se diferencien en una unidad, , para
, se tendra
8 Si la variable original es categrica y se han definido las dummies con el mtodo parcial, tenemos una OR para cada una de las variables de diseo (es decir, cada una de las categoras) y dicho valor representa la ventaja de respuesta de esa categora en concreto con respecto a la categora de referencia, cuando el resto de variables queda fijo. Los conceptos de factor protector y factor de riesgo siguen teniendo validez en este caso. Si las dummies han sido definidas mediante el mtodo marginal, la interpretacin de los parmetros es algo ms compleja. Cada parmetro es la desviacin del logit de la categora que lleva asociada con respecto a la media de todos los logit, por lo que la exponencial del parmetro es el cociente entre la ventaja de respuesta para su categora asociada y la media geomtrica de todas las ventajas de respuesta .
-
44 UNIVERSIDAD DE GRANADA Modelos Logit con variables explicativas cuantitativas
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
4. Para dar una interpretacin ms intuitiva de los parmetros del modelo, vamos
a calcular el cociente de ventajas de respuesta cuando una de las variables
explicativas se incrementa en una unidad y las otras se controlan haciendo que
tomen valores fijos.
Como ejemplo, incrementamos en una unidad la variable y las restantes
variables explicativas las mantenemos fijas. Entonces, sustituyendo por
y , en la frmula obtenida anteriormente
para el cociente de ventajas, se tiene
Esto significa que al aumentar en una unidad una de las variables y controlar las
dems, la ventaja de respuesta queda multiplicada por la exponencial del
coeficiente de la variable incrementada.
De este modo, si la exponencial de un parmetro es mayor que uno la
probabilidad de respuesta aumenta cuando aumenta la variable
correspondiente y se controlan las dems, mientras que si es menor que uno la
relacin es inversa.
MODELOS CON INTERACCIN
Hasta ahora no se ha considerado la posibilidad de interaccin entre las variables
explicativas de un modelo de regresin logstica mltiple.
INTERACCIN Y CONFUSIN
Observemos que en los modelos de regresin logstica mltiple considerados hasta
ahora, los cocientes de ventajas que miden la asociacin entre la variable de respuesta y
cada variable explicativa son independientes del valor fijo del resto de variables
explicativas controladas. Esto significa que son modelos sin interaccin porque el grado
-
UNIVERSIDAD DE GRANADA Modelo logit para el estudio del fracaso escolar en ESO
45
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
de asociacin entre la variable de respuesta y cada una de las variables explicativas es el
mismo en todas las combinaciones de niveles de las otras variables independientes.
Se pueden considerar interacciones de distintos rdenes. Las ms simples son las de
orden uno (entre dos variables explicativas) que representan el grado en que la
asociacin entre la variable de respuesta y una variable depende de los valores de una
tercera que interacciona con esta ltima. Las interacciones de orden dos involucran a
tres variables y as sucesivamente. Por simplicidad no consideraremos interacciones de
orden superior a uno que conllevaran productos entre tres o ms variables.
En epidemiologa es usual distinguir entre el factor de riesgo que puede ser causa de una
enfermedad y otras covariables de inters que hay que controlar en el estudio
estadstico para analizar la asociacin entre el factor de riesgo y el padecimiento de la
enfermedad. En este tipo de estudios es usual distinguir entre factores de confusin y
factores modificadores del efecto del factor de riesgo sobre la enfermedad.
Una variable es de confusin cuando est asociada con el factor de riesgo de modo que
la asociacin marginal entre la variable de respuesta y el factor de riesgo cambia
significativamente al incluirla en el anlisis estadstico.
Una variable es modificadora del efecto cuando la asociacin entre la variable de
respuesta y el factor de riesgo cambia en funcin de sus valores. Es decir, se trata de una
variable que interacciona con el factor de riesgo.
De lo anterior se deduce que los factores de confusin tienen que ser considerados
forzosamente en el modelo, aunque puede que no interaccionen con el factor de riesgo.
FORMULACIN DE MODELOS CON INTERACCIN
La interaccin entre dos variables cuantitativas se incluye en el modelo de regresin
logstica como producto de ambas variables. En general, el trmino de interaccin entre
dos variables cuantitativas y es de la forma .
Como consecuencia, el modelo de regresin logstica mltiple con interacciones entre
cada par de covariables es de la forma
-
46 UNIVERSIDAD DE GRANADA Modelos Logit con variables explicativas cuantitativas
M
st
er
en
Es
ta
ds
ti
ca
Ap
lic
ad
a
En este caso, el cociente de ventajas de respuesta cuando se incrementa en una
unidad una variable y se controlan fijas las dems depende del valor de las variables
controladas
poniendo claramente en evidencia la interaccin de cada variable con el resto.
AJUSTE DE MODELOS LOGIT
A continuacin abordamos el problema de la estimacin de los parmetros de los
modelos logit.
Los datos estn constituidos por un