el analfabetismo
TRANSCRIPT
UNIVERSIDAD TECNICA DE ORURO
FACULTAD NACIONAL DE INGENIERIA
CARRERA INGENIERIA DE SISTEMAS E INGENIERIA INFORMATICA
“EL ANALFABETISMO”
UNIVERSITARIO: Rojas Calderón Ariel Ivan
Docente: Ing. Angel Miranda
Materia: Sis 3507 “A”
Fecha: 14 de diciembre del 2010
ORURO – BOLIVIA
1
INDICE
RESUMEN
INTRODUCCIÓN
DESARROLLO
I.PARTE TEÓRICA ECONÓMICA
1.1. RECURSOS FÍSICOS Y HUMANOS DE LA EDUCAION PÚBLICA
1.2. REPROBACION EN LA EDUCAION PÚBLICA
1.3. MATRICULACION EN LA EDUCACIÓN PÚBLICA
1.4. ABANDONO Y PROMOCIÓN DE LA EDUCACIÓN
II: PARTE TEÓRICA INSTRUMENTAL
2.1. MODELOS ECONÓMICOS.
2.2. TIPOS DE VARIABLES.
2.2.1. Variables Endógenas.
2.2.2. Variables Exógenas.
2.2.3. Variables Cuantificables.
2.2.4. Variables Cualificables.
2.3. COMO HACER PRONÓSTICOS MEDIANTE EL ANÁLISIS DE REGRESIÓN.
2.4. REGRESIÓN MÚLTIPLE EN NOTACIÓN MATRICIAL.
2.5. PRUEBA F DE FISHER
2.6. HOMOCEDASTICIDAD
2.7. AUTOCORRELACIÓN
III. FORMULACIÓN DE OBJETIVOS
3.1. OBJETIVOS GENERAL
3.2. OBJETIVOS ESPECIFICOS
IV. PARTE EXPERIMENTAL
2
4.1. RECOLECCIÓN DE DATOS:
4.2. DETERMINACIÓN DEL MODELO
4.3. DETERMINACION DE LA VARIABLE DEPENDIENTE Y
4.4. CALCULO DE MODELOS CON LAS VARIABLES x1, x2, x3, x4 Vs TIEMPO
4.5. CRITERIO DE ACEPTABILIDAD DE PARAMETROS
4.5.1. OBTENCION DE UN MODELO MÁS APROPIADO
4.6. PREDICCION DE LA VARIABLE DEPENDIENTE X5 CON EL MODELO DE REGREION LINEAL
DETERMINADO
4.7. DETECCION DE HETEROCEDASTICIDAD
4.8. DETECCION DE AUTOCORRELACION
V.CONCLUSIÓN:
VI. RECOMENDACIONES.
VII. BIBLIOGRAFÍA
ANEXOS
3
RESUMEN
El presente proyecto EL ANALFABETISMO EN BOLIVIA invita a conocer los diferentes análisis realizados a largo
del desarrollo de la materia de Modelos Económicos aplicados a este problema económico de la siguiente manera:
Con un marco previo de Antecedentes introductorios destinados al seguimiento posterior del estudio hacia los
indicios del problema económico de estudio, además del planteamiento de objetivos (general y específicos, en este
proyecto se delimitan las siguientes partes de desarrollo del mismo:
I: Parte Teórica Económica e Instrumental: La parte económica brinda una idea formal de lo que representa el problema
económico como tal y la relación que existe entre variables macroeconómicas que tengan relación con el problema. Por
otra parte la Instrumental muestra de manera clara y concreta los pasos a seguir para determinar el modelo de regresión
lineal correspondiente, se refiere a todas las herramientas que brinda la materia para lograr resultados conforme al
objetivo planteado.
II: Parte Experimental: Hace énfasis principalmente en el seguimiento de la obtención del modelo económico y la
predicción para distintos periodos. Presentándose en esta parte los cálculos más importantes y los tomados en cuenta,
siendo que los cálculos detallados se añaden en el anexo señalado.
Obteniendo así resultados óptimos conforme al objetivo planteado se procede a la redacción de las
conclusiones adquiridas después de la experimentación y a sus posibles recomendaciones para estudios posteriores.
4
INTRODUCCIÓN
De acuerdo con el último censo de población el cual nos brinda el informe de que se tenia 823.000 analfabetos
en el país se toma conciencia sobre el mismo y se debe analizar el porque del problema en nuestro país, analizando las
causas del mismo y llevando a cabo soluciones practicas.
Los factores del problema indiscutiblemente son muchos, algunos de carácter interno y otros de carácter
externo, puesto que se ve problemas intrafamiliares que contribuyen al abandono del aprendizaje, como hay problemas
económicos ya sea por falta de dinero que la población boliviana de temprana edad se ve obligada a dejar los estudios y
salir de frente al mundo externo a enfrentarse con su realidad y buscar trabajo sin previa preparación.
De todas maneras se debe evitar el brote de nuevos analfabetos y para ellos no se debe descuidar la educación
obligatoria de niños y jóvenes hasta lograr el bachillerato mínimamente.
La medición de la calidad de la educación en Bolivia mediante el Sistema de Medición y Evaluación de la Calidad
de la Educación (SIMECAL) se inició el año 1997, año en el que las pruebas mostraron que sólo el 33% de los estudiantes
de tercer grado de primaria poseían un rendimiento satisfactorio. Aun más alarmante fue el resultado del sexto grado ya
que apenas el 16% de los estudiantes logró esta calificación. Bolivia también ha participado en pruebas internacionales de
aptitud académica a través del Laboratorio Latinoamericano para la Evaluación de la Calidad de Educación. Los resultados
internacionales muestran que el desempeño educativo en Latinoamérica es en general muy bajo y que los estudiantes
bolivianos se encuentran entre los menos capacitados de la región.
En nuestro país la diferencia de la calidad educativa entre colegios fiscales y privados es una de las más amplias
en toda América Latina. Este hecho tiene graves implicaciones para la gente pobre que no puede pagar colegios privados.
Sus hijos tendrán una educación de baja calidad, lo que puede originar desincentivos a la asistencia escolar. De esta
manera, con menor cantidad y calidad de educación, la desventaja en el mercado laboral se duplica. Esto significa que el
sistema de educación en Bolivia tiende a perpetuar la pobreza, aumentando la desigualdad en lugar de disminuirla.
Para que el sistema educativo pueda funcionar como un mecanismo de reducción de la desigualdad y la
pobreza, es necesario que todos los niños tengan acceso a educación gratuita y de buena calidad.
El trabajo se enfatiza principalmente en hallar las variables de mayor relación con el problema del
analfabetismo en nuestro país de manera que se pueda concluir de una forma satisfactoria.
5
EL ANALFABETISMO EN BOLIVIA
DESARROLLO
I. PARTE TEÓRICA ECONÓMICA: Una vez introducidos en el tema de estudio y analizando el problema se definen
las causantes principales del problema consideradas como variables las siguientes:
1.1. Recursos físicos y humanos de la educación publica: Considerando la importancia de los mismos en la
educación se obtiene que:
La Unidad Educativa es un centro de formación integral del educando, donde se desarrollan los
procesos de enseñanza y aprendizaje a partir de una planificación participativa con la cooperación de director,
docentes, alumnos y padres de familia, en cual se debe impartir enseñanza en uno o más de los siguientes
niveles completos de educación: inicial (al menos un año), primario (ocho años) y secundario (cuatro años).
En la Unidad Educativa se deben cubrir por lo menos 30 periodos pedagógicos en una semana, con
una duración variable de 35, 40 y 45 minutos, según ciclos, niveles y turnos para responder a la propuesta
curricular. Estos 30 periodos deberán distribuirse en cinco o seis días por semana de acuerdo a la disponibilidad
del edificio escolar.
El objetivo de la Unidad Educativa es formar al alumno de manera integral, promoviendo
competencias necesarias para su desarrollo personal, social y su compromiso con la comunidad.
Las unidades educativas públicas por su dependencia pueden ser:
Públicas fiscales o estatales cuando son creadas, sostenidas y administradas por el Estado a través del
Tesoro General de la Nación.
Los profesores:
a. La metodología de enseñanza de cada área curricular, y los criterios para el agrupamiento de alumnos y para
la organización espacial y temporal de las actividades.
b. Criterios específicos sobre evaluación de los aprendizajes y promoción de los alumnos.
c. Las decisiones relativas a las adecuaciones curriculares necesarias para responder a la diversidad lingüística y
cultural.
d. Criterios y procedimientos previstos para realizar las adaptaciones curriculares apropiadas para los alumnos
con necesidades educativas especiales.
e. Los materiales y recursos didácticos que van a utilizar los alumnos y profesores.
f. La organización de la consejería de curso y de la orientación escolar.
6
1.2. Reprobación en la educación publica:
Probablemente una de la principales causas dentro la educación y el abandono de la misma es la tasa
de reprobación que presenta el país con el paso de los años el cual analizando de manera individual a cada
estudiante se podría hallar mas y mas problemas que contribuyan al abandono de la educación.
Así pues estos datos serán tomados en cuenta para el modelo matemático pues se comprende que es
una variable que es de gran importancia en el problema de estudio.
1.3. Matriculación en la educación publica:
A Pesar de la matriculación gratuita establecida por el gobierno este es otro de los factores que son un
enfoque de estudio ya que en la medición del mismo se halla el interés y el abandono que existe en la
población. Por tanto se debe normar la distribución, transferencia y asignación de horas/ítems de nueva
creación para cubrir el crecimiento vegetativo de la matrícula y el déficit histórico de las áreas de educación
escolarizada y alternativa, de educación técnica del nivel de educación superior de dependencia pública.
Teniendo en cuenta los datos se podrá concluir e una predicción acertada de lo que pretendemos
predecir.
1.4. Abandono y promoción de la educación:
Es evidente que existe una relación estrecha entre el abandono de la educación y la promoción de la
misma, el hecho mismo de abandonar el colegio influye de tal modo que un estudiante se queda varado en el
camino sin poder superarse y salir adelante por sus logros convirtiéndose a si mismo como una persona
conformista que solo debe atenerse a lo que le toca y busca solamente lo mínimo, esto sin duda representa un
enfoque e medición pues la promoción de educación que haga el gobierno en nuestro país influye mucho en la
tasa de abandono por lo tanto son dos mediciones que necesariamente deben tomarse en cuenta.
II. PARTE TEÓRICA INSTRUMENTAL:
El presente proyecto se enfoca en la obtención de un modelo económico que sirva para
interpretaciones y predicciones, de esta manera se da a conocer la herramientas a utilizarse para nuestro
estudio.
2.1. MODELOS ECONÓMICOS.
7
Los modelos son muy utilizados por la ciencia económica. Están basados en unos supuestos que
simplifican la realidad y formados generalmente por ecuaciones matemáticas que relacionan distintas variables.
Se llaman variables exógenas aquellas cuyos valores deben ser tomados de la realidad y variables endógenas
aquellas cuyo valor es deducido al operar con las ecuaciones del modelo.
En la práctica, en el modelo se incluirán todas las variables que se consideren relevantes para el
propósito y todas las demás pasaran a un cesto llamado “perturbación” o “distorsión”. Este lleva a distinguir
entre un modelo económico y uno econométrico.
Los modelos económicos estáticos son también una representación muy simplificada de la realidad en
la que no esta incluido el tiempo.
Los modelos económicos dinámicos son modelos que utilizan el tiempo con variables rezagadas.
2.2. TIPOS DE VARIABLES.
2.2.1. Variables Endógenas.
Las variables endógenas, son variables que son propias del sistema, es decir que interactúan
directamente con las entidades del sistema. Estas variables se encuentran dentro del sistema o del problema en
cuestión.
2.2.2. Variables Exógenas.
Las variables exógenas, son variables que son externas al sistema, es decir que interactúan
indirectamente con las entidades del sistema. Estas variables se encuentran fuera del sistema o del problema en
cuestión.
2.2.3. Variables Cuantificables.
Las variables cuantificables, son variables que pueden ser halladas por una recolección de datos
históricos, presentes y hasta futuros, pero que estos son obtenidos por ejemplo con ayuda de las estadísticas y
los diferentes cálculos algebraicos y numéricos.
2.2.4. Variables Cualificables.
Las variables cualificables, son variables que no pueden ser cuantificadas, pero estas por su
importancia son tomadas en cuenta, de modo diferente y son medidas con parámetros cualificados, por
ejemplo dando diferentes calificaciones como por ejemplo: Bueno, malo, pésimo; para calificar a una variable
cualificable.
2.3. COMO HACER PRONÓSTICOS MEDIANTE EL ANÁLISIS DE REGRESIÓN.
8
La regresión es el estudio de la relación entre variables con el objetivo principal de predecir o estimar
el valor de una variable con respecto a otras variables conocidas o de valores asumidos, las cuales se
encuentran relacionadas a ella.
2.4. REGRESIÓN MÚLTIPLE EN NOTACIÓN MATRICIAL.
En el caso general, el modelo de regresión lineal múltiple con p variables responde a la ecuación:
De modo que los coeficientes se estiman siendo el criterio de mínimos cuadrados:
La obtención aquí de las expresiones de los estimadores mínimos cuadráticos de dichos coeficientes
exige reescribir la expresión (1) utilizando notación matricial. Así, (1) quedaría:
Donde.
De donde los estimados mínimos cuadráticos se obtienen a partir de la ecuación:
Y mantienen una interpretación análoga al caso de la regresión lineal simple (i.e. βi
representa el incremento por término medio en la variable respuesta por cada unidad adicional en la
variable Xi). Como se puede observar, la obtención de estimadores, intervalos de confianza y
contrastes de hipótesis para los coeficientes de regresión involucran expresiones matriciales y
distribuciones multivariantes que complican notablemente las operaciones, por lo que en la práctica
dichos cálculos se obtienen de un modo inmediato mediante el manejo de diferentes paquetes
estadísticos. Son muchos los textos en los que se pueden encontrar desarrollos teóricos de dichas
expresiones. Sin detenerse en ello, basta decir que manteniendo las hipótesis habituales de
independencia, homocedasticidad, normalidad y linealidad se calculan expresiones para el error
estándar de cada coeficiente estimado e intervalos de confianza de modo análogo al caso de la
regresión simple. La significación estadística de cada variable se obtiene simplemente
9
Calculando el cociente entre el coeficiente estimado y su error típico, y comparándolo con el
cuantil correspondiente de una distribución t de Student con n-p-1 grados de libertad. La bondad de
ajuste del modelo se puede valorar mediante la varianza residual y el estadístico R2 (coeficiente de
determinación), definidos de la forma habitual. También aquí puede utilizarse el contraste F global de
la regresión, calculado a partir de las sumas de cuadrados explicada y no explicada para valorar la
utilidad del modelo.
Una vez obtenido el modelo, se aplicara un criterio de aceptabilidad para que el modelo sea más
apropiado.
2.5. PRUEBA F DE FISHER
En estadística se denomina prueba F (de Fisher) a cualquier prueba en la que el estadístico utilizado
sigue una distribución F si la hipótesis nula es cierta. En estadística aplicada se prueban muchas hipótesis
mediante el test F, entre ellas:
La hipótesis de que las medias de múltiples poblaciones normalmente distribuidas y con la misma
desviación estándar son iguales. Esta es, quizás, la más conocida de las hipótesis verificada mediante el test
F y el problema más simple del análisis de varianza.
La hipótesis de que las desviaciones estándar de dos poblaciones normalmente distribuidas son iguales.
En muchos casos, el test F puede resolverse mediante un proceso directo. Se requieren dos modelos
de regresión, uno de los cuales restringe uno o más de los coeficientes de regresión conforme a la hipótesis
nula. El test entonces se basa en un cociente modificado de la suma de cuadrados de residuos de los dos
modelos como sigue:
Dadas n observaciones, donde el modelo 1 tiene k coeficientes no restringidos, y el modelo 0 restringe
m coeficientes (típicamente a cero), el test F puede calcularse para nuestro caso como
El valor resultante debe entonces compararse con la entrada correspondiente de la tabla de valores
críticos.
2.6. HOMOCEDASTICIDAD
Es una propiedad fundamental del modelo de regresión lineal general y está dentro de sus supuestos
clásicos básicos.
Se dice que existe homocedasticidad cuando la varianza de los errores estocásticos de la regresión son
los mismos para cada observación i (de 1 a n observaciones), es decir:
10
donde es un escalar constante para todo i. Lo que significaría que habría una distribución de
probabilidad de idéntica amplitud para cada variable aleatoria.
Esta cualidad es necesaria, según el Teorema de Gauss-Márkov, para que en un modelo los
coeficientes estimados sean los mejores o eficientes, lineales e insesgados.
Distribución Homocedástica
Distribución Heterocedástica
Cuando no se cumple esta situación, decimos que existe heterocedasticidad, que es cuando la varianza
de cada termino de perturbación (ui) no es un número constante .
Este fenómeno suele ser muy común en datos de Corte Transversal y también se presenta, menos
frecuentemente, en series de tiempo.
Si se regresiona un modelo a través de Mínimos Cuadrados Ordinarios con presencia de
heterocedasticidad, los coeficientes siguen siendo lineales e insesgados pero ya no poseen mínima varianza
(eficiencia).
Causas frecuentes de ausencia de homocedasticidad
Variables independientes que posean un gran recorrido con respecto a su propia media
Esto generalmente ocurre cuando se ha dispuesto arbitrariamente el orden de las observaciones,
generando, casualmente que existan observaciones con grandes valores en una determinada variable
explicativa y los mismo con valores pequeños de esta misma variable.
Omisión de variables importantes dentro del modelo a estimar
Obviamente, si se omite una variable de relevancia en la especificación, tal variable quedara
parcialmente recogida dentro de las perturbaciones aleatorias, introduciendo en estas su propia variación, que
no será necesariamente fija.
Cambio de estructura
El hecho de que se produzca un cambio en la estructura determina un mal ajuste de los parámetros al
conjunto de los datos muéstrales. Y este no tiene porque influir del mismo modo en todo el recorrido de la
muestra, pudiendo producir cuantías de desajuste del modelo diferentes y, por lo tanto, varianza no constante
Utilizar variables no relativizadas
11
Cuando existen observaciones dentro de una variable en concreto, y que poseen un valor mayor a las
otras variables explicativas, puede originar valores del error diferentes. Esta situación es similar a la explicada al
principio pero con la salvedad que en este caso se compara con las otras variables (inclusive con la dependiente)
y no con respecto a su media.
Consecuencias de estimar en presencia de heterocedasticidad
Cálculo incorrecto de las varianza y parámetros ineficientes
La mayor varianza por empleo de MCO en presencia de heterocedasticidad puede producir un
incremento de más de 10 veces en la varianza estimada del parámetro constante.
Invalidación de los contrastes de significancia
Ya que se aceptaría la hipótesis nula de los contrastes de significancia más veces de las reales.
Generalmente resulta que ciertas variables podrían resultar no ser significativas cuando lo son realmente.
2.7. AUTOCORRELACIÓN
El método de Durbin Watson busca rechazar la hipótesis nula de inexistencia de autocorrelación
mediante el estadístico h para pruebas de muestras grandes. Si el estadístico de la regresión efectuada está
distribuido en forma asintóticamente normal con media cero y varianza unitaria y además se encuentra entre (-
1,96, +1,96), con un 95% de confianza se puede rechazar la hipótesis nula de que no hay correlación de primer
orden (positiva o negativa). El valor de h para nuestro modelo es de -0,0206, por lo que podemos aceptar la
hipótesis nula de ausencia de autocorrelación con un 95%. La inclusión del AR (1) corrige el problema de
autocorrelación propio de este modelo, además de contribuir en la explicación del comportamiento de la
variable dependiente.
En este gráfico se puede observar que no existe una correlación entre las variables graficadas.
Gráfico 2.5 – Residuos y residuos (-1).
12
Esto confirma lo obtenido mediante el método de Durbin Watson, que demostraba la ausencia de correlación
III. FORMULACIÓN DE OBJETIVOS
3.1. OBJETIVOS GENERAL
Hallar un modelo matemático dinámico el cual pueda servir para realizar proyecciones futuras y así
saber cuales serán nuestros valores para las diferentes variables que se describirán mas adelante.
3.2. OBJETIVOS ESPECIFICOS
Hallar un modelo matemático para proyecciones.
Optimizar el modelo hallado mediante la prueba F Fisher para elevar el coeficiente de determinación.
Verificar si los coeficientes son significativas para el modelo óptimo hallado.
Hallar el comportamiento de las variables en función del tiempo.
Obtener la predicción de la variable dependiente para los cinco próximos periodos.
Determinar la existencia de autocorrelación y heterocedasticidad en el modelo.
IV. PARTE EXPERIMENTAL
4.1. RECOLECCIÓN DE DATOS: Se han determinado las siguientes variables:
X1=Recursos físicos y humanos en la educación pública.
X2=Tasa de reprobación en la educación publica.
X3=Población matriculada en la educación publica.
X4=Tasa de abandono en la educación publica.
X5=Tasa de Promoción en la educación publica.
Periodo X1 X2 X3 X4 X5
1995-2009
Miles de
Personas Porcentaje
Miles de
Personas Porcentaje Porcentaje
1995 150,01 8,7 1734,92 11,1 80,46
1996 148,85 8,05 1812,62 10,86 81,05
1997 150,43 7,12 1894,36 10,24 81,56
13
1998 150,66 7,04 2075,93 10,14 82,81
1999 152,24 6,01 2059,21 8,49 85,51
2000 152,3 5,5 2107,08 6,99 88,4
2001 157,15 4,91 2197,09 6,86 88,22
2002 154,52 4,33 2263,16 6,65 89,01
2003 159,38 3,85 2363,16 6,43 89,72
2004 169,47 3,43 2413,42 5,82 90,76
2005 170,52 3,35 2473,25 6,21 90,73
2006 170,64 2,87 2503,783 6,07 90,47
2007 170,1 6,31 2507,835 6,66 87,03
2008 167,38 6,56 2513,255 5,28 88,15
2009 166,24 6,6 2514,312 5,01 89,17
FUENTE: MINISTERIO DE EDUCACION CULTIRA Y DEPORTES
INSTITUTO NACIONAL DE ESTADISTICA
4.2. DETERMINACIÓN DEL MODELO
Todos los cálculos que nos permitirán determinar el mejor modelo se realizaran con la ayuda del
Software SPSS for Windows, así que se procede de la manera siguiente:
4.3. DETERMINACION DE LA VARIABLE DEPENDIENTE Y
Se tomara como variable dependiente aquella que tenga el coeficiente de determinación R2 más alto, por
lo tanto:
Variable dependiente Coeficiente de Determinación R2
X1 0,852
14
X2 0,947
X3 0,945
X4 0,977
X5 0,989
Dados los resultados obtenidos se tomara como variable dependiente a X5 por tanto el modelo será el siguiente:
Coeficientesa
105,822 4,482 23,611 ,000
-,008 ,036 -,020 -,236 ,818
-,873 ,094 -,427 -9,310 ,000
-,001 ,002 -,091 -,663 ,522
-1,322 ,173 -,750 -7,627 ,000
(Constante)
X1
X2
X3
X4
Modelo
1
B Error típ.
Coef icientes no
estandarizados
Beta
Coef icientes
estandarizad
os
t Sig.
Variable dependiente: X5a.
X5=105,822-0,008x1-0,873x2-0,001x3-1,322x4
4.4. CALCULO DE MODELOS CON LAS VARIABLES x1, x2, x3, x4 Vs TIEMPO: Una vez que se ha determinado cual
será la variable independiente se procederá a buscar modelos de las variables que serán independientes Vs
tiempo, para hacer posible la predicción del modelo, entonces tomando en cuenta aquellos modelos de
regresión cuyo coeficiente de determinación sea mayor a 0.8 se tiene:
Para x1:
Modelo: x1=-3374,369+1,766 Tiempo
15
Para x2:
Modelo: x2=416,919-0,206 Tiempo
Para x3:
Modelo: x3=-115396+58,783 Tiempo
Para x4:
16
Modelo: x4=864,377-0,428 Tiempo
Los resultados obtenidos sugieren que solo x1, x3, x4 tienen una buena regresión y un porcentaje mayor a 80%
de la variabilidad de las variables x1, x3, x4 quedan explicadas por la regresión cuando se utiliza el tiempo como
variable independiente.
4.5. CRITERIO DE ACEPTABILIDAD DE PARAMETROS
4.5.1. OBTENCION DE UN MODELO MÁS APROPIADO: Según a los coeficientes de correlación de cada una
de las variables con respecto a la que se ha determinado como dependiente se tiene:
X5
X5 1
X1 0,760
X2 -0.877
X3 0,875
X4 -0,947
La variable independiente mejor relacionada con la variable dependiente x5 es x4 ya que rx5, x4=-0,947. Por
lo tanto x4 debe necesariamente ingresar al modelo.
Resumen del modelo
,947a ,896 ,888 1,22673
Modelo
1
R R cuadrado
R cuadrado
corregida
Error típ. de la
estimación
Variables predictoras: (Constante), X4a.
Coeficientesa
99,419 1,227 81,045 ,000
-1,669 ,158 -,947 -10,589 ,000
(Constante)
X4
Modelo
1
B Error típ.
Coef icientes no
estandarizados
Beta
Coef icientes
estandarizad
os
t Sig.
Variable dependiente: X5a.
17
Modelo: x5=99,419-1,669x4 con R2=0,896
¿Cuál seria la siguiente variable en ingresar al modelo?: Se tiene los siguientes coeficientes de correlación
parcial.
Rx5,x1/x4 -0,0374
Rx5,x2/x4 -0.938
Rx5,x3/x4 -0,0649
X2 es la próxima variable que debería ingresar al modelo siempre y cuando Rx5,x2/x4 sea significativo
PRUEBA DE HIPOTESIS: PRUEBA F
1. – H0= Rx5, x2/x4=0
H1= Rx5, x2/x4≠0
2. - α=0.1
3.- Estadístico de prueba
De la tabla F Fisher se tiene el valor para un α=0,1 para F1, 12=9,33
Rechazar H0 si Fcalculado>9,33
4.- Calculo de F para los datos registrados. (Para la obtención de ANOVA)
ANOVAb
168,738 1 168,738 112,127 ,000a
19,563 13 1,505
188,301 14
Regresión
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrática F Sig.
Variables predictoras: (Constante), X4a.
Variable dependiente: X5b.
18
ANOVAb
185,950 2 92,975 474,508 ,000a
2,351 12 ,196
188,301 14
Regresión
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrática F Sig.
Variables predictoras: (Constante), X2, X4a.
Variable dependiente: X5b.
5.- Finalmente para α=0,1 Rechazar H0
H1= Rx5, x2/x4≠0 es significativo, x2 debe ingresar al modelo.
Entonces: Corrigendo el modelo se tiene:
Resumen del modelo
Modelo R R cuadrado
R cuadrado
corregida
Error típ. de la
estimación
1 ,994(a) ,988 ,985 ,44265
a Variables predictoras: (Constante), X2, X4
Coeficientes(a)
Modelo
Coeficientes no
estandarizados
Coeficientes
estandarizado
s
t Sig. B Error típ. Beta
1 (Constante
) 100,388 ,455 220,851 ,000
X4 -1,149 ,079 -,652 -14,473 ,000
X2 -,864 ,092 -,422 -9,373 ,000
a Variable dependiente: X5
19
Modelo: x5=100,388 - 1,149 x4 - 0,864 x2 con R2=0,988
¿Cuál seria la siguiente variable en ingresar al modelo?: Se tiene los siguientes coeficientes de correlación
parcial.
Rx5,x1/x4,x2 -0,3248
Rx5,x3/x4,x2 -0,3720
X3 es la próxima variable que debería ingresar al modelo siempre y cuando Rx5,x3/x4,x2 sea significativo por lo
observado se sospecha que x3 no es significativo, esta sospecha se comprobara con la siguiente prueba de
hipótesis para que no quede la menor duda.
PRUEBA DE HIPOTESIS: PRUEBA F
1. – H0= Rx5,x3/x4,x2 =0
H1= Rx5,x3/x4,x2 ≠0
2. - α=0.1
3.- Estadístico de prueba
De la tabla F Fisher se tiene el valor para un α=0,1 para F1,11=9,66
Rechazar H0 si Fcalculado>9,66
4.- Calculo de F para los datos registrados. (para la obtención de ANOVA)
ANOVAb
185,950 2 92,975 474,508 ,000a
2,351 12 ,196
188,301 14
Regresión
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrática F Sig.
Variables predictoras: (Constante), X2, X4a.
Variable dependiente: X5b.
20
ANOVAb
186,275 3 62,092 337,141 ,000a
2,026 11 ,184
188,301 14
Regresión
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrática F Sig.
Variables predictoras: (Constante), X3, X2, X4a.
Variable dependiente: X5b.
5.- Finalmente para α=0,1 Aceptar H0
H0= Rx5,x3/x4,x2 =0 No es significativo, x3 puede quedar fuera del modelo.
Entonces: El modelo se mantiene ya que su R2 es muy significativo:
Modelo: x5=100,388 - 1,149 x4 - 0,864 x2 con R2=0,988
¿Cuál seria la siguiente variable en ingresar al modelo? : Se tiene el siguiente coeficiente de correlación
parcial.
Rx5,x1/x4,x2 -0,3248
X1 es la próxima variable que debería ingresar al modelo siempre y cuando Rx5,x3/x4,x2 sea significativo por lo
observado se sospecha que x1 no es significativo, esta sospecha se comprobara con la siguiente prueba de
hipótesis para que no quede la menor duda.
PRUEBA DE HIPOTESIS: PRUEBA F
1. – H0= Rx5,x1/x4,x2=0
H1= Rx5,x1/x4,x2≠0
2. - α=0.1
3.- Estadístico de prueba
21
De la tabla F Fisher se tiene el valor para un α=0,1 para F1,11=9,66
Rechazar H0 si Fcalculado>9,66
4.- Calculo de F para los datos registrados. (para la obtención de ANOVA)
ANOVAb
185,950 2 92,975 474,508 ,000a
2,351 12 ,196
188,301 14
Regresión
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrática F Sig.
Variables predictoras: (Constante), X2, X4a.
Variable dependiente: X5b.
ANOVAb
186,198 3 62,066 324,619 ,000a
2,103 11 ,191
188,301 14
Regresión
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrática F Sig.
Variables predictoras: (Constante), X1, X2, X4a.
Variable dependiente: X5b.
5.- Finalmente para α=0,1 Aceptar H0
H0= Rx5,x1/x4,x2=0 No es significativo, x1 puede quedar fuera del modelo.
Una vez revisado y verificado mediante la prueba F que variables son necesarias en el modelo se
define el modelo siguiente como el mas optimo:
Modelo: x5=100,388 - 1,149 x4 - 0,864 x2 con R2=0,988
22
4.6. PREDICCION DE LA VARIABLE DEPENDIENTE X5 CON EL MODELO DE REGREION LINEAL DETERMINADO
X5=Tasa de Promoción en la educación publica.
X2=Tasa de reprobación en la educación publica.
X4=Tasa de abandono en la educación publica.
Modelo: x5=100,388 - 1,149 x4 - 0,864 x2 con R2=0,988
Se determinara el valor de X5 para los siguientes 5 años es decir (2010, 2011, 2012, 2013, 2014)
Los cálculos de las variables x4 y x2 para cada año son:
Con el modelo hallado y
reemplazando los valores de las
variables independientes para cada año se tiene la predicción para la variable X5:
AÑO VALOR DE X5
2010 93,210371
2011 93,880127
2012 94,549883
2013 95,219639
2014 95,889395
AÑO VALOR DE X2
2010 2,859
2011 2,653
2012 2,447
2013 2,241
2014 2,035
AÑO VALOR DE X4
2010 4,097
2011 3,669
2012 3,241
2013 2,813
2014 2,385
23
4.7. DETECCION DE HETEROCEDASTICIDAD
Metodo Grafico.
Gráfico
X5
92908886848280
EI2
1,0
,8
,6
,4
,2
0,0
-,2
El grafico sugiere Homocedasticidad
Prueba de Goldfield y Quand.
GRUPO B
X5 X2 X4
85,51 6,01 8,49
87,03 6,31 6,66
88,15 6,56 5,28
89,17 6,6 5,01
82,81 7,04 10,14
81,56 7,12 10,24
81,05 8,05 10,86
80,46 8,7 11,1
GRUPO A
X5 X2 X4
90,47 2,87 6,07
90,73 3,35 6,21
90,76 3,43 5,82
89,72 3,85 6,43
89,01 4,33 6,65
88,22 4,91 6,86
88,4 5,5 6,99
24
1. – H0= VarA=VarB (Homocedasticidad)
H1= VarA ≠ VarB (Heterocedasticidad)
2. - α=0.1
3.- Estadístico de prueba
De la tabla F Fisher se tiene el valor para un α=0,1 para F6,5=10.7
Rechazar H0 si Fcalculado>10.7
4.- Calculo de F para los datos registrados. (para la obtención de ANOVA)
GrupoA
ANOVAb
6,589 2 3,294 26,572 ,005a
,496 4 ,124
7,085 6
Regresión
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrática F Sig.
Variables predictoras: (Constante), X2A, X4Aa.
Variable dependiente: X5Ab.
GrupoB
ANOVAb
81,123 2 40,561 177,096 ,000a
1,145 5 ,229
82,268 7
Regresión
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrática F Sig.
Variables predictoras: (Constante), X4B, X2Ba.
Variable dependiente: X5Bb.
5.- Finalmente para α=0,1 Aceptar H0
H0= VarA=VarB El modelo presenta homocedasticidad
25
4.8. DETECCION DE AUTOCORRELACION
Metodo Grafico.
Gráfico
X5
92908886848280
EI2
1,0
,8
,6
,4
,2
0,0
-,2
El grafico sugiere Ausencia de Autocorrelación.
Prueba de Durbin Watson.(Para Autocorrelacion de primer orden)
1.- H0:ρ=0 (Ausencia de autocorrelacion)
H1:ρ≠0 (Presencia de autocorrelacion)
2.- α=0.05
3.-Estadistico de prueba:
2(1-ρ)
Hipótesis Nula Decisión Si
No existe autocorrelacion positiva
No existe autocorrelacion positiva
No existe autocorrelacion positivad
Rechazar
No hay decisión
Rechazar
0 ≤ d ≤ dL
dL ≤ d ≤ dU
4-dL ≤ d ≤ 4
26
No existe autocorrelacion positiva
No existe autocorrelacion positiva ni negativa
No hay decisión
No rechazar
4-dU U d ≤ dL
dU ≤ d ≤ 4-dU
De la tabla de Durbin Watson se tiene el valor para los limites con k=2 y n=20
dL=1.1 dU=1.537
Tramos
1 2 3 4 5
0 - 1.1 1.1 - 1.537 1.537 - 2.463 2.463 - 2.9 2.9 - 4
4.- Calculo de d:
2(1-(-0.08624))=2.17248
5.- Finalmente para α=0,05 d esta en el tramo 3= dU ≤ d ≤ 4-dU No rechazar H0
No existe autocorrelación positiva ni negativa.
V. CONCLUSIÓN:
Una vez concluida la parte experimental, se pude concluir que con la ayuda de las herramientas instrumentales
aprendidas como son la regresión lineal multiple para hallar un modelo matematico y la correccion del mismo mediante
la prueba F, se ha obtenido el siguiente modelo de predicción para LA TASA DE PROMOCIÓN EN LA EDUCAION PUBLICA
Modelo: x5=100,388 - 1,149 x4 - 0,864 x2 con R2=0,988
Se puede observar también que el coeficiente de determinación obtenido es muy bueno lo cual nos indica que gran
porcentaje del comportamiento esta explicado por la regresión.
Como se ha comprobado también el mode lo hallado presenta homocedasticidad y ausencia de Autocorrelacion por lo
tanto se puede proceder a la utilización del mismo, así se obtiene las predicciones de la TASA DE PROMOCIÓN EN LA
EDUCAION PUBLICA para los siguientes periodos y son:
27
AÑO VALOR DE X5
2011 93,210371
2012 93,880127
2013 94,549883
2014 95,219639
2015 95,889395
Expresado en porcentaje.
Se concluye finalmente con resultados satisfactorios como se puede observar.
VI. RECOMENDACIONES.
Es fundamental que al reconocer las variables que intervienes en un determinado problema tengan relación pues este
cierto conlleva a obtener buenos resultados con un coeficiente de determinación elevado.
El mejorar y optimizar un modelo matemático es muy importante ya que así se eleva la confiabilidad de que nuestro
modelo en realidad va a representar la realidad, al igual que acertamos en que el modelo hallado este libre de los
problemas de heterocedasticidad y autocorrelacion
VII. BIBLIOGRAFÍA
Introducción a la Econometría G. S. Maddala
Probabilidad y Estadística para ingenieros R. E. Walpole R.H Meyers
Apuntes de la materia de Modelos Económicos.
Apuntes de la materia de Modelos Econométricos
Pagina Web: Wikipedia, la enciclopedia libre.htm
Anuario Estadístico 2008 Instituto Nacional de Estadística