el analfabetismo

UNIVERSIDAD TECNICA DE ORURO

FACULTAD NACIONAL DE INGENIERIA

CARRERA INGENIERIA DE SISTEMAS E INGENIERIA INFORMATICA

“EL ANALFABETISMO”

UNIVERSITARIO: Rojas Calderón Ariel Ivan

Docente: Ing. Angel Miranda

Materia: Sis 3507 “A”

Fecha: 14 de diciembre del 2010

ORURO – BOLIVIA

1

INDICE

RESUMEN

INTRODUCCIÓN

DESARROLLO

I.PARTE TEÓRICA ECONÓMICA

1.1. RECURSOS FÍSICOS Y HUMANOS DE LA EDUCAION PÚBLICA

1.2. REPROBACION EN LA EDUCAION PÚBLICA

1.3. MATRICULACION EN LA EDUCACIÓN PÚBLICA

1.4. ABANDONO Y PROMOCIÓN DE LA EDUCACIÓN

II: PARTE TEÓRICA INSTRUMENTAL

2.1. MODELOS ECONÓMICOS.

2.2. TIPOS DE VARIABLES.

2.2.1. Variables Endógenas.

2.2.2. Variables Exógenas.

2.2.3. Variables Cuantificables.

2.2.4. Variables Cualificables.

2.3. COMO HACER PRONÓSTICOS MEDIANTE EL ANÁLISIS DE REGRESIÓN.

2.4. REGRESIÓN MÚLTIPLE EN NOTACIÓN MATRICIAL.

2.5. PRUEBA F DE FISHER

2.6. HOMOCEDASTICIDAD

2.7. AUTOCORRELACIÓN

III. FORMULACIÓN DE OBJETIVOS

3.1. OBJETIVOS GENERAL

3.2. OBJETIVOS ESPECIFICOS

IV. PARTE EXPERIMENTAL

2

4.1. RECOLECCIÓN DE DATOS:

4.2. DETERMINACIÓN DEL MODELO

4.3. DETERMINACION DE LA VARIABLE DEPENDIENTE Y

4.4. CALCULO DE MODELOS CON LAS VARIABLES x1, x2, x3, x4 Vs TIEMPO

4.5. CRITERIO DE ACEPTABILIDAD DE PARAMETROS

4.5.1. OBTENCION DE UN MODELO MÁS APROPIADO

4.6. PREDICCION DE LA VARIABLE DEPENDIENTE X5 CON EL MODELO DE REGREION LINEAL

DETERMINADO

4.7. DETECCION DE HETEROCEDASTICIDAD

4.8. DETECCION DE AUTOCORRELACION

V.CONCLUSIÓN:

VI. RECOMENDACIONES.

VII. BIBLIOGRAFÍA

ANEXOS

3

RESUMEN

El presente proyecto EL ANALFABETISMO EN BOLIVIA invita a conocer los diferentes análisis realizados a largo

del desarrollo de la materia de Modelos Económicos aplicados a este problema económico de la siguiente manera:

Con un marco previo de Antecedentes introductorios destinados al seguimiento posterior del estudio hacia los

indicios del problema económico de estudio, además del planteamiento de objetivos (general y específicos, en este

proyecto se delimitan las siguientes partes de desarrollo del mismo:

I: Parte Teórica Económica e Instrumental: La parte económica brinda una idea formal de lo que representa el problema

económico como tal y la relación que existe entre variables macroeconómicas que tengan relación con el problema. Por

otra parte la Instrumental muestra de manera clara y concreta los pasos a seguir para determinar el modelo de regresión

lineal correspondiente, se refiere a todas las herramientas que brinda la materia para lograr resultados conforme al

objetivo planteado.

II: Parte Experimental: Hace énfasis principalmente en el seguimiento de la obtención del modelo económico y la

predicción para distintos periodos. Presentándose en esta parte los cálculos más importantes y los tomados en cuenta,

siendo que los cálculos detallados se añaden en el anexo señalado.

Obteniendo así resultados óptimos conforme al objetivo planteado se procede a la redacción de las

conclusiones adquiridas después de la experimentación y a sus posibles recomendaciones para estudios posteriores.

4

INTRODUCCIÓN

De acuerdo con el último censo de población el cual nos brinda el informe de que se tenia 823.000 analfabetos

en el país se toma conciencia sobre el mismo y se debe analizar el porque del problema en nuestro país, analizando las

causas del mismo y llevando a cabo soluciones practicas.

Los factores del problema indiscutiblemente son muchos, algunos de carácter interno y otros de carácter

externo, puesto que se ve problemas intrafamiliares que contribuyen al abandono del aprendizaje, como hay problemas

económicos ya sea por falta de dinero que la población boliviana de temprana edad se ve obligada a dejar los estudios y

salir de frente al mundo externo a enfrentarse con su realidad y buscar trabajo sin previa preparación.

De todas maneras se debe evitar el brote de nuevos analfabetos y para ellos no se debe descuidar la educación

obligatoria de niños y jóvenes hasta lograr el bachillerato mínimamente.

La medición de la calidad de la educación en Bolivia mediante el Sistema de Medición y Evaluación de la Calidad

de la Educación (SIMECAL) se inició el año 1997, año en el que las pruebas mostraron que sólo el 33% de los estudiantes

de tercer grado de primaria poseían un rendimiento satisfactorio. Aun más alarmante fue el resultado del sexto grado ya

que apenas el 16% de los estudiantes logró esta calificación. Bolivia también ha participado en pruebas internacionales de

aptitud académica a través del Laboratorio Latinoamericano para la Evaluación de la Calidad de Educación. Los resultados

internacionales muestran que el desempeño educativo en Latinoamérica es en general muy bajo y que los estudiantes

bolivianos se encuentran entre los menos capacitados de la región.

En nuestro país la diferencia de la calidad educativa entre colegios fiscales y privados es una de las más amplias

en toda América Latina. Este hecho tiene graves implicaciones para la gente pobre que no puede pagar colegios privados.

Sus hijos tendrán una educación de baja calidad, lo que puede originar desincentivos a la asistencia escolar. De esta

manera, con menor cantidad y calidad de educación, la desventaja en el mercado laboral se duplica. Esto significa que el

sistema de educación en Bolivia tiende a perpetuar la pobreza, aumentando la desigualdad en lugar de disminuirla.

Para que el sistema educativo pueda funcionar como un mecanismo de reducción de la desigualdad y la

pobreza, es necesario que todos los niños tengan acceso a educación gratuita y de buena calidad.

El trabajo se enfatiza principalmente en hallar las variables de mayor relación con el problema del

analfabetismo en nuestro país de manera que se pueda concluir de una forma satisfactoria.

5

EL ANALFABETISMO EN BOLIVIA

DESARROLLO

I. PARTE TEÓRICA ECONÓMICA: Una vez introducidos en el tema de estudio y analizando el problema se definen

las causantes principales del problema consideradas como variables las siguientes:

1.1. Recursos físicos y humanos de la educación publica: Considerando la importancia de los mismos en la

educación se obtiene que:

La Unidad Educativa es un centro de formación integral del educando, donde se desarrollan los

procesos de enseñanza y aprendizaje a partir de una planificación participativa con la cooperación de director,

docentes, alumnos y padres de familia, en cual se debe impartir enseñanza en uno o más de los siguientes

niveles completos de educación: inicial (al menos un año), primario (ocho años) y secundario (cuatro años).

En la Unidad Educativa se deben cubrir por lo menos 30 periodos pedagógicos en una semana, con

una duración variable de 35, 40 y 45 minutos, según ciclos, niveles y turnos para responder a la propuesta

curricular. Estos 30 periodos deberán distribuirse en cinco o seis días por semana de acuerdo a la disponibilidad

del edificio escolar.

El objetivo de la Unidad Educativa es formar al alumno de manera integral, promoviendo

competencias necesarias para su desarrollo personal, social y su compromiso con la comunidad.

Las unidades educativas públicas por su dependencia pueden ser:

Públicas fiscales o estatales cuando son creadas, sostenidas y administradas por el Estado a través del

Tesoro General de la Nación.

Los profesores:

a. La metodología de enseñanza de cada área curricular, y los criterios para el agrupamiento de alumnos y para

la organización espacial y temporal de las actividades.

b. Criterios específicos sobre evaluación de los aprendizajes y promoción de los alumnos.

c. Las decisiones relativas a las adecuaciones curriculares necesarias para responder a la diversidad lingüística y

cultural.

d. Criterios y procedimientos previstos para realizar las adaptaciones curriculares apropiadas para los alumnos

con necesidades educativas especiales.

e. Los materiales y recursos didácticos que van a utilizar los alumnos y profesores.

f. La organización de la consejería de curso y de la orientación escolar.

6

1.2. Reprobación en la educación publica:

Probablemente una de la principales causas dentro la educación y el abandono de la misma es la tasa

de reprobación que presenta el país con el paso de los años el cual analizando de manera individual a cada

estudiante se podría hallar mas y mas problemas que contribuyan al abandono de la educación.

Así pues estos datos serán tomados en cuenta para el modelo matemático pues se comprende que es

una variable que es de gran importancia en el problema de estudio.

1.3. Matriculación en la educación publica:

A Pesar de la matriculación gratuita establecida por el gobierno este es otro de los factores que son un

enfoque de estudio ya que en la medición del mismo se halla el interés y el abandono que existe en la

población. Por tanto se debe normar la distribución, transferencia y asignación de horas/ítems de nueva

creación para cubrir el crecimiento vegetativo de la matrícula y el déficit histórico de las áreas de educación

escolarizada y alternativa, de educación técnica del nivel de educación superior de dependencia pública.

Teniendo en cuenta los datos se podrá concluir e una predicción acertada de lo que pretendemos

predecir.

1.4. Abandono y promoción de la educación:

Es evidente que existe una relación estrecha entre el abandono de la educación y la promoción de la

misma, el hecho mismo de abandonar el colegio influye de tal modo que un estudiante se queda varado en el

camino sin poder superarse y salir adelante por sus logros convirtiéndose a si mismo como una persona

conformista que solo debe atenerse a lo que le toca y busca solamente lo mínimo, esto sin duda representa un

enfoque e medición pues la promoción de educación que haga el gobierno en nuestro país influye mucho en la

tasa de abandono por lo tanto son dos mediciones que necesariamente deben tomarse en cuenta.

II. PARTE TEÓRICA INSTRUMENTAL:

El presente proyecto se enfoca en la obtención de un modelo económico que sirva para

interpretaciones y predicciones, de esta manera se da a conocer la herramientas a utilizarse para nuestro

estudio.

2.1. MODELOS ECONÓMICOS.

7

Los modelos son muy utilizados por la ciencia económica. Están basados en unos supuestos que

simplifican la realidad y formados generalmente por ecuaciones matemáticas que relacionan distintas variables.

Se llaman variables exógenas aquellas cuyos valores deben ser tomados de la realidad y variables endógenas

aquellas cuyo valor es deducido al operar con las ecuaciones del modelo.

En la práctica, en el modelo se incluirán todas las variables que se consideren relevantes para el

propósito y todas las demás pasaran a un cesto llamado “perturbación” o “distorsión”. Este lleva a distinguir

entre un modelo económico y uno econométrico.

Los modelos económicos estáticos son también una representación muy simplificada de la realidad en

la que no esta incluido el tiempo.

Los modelos económicos dinámicos son modelos que utilizan el tiempo con variables rezagadas.

2.2. TIPOS DE VARIABLES.

2.2.1. Variables Endógenas.

Las variables endógenas, son variables que son propias del sistema, es decir que interactúan

directamente con las entidades del sistema. Estas variables se encuentran dentro del sistema o del problema en

cuestión.

2.2.2. Variables Exógenas.

Las variables exógenas, son variables que son externas al sistema, es decir que interactúan

indirectamente con las entidades del sistema. Estas variables se encuentran fuera del sistema o del problema en

cuestión.

2.2.3. Variables Cuantificables.

Las variables cuantificables, son variables que pueden ser halladas por una recolección de datos

históricos, presentes y hasta futuros, pero que estos son obtenidos por ejemplo con ayuda de las estadísticas y

los diferentes cálculos algebraicos y numéricos.

2.2.4. Variables Cualificables.

Las variables cualificables, son variables que no pueden ser cuantificadas, pero estas por su

importancia son tomadas en cuenta, de modo diferente y son medidas con parámetros cualificados, por

ejemplo dando diferentes calificaciones como por ejemplo: Bueno, malo, pésimo; para calificar a una variable

cualificable.

2.3. COMO HACER PRONÓSTICOS MEDIANTE EL ANÁLISIS DE REGRESIÓN.

8

La regresión es el estudio de la relación entre variables con el objetivo principal de predecir o estimar

el valor de una variable con respecto a otras variables conocidas o de valores asumidos, las cuales se

encuentran relacionadas a ella.

2.4. REGRESIÓN MÚLTIPLE EN NOTACIÓN MATRICIAL.

En el caso general, el modelo de regresión lineal múltiple con p variables responde a la ecuación:

De modo que los coeficientes se estiman siendo el criterio de mínimos cuadrados:

La obtención aquí de las expresiones de los estimadores mínimos cuadráticos de dichos coeficientes

exige reescribir la expresión (1) utilizando notación matricial. Así, (1) quedaría:

Donde.

De donde los estimados mínimos cuadráticos se obtienen a partir de la ecuación:

Y mantienen una interpretación análoga al caso de la regresión lineal simple (i.e. βi

representa el incremento por término medio en la variable respuesta por cada unidad adicional en la

variable Xi). Como se puede observar, la obtención de estimadores, intervalos de confianza y

contrastes de hipótesis para los coeficientes de regresión involucran expresiones matriciales y

distribuciones multivariantes que complican notablemente las operaciones, por lo que en la práctica

dichos cálculos se obtienen de un modo inmediato mediante el manejo de diferentes paquetes

estadísticos. Son muchos los textos en los que se pueden encontrar desarrollos teóricos de dichas

expresiones. Sin detenerse en ello, basta decir que manteniendo las hipótesis habituales de

independencia, homocedasticidad, normalidad y linealidad se calculan expresiones para el error

estándar de cada coeficiente estimado e intervalos de confianza de modo análogo al caso de la

regresión simple. La significación estadística de cada variable se obtiene simplemente

9

Calculando el cociente entre el coeficiente estimado y su error típico, y comparándolo con el

cuantil correspondiente de una distribución t de Student con n-p-1 grados de libertad. La bondad de

ajuste del modelo se puede valorar mediante la varianza residual y el estadístico R2 (coeficiente de

determinación), definidos de la forma habitual. También aquí puede utilizarse el contraste F global de

la regresión, calculado a partir de las sumas de cuadrados explicada y no explicada para valorar la

utilidad del modelo.

Una vez obtenido el modelo, se aplicara un criterio de aceptabilidad para que el modelo sea más

apropiado.

2.5. PRUEBA F DE FISHER

En estadística se denomina prueba F (de Fisher) a cualquier prueba en la que el estadístico utilizado

sigue una distribución F si la hipótesis nula es cierta. En estadística aplicada se prueban muchas hipótesis

mediante el test F, entre ellas:

La hipótesis de que las medias de múltiples poblaciones normalmente distribuidas y con la misma

desviación estándar son iguales. Esta es, quizás, la más conocida de las hipótesis verificada mediante el test

F y el problema más simple del análisis de varianza.

La hipótesis de que las desviaciones estándar de dos poblaciones normalmente distribuidas son iguales.

En muchos casos, el test F puede resolverse mediante un proceso directo. Se requieren dos modelos

de regresión, uno de los cuales restringe uno o más de los coeficientes de regresión conforme a la hipótesis

nula. El test entonces se basa en un cociente modificado de la suma de cuadrados de residuos de los dos

modelos como sigue:

Dadas n observaciones, donde el modelo 1 tiene k coeficientes no restringidos, y el modelo 0 restringe

m coeficientes (típicamente a cero), el test F puede calcularse para nuestro caso como

El valor resultante debe entonces compararse con la entrada correspondiente de la tabla de valores

críticos.

2.6. HOMOCEDASTICIDAD

Es una propiedad fundamental del modelo de regresión lineal general y está dentro de sus supuestos

clásicos básicos.

Se dice que existe homocedasticidad cuando la varianza de los errores estocásticos de la regresión son

los mismos para cada observación i (de 1 a n observaciones), es decir:

http://es.wikipedia.org/wiki/EstadÃstica

http://es.wikipedia.org/wiki/Contraste_de_hipÃ³tesis

http://es.wikipedia.org/wiki/EstadÃstico_muestral

http://es.wikipedia.org/wiki/DistribuciÃ³n_F

http://es.wikipedia.org/wiki/HipÃ³tesis_nula

http://es.wikipedia.org/wiki/EstadÃstica_aplicada

http://es.wikipedia.org/wiki/DistribuciÃ³n_normal

http://es.wikipedia.org/wiki/DesviaciÃ³n_estÃ¡ndar

http://es.wikipedia.org/wiki/AnÃ¡lisis_de_varianza

http://es.wikipedia.org/wiki/RegresiÃ³n

http://es.wikipedia.org/wiki/RegresiÃ³n_lineal

http://es.wikipedia.org/wiki/Varianza

10

donde es un escalar constante para todo i. Lo que significaría que habría una distribución de

probabilidad de idéntica amplitud para cada variable aleatoria.

Esta cualidad es necesaria, según el Teorema de Gauss-Márkov, para que en un modelo los

coeficientes estimados sean los mejores o eficientes, lineales e insesgados.

Distribución Homocedástica

Distribución Heterocedástica

Cuando no se cumple esta situación, decimos que existe heterocedasticidad, que es cuando la varianza

de cada termino de perturbación (ui) no es un número constante .

Este fenómeno suele ser muy común en datos de Corte Transversal y también se presenta, menos

frecuentemente, en series de tiempo.

Si se regresiona un modelo a través de Mínimos Cuadrados Ordinarios con presencia de

heterocedasticidad, los coeficientes siguen siendo lineales e insesgados pero ya no poseen mínima varianza

(eficiencia).

Causas frecuentes de ausencia de homocedasticidad

Variables independientes que posean un gran recorrido con respecto a su propia media

Esto generalmente ocurre cuando se ha dispuesto arbitrariamente el orden de las observaciones,

generando, casualmente que existan observaciones con grandes valores en una determinada variable

explicativa y los mismo con valores pequeños de esta misma variable.

Omisión de variables importantes dentro del modelo a estimar

Obviamente, si se omite una variable de relevancia en la especificación, tal variable quedara

parcialmente recogida dentro de las perturbaciones aleatorias, introduciendo en estas su propia variación, que

no será necesariamente fija.

Cambio de estructura

El hecho de que se produzca un cambio en la estructura determina un mal ajuste de los parámetros al

conjunto de los datos muéstrales. Y este no tiene porque influir del mismo modo en todo el recorrido de la

muestra, pudiendo producir cuantías de desajuste del modelo diferentes y, por lo tanto, varianza no constante

Utilizar variables no relativizadas

http://es.wikipedia.org/wiki/Variable_aleatoria

http://es.wikipedia.org/wiki/Teorema_de_Gauss-MÃ¡rkov

11

Cuando existen observaciones dentro de una variable en concreto, y que poseen un valor mayor a las

otras variables explicativas, puede originar valores del error diferentes. Esta situación es similar a la explicada al

principio pero con la salvedad que en este caso se compara con las otras variables (inclusive con la dependiente)

y no con respecto a su media.

Consecuencias de estimar en presencia de heterocedasticidad

Cálculo incorrecto de las varianza y parámetros ineficientes

La mayor varianza por empleo de MCO en presencia de heterocedasticidad puede producir un

incremento de más de 10 veces en la varianza estimada del parámetro constante.

Invalidación de los contrastes de significancia

Ya que se aceptaría la hipótesis nula de los contrastes de significancia más veces de las reales.

Generalmente resulta que ciertas variables podrían resultar no ser significativas cuando lo son realmente.

2.7. AUTOCORRELACIÓN

El método de Durbin Watson busca rechazar la hipótesis nula de inexistencia de autocorrelación

mediante el estadístico h para pruebas de muestras grandes. Si el estadístico de la regresión efectuada está

distribuido en forma asintóticamente normal con media cero y varianza unitaria y además se encuentra entre (-

1,96, +1,96), con un 95% de confianza se puede rechazar la hipótesis nula de que no hay correlación de primer

orden (positiva o negativa). El valor de h para nuestro modelo es de -0,0206, por lo que podemos aceptar la

hipótesis nula de ausencia de autocorrelación con un 95%. La inclusión del AR (1) corrige el problema de

autocorrelación propio de este modelo, además de contribuir en la explicación del comportamiento de la

variable dependiente.

En este gráfico se puede observar que no existe una correlación entre las variables graficadas.

Gráfico 2.5 – Residuos y residuos (-1).

12

Esto confirma lo obtenido mediante el método de Durbin Watson, que demostraba la ausencia de correlación

III. FORMULACIÓN DE OBJETIVOS

3.1. OBJETIVOS GENERAL

Hallar un modelo matemático dinámico el cual pueda servir para realizar proyecciones futuras y así

saber cuales serán nuestros valores para las diferentes variables que se describirán mas adelante.

3.2. OBJETIVOS ESPECIFICOS

Hallar un modelo matemático para proyecciones.

Optimizar el modelo hallado mediante la prueba F Fisher para elevar el coeficiente de determinación.

Verificar si los coeficientes son significativas para el modelo óptimo hallado.

Hallar el comportamiento de las variables en función del tiempo.

Obtener la predicción de la variable dependiente para los cinco próximos periodos.

Determinar la existencia de autocorrelación y heterocedasticidad en el modelo.

IV. PARTE EXPERIMENTAL

4.1. RECOLECCIÓN DE DATOS: Se han determinado las siguientes variables:

X1=Recursos físicos y humanos en la educación pública.

X2=Tasa de reprobación en la educación publica.

X3=Población matriculada en la educación publica.

X4=Tasa de abandono en la educación publica.

X5=Tasa de Promoción en la educación publica.

Periodo X1 X2 X3 X4 X5

1995-2009

Miles de

Personas Porcentaje

Miles de

Personas Porcentaje Porcentaje

1995 150,01 8,7 1734,92 11,1 80,46

1996 148,85 8,05 1812,62 10,86 81,05

1997 150,43 7,12 1894,36 10,24 81,56

13

1998 150,66 7,04 2075,93 10,14 82,81

1999 152,24 6,01 2059,21 8,49 85,51

2000 152,3 5,5 2107,08 6,99 88,4

2001 157,15 4,91 2197,09 6,86 88,22

2002 154,52 4,33 2263,16 6,65 89,01

2003 159,38 3,85 2363,16 6,43 89,72

2004 169,47 3,43 2413,42 5,82 90,76

2005 170,52 3,35 2473,25 6,21 90,73

2006 170,64 2,87 2503,783 6,07 90,47

2007 170,1 6,31 2507,835 6,66 87,03

2008 167,38 6,56 2513,255 5,28 88,15

2009 166,24 6,6 2514,312 5,01 89,17

FUENTE: MINISTERIO DE EDUCACION CULTIRA Y DEPORTES

INSTITUTO NACIONAL DE ESTADISTICA

4.2. DETERMINACIÓN DEL MODELO

Todos los cálculos que nos permitirán determinar el mejor modelo se realizaran con la ayuda del

Software SPSS for Windows, así que se procede de la manera siguiente:

4.3. DETERMINACION DE LA VARIABLE DEPENDIENTE Y

Se tomara como variable dependiente aquella que tenga el coeficiente de determinación R2 más alto, por

lo tanto:

Variable dependiente Coeficiente de Determinación R2

X1 0,852

14

X2 0,947

X3 0,945

X4 0,977

X5 0,989

Dados los resultados obtenidos se tomara como variable dependiente a X5 por tanto el modelo será el siguiente:

Coeficientesa

105,822 4,482 23,611 ,000

-,008 ,036 -,020 -,236 ,818

-,873 ,094 -,427 -9,310 ,000

-,001 ,002 -,091 -,663 ,522

-1,322 ,173 -,750 -7,627 ,000

(Constante)

X1

X2

X3

X4

Modelo

1

B Error típ.

Coef icientes no

estandarizados

Beta

Coef icientes

estandarizad

os

t Sig.

Variable dependiente: X5a.

X5=105,822-0,008x1-0,873x2-0,001x3-1,322x4

4.4. CALCULO DE MODELOS CON LAS VARIABLES x1, x2, x3, x4 Vs TIEMPO: Una vez que se ha determinado cual

será la variable independiente se procederá a buscar modelos de las variables que serán independientes Vs

tiempo, para hacer posible la predicción del modelo, entonces tomando en cuenta aquellos modelos de

regresión cuyo coeficiente de determinación sea mayor a 0.8 se tiene:

Para x1:

Modelo: x1=-3374,369+1,766 Tiempo

15

Para x2:

Modelo: x2=416,919-0,206 Tiempo

Para x3:

Modelo: x3=-115396+58,783 Tiempo

Para x4:

16

Modelo: x4=864,377-0,428 Tiempo

Los resultados obtenidos sugieren que solo x1, x3, x4 tienen una buena regresión y un porcentaje mayor a 80%

de la variabilidad de las variables x1, x3, x4 quedan explicadas por la regresión cuando se utiliza el tiempo como

variable independiente.

4.5. CRITERIO DE ACEPTABILIDAD DE PARAMETROS

4.5.1. OBTENCION DE UN MODELO MÁS APROPIADO: Según a los coeficientes de correlación de cada una

de las variables con respecto a la que se ha determinado como dependiente se tiene:

X5

X5 1

X1 0,760

X2 -0.877

X3 0,875

X4 -0,947

La variable independiente mejor relacionada con la variable dependiente x5 es x4 ya que rx5, x4=-0,947. Por

lo tanto x4 debe necesariamente ingresar al modelo.

Resumen del modelo

,947a ,896 ,888 1,22673

Modelo

1

R R cuadrado

R cuadrado

corregida

Error típ. de la

estimación

Variables predictoras: (Constante), X4a.

Coeficientesa

99,419 1,227 81,045 ,000

-1,669 ,158 -,947 -10,589 ,000

(Constante)

X4

Modelo

1

B Error típ.

Coef icientes no

estandarizados

Beta

Coef icientes

estandarizad

os

t Sig.

Variable dependiente: X5a.

17

Modelo: x5=99,419-1,669x4 con R2=0,896

¿Cuál seria la siguiente variable en ingresar al modelo?: Se tiene los siguientes coeficientes de correlación

parcial.

Rx5,x1/x4 -0,0374

Rx5,x2/x4 -0.938

Rx5,x3/x4 -0,0649

X2 es la próxima variable que debería ingresar al modelo siempre y cuando Rx5,x2/x4 sea significativo

PRUEBA DE HIPOTESIS: PRUEBA F

1. – H0= Rx5, x2/x4=0

H1= Rx5, x2/x4≠0

2. - α=0.1

3.- Estadístico de prueba

De la tabla F Fisher se tiene el valor para un α=0,1 para F1, 12=9,33

Rechazar H0 si Fcalculado>9,33

4.- Calculo de F para los datos registrados. (Para la obtención de ANOVA)

ANOVAb

168,738 1 168,738 112,127 ,000a

19,563 13 1,505

188,301 14

Regresión

Residual

Total

Modelo

1

Suma de

cuadrados gl

Media

cuadrática F Sig.

Variables predictoras: (Constante), X4a.

Variable dependiente: X5b.

18

ANOVAb

185,950 2 92,975 474,508 ,000a

2,351 12 ,196

188,301 14

Regresión

Residual

Total

Modelo

1

Suma de

cuadrados gl

Media

cuadrática F Sig.

Variables predictoras: (Constante), X2, X4a.


5.- Finalmente para α=0,1 Rechazar H0

H1= Rx5, x2/x4≠0 es significativo, x2 debe ingresar al modelo.

Entonces: Corrigendo el modelo se tiene:

Resumen del modelo

Modelo R R cuadrado

R cuadrado

corregida

Error típ. de la

estimación

1 ,994(a) ,988 ,985 ,44265

a Variables predictoras: (Constante), X2, X4

Coeficientes(a)

Modelo

Coeficientes no

estandarizados

Coeficientes

estandarizado

s

t Sig. B Error típ. Beta

1 (Constante

) 100,388 ,455 220,851 ,000

X4 -1,149 ,079 -,652 -14,473 ,000

X2 -,864 ,092 -,422 -9,373 ,000

a Variable dependiente: X5

19

Modelo: x5=100,388 - 1,149 x4 - 0,864 x2 con R2=0,988

¿Cuál seria la siguiente variable en ingresar al modelo?: Se tiene los siguientes coeficientes de correlación

parcial.

Rx5,x1/x4,x2 -0,3248

Rx5,x3/x4,x2 -0,3720

X3 es la próxima variable que debería ingresar al modelo siempre y cuando Rx5,x3/x4,x2 sea significativo por lo

observado se sospecha que x3 no es significativo, esta sospecha se comprobara con la siguiente prueba de

hipótesis para que no quede la menor duda.


1. – H0= Rx5,x3/x4,x2 =0

H1= Rx5,x3/x4,x2 ≠0

2. - α=0.1


De la tabla F Fisher se tiene el valor para un α=0,1 para F1,11=9,66


4.- Calculo de F para los datos registrados. (para la obtención de ANOVA)

ANOVAb

185,950 2 92,975 474,508 ,000a

2,351 12 ,196

188,301 14

Regresión

Residual

Total

Modelo

1

Suma de

cuadrados gl

Media

cuadrática F Sig.



20

ANOVAb

186,275 3 62,092 337,141 ,000a

2,026 11 ,184

188,301 14

Regresión

Residual

Total

Modelo

1

Suma de

cuadrados gl

Media

cuadrática F Sig.

Variables predictoras: (Constante), X3, X2, X4a.


5.- Finalmente para α=0,1 Aceptar H0

H0= Rx5,x3/x4,x2 =0 No es significativo, x3 puede quedar fuera del modelo.

Entonces: El modelo se mantiene ya que su R2 es muy significativo:

Modelo: x5=100,388 - 1,149 x4 - 0,864 x2 con R2=0,988

¿Cuál seria la siguiente variable en ingresar al modelo? : Se tiene el siguiente coeficiente de correlación

parcial.

Rx5,x1/x4,x2 -0,3248

X1 es la próxima variable que debería ingresar al modelo siempre y cuando Rx5,x3/x4,x2 sea significativo por lo

observado se sospecha que x1 no es significativo, esta sospecha se comprobara con la siguiente prueba de

hipótesis para que no quede la menor duda.


1. – H0= Rx5,x1/x4,x2=0

H1= Rx5,x1/x4,x2≠0

2. - α=0.1


21

De la tabla F Fisher se tiene el valor para un α=0,1 para F1,11=9,66



ANOVAb

185,950 2 92,975 474,508 ,000a

2,351 12 ,196

188,301 14

Regresión

Residual

Total

Modelo

1

Suma de

cuadrados gl

Media

cuadrática F Sig.



ANOVAb

186,198 3 62,066 324,619 ,000a

2,103 11 ,191

188,301 14

Regresión

Residual

Total

Modelo

1

Suma de

cuadrados gl

Media

cuadrática F Sig.

Variables predictoras: (Constante), X1, X2, X4a.



H0= Rx5,x1/x4,x2=0 No es significativo, x1 puede quedar fuera del modelo.

Una vez revisado y verificado mediante la prueba F que variables son necesarias en el modelo se

define el modelo siguiente como el mas optimo:

Modelo: x5=100,388 - 1,149 x4 - 0,864 x2 con R2=0,988

22

4.6. PREDICCION DE LA VARIABLE DEPENDIENTE X5 CON EL MODELO DE REGREION LINEAL DETERMINADO

X5=Tasa de Promoción en la educación publica.

X2=Tasa de reprobación en la educación publica.

X4=Tasa de abandono en la educación publica.

Modelo: x5=100,388 - 1,149 x4 - 0,864 x2 con R2=0,988

Se determinara el valor de X5 para los siguientes 5 años es decir (2010, 2011, 2012, 2013, 2014)

Los cálculos de las variables x4 y x2 para cada año son:

Con el modelo hallado y

reemplazando los valores de las

variables independientes para cada año se tiene la predicción para la variable X5:

AÑO VALOR DE X5

2010 93,210371

2011 93,880127

2012 94,549883

2013 95,219639

2014 95,889395

AÑO VALOR DE X2

2010 2,859

2011 2,653

2012 2,447

2013 2,241

2014 2,035

AÑO VALOR DE X4

2010 4,097

2011 3,669

2012 3,241

2013 2,813

2014 2,385

23

4.7. DETECCION DE HETEROCEDASTICIDAD

Metodo Grafico.

Gráfico

X5

92908886848280

EI2

1,0

,8

,6

,4

,2

0,0

-,2

El grafico sugiere Homocedasticidad

Prueba de Goldfield y Quand.

GRUPO B

X5 X2 X4

85,51 6,01 8,49

87,03 6,31 6,66

88,15 6,56 5,28

89,17 6,6 5,01

82,81 7,04 10,14

81,56 7,12 10,24

81,05 8,05 10,86

80,46 8,7 11,1

GRUPO A

X5 X2 X4

90,47 2,87 6,07

90,73 3,35 6,21

90,76 3,43 5,82

89,72 3,85 6,43

89,01 4,33 6,65

88,22 4,91 6,86

88,4 5,5 6,99

24

1. – H0= VarA=VarB (Homocedasticidad)

H1= VarA ≠ VarB (Heterocedasticidad)

2. - α=0.1


De la tabla F Fisher se tiene el valor para un α=0,1 para F6,5=10.7

Rechazar H0 si Fcalculado>10.7


GrupoA

ANOVAb

6,589 2 3,294 26,572 ,005a

,496 4 ,124

7,085 6

Regresión

Residual

Total

Modelo

1

Suma de

cuadrados gl

Media

cuadrática F Sig.

Variables predictoras: (Constante), X2A, X4Aa.

Variable dependiente: X5Ab.

GrupoB

ANOVAb

81,123 2 40,561 177,096 ,000a

1,145 5 ,229

82,268 7

Regresión

Residual

Total

Modelo

1

Suma de

cuadrados gl

Media

cuadrática F Sig.

Variables predictoras: (Constante), X4B, X2Ba.

Variable dependiente: X5Bb.


H0= VarA=VarB El modelo presenta homocedasticidad

25

4.8. DETECCION DE AUTOCORRELACION

Metodo Grafico.

Gráfico

X5

92908886848280

EI2

1,0

,8

,6

,4

,2

0,0

-,2

El grafico sugiere Ausencia de Autocorrelación.

Prueba de Durbin Watson.(Para Autocorrelacion de primer orden)

1.- H0:ρ=0 (Ausencia de autocorrelacion)

H1:ρ≠0 (Presencia de autocorrelacion)

2.- α=0.05

3.-Estadistico de prueba:

2(1-ρ)

Hipótesis Nula Decisión Si

No existe autocorrelacion positiva


No existe autocorrelacion positivad

Rechazar

No hay decisión

Rechazar

0 ≤ d ≤ dL

dL ≤ d ≤ dU

4-dL ≤ d ≤ 4

26


No existe autocorrelacion positiva ni negativa

No hay decisión

No rechazar

4-dU U d ≤ dL

dU ≤ d ≤ 4-dU

De la tabla de Durbin Watson se tiene el valor para los limites con k=2 y n=20

dL=1.1 dU=1.537

Tramos

1 2 3 4 5

0 - 1.1 1.1 - 1.537 1.537 - 2.463 2.463 - 2.9 2.9 - 4

4.- Calculo de d:

2(1-(-0.08624))=2.17248

5.- Finalmente para α=0,05 d esta en el tramo 3= dU ≤ d ≤ 4-dU No rechazar H0

No existe autocorrelación positiva ni negativa.

V. CONCLUSIÓN:

Una vez concluida la parte experimental, se pude concluir que con la ayuda de las herramientas instrumentales

aprendidas como son la regresión lineal multiple para hallar un modelo matematico y la correccion del mismo mediante

la prueba F, se ha obtenido el siguiente modelo de predicción para LA TASA DE PROMOCIÓN EN LA EDUCAION PUBLICA

Modelo: x5=100,388 - 1,149 x4 - 0,864 x2 con R2=0,988

Se puede observar también que el coeficiente de determinación obtenido es muy bueno lo cual nos indica que gran

porcentaje del comportamiento esta explicado por la regresión.

Como se ha comprobado también el mode lo hallado presenta homocedasticidad y ausencia de Autocorrelacion por lo

tanto se puede proceder a la utilización del mismo, así se obtiene las predicciones de la TASA DE PROMOCIÓN EN LA

EDUCAION PUBLICA para los siguientes periodos y son:

27

AÑO VALOR DE X5

2011 93,210371

2012 93,880127

2013 94,549883

2014 95,219639

2015 95,889395

Expresado en porcentaje.

Se concluye finalmente con resultados satisfactorios como se puede observar.

VI. RECOMENDACIONES.

Es fundamental que al reconocer las variables que intervienes en un determinado problema tengan relación pues este

cierto conlleva a obtener buenos resultados con un coeficiente de determinación elevado.

El mejorar y optimizar un modelo matemático es muy importante ya que así se eleva la confiabilidad de que nuestro

modelo en realidad va a representar la realidad, al igual que acertamos en que el modelo hallado este libre de los

problemas de heterocedasticidad y autocorrelacion

VII. BIBLIOGRAFÍA

Introducción a la Econometría G. S. Maddala

Probabilidad y Estadística para ingenieros R. E. Walpole R.H Meyers

Apuntes de la materia de Modelos Económicos.

Apuntes de la materia de Modelos Econométricos

Pagina Web: Wikipedia, la enciclopedia libre.htm

Anuario Estadístico 2008 Instituto Nacional de Estadística

el analfabetismo

Documents