trabajo estadistica

67
Universidad de El Salvador Facultad de Ciencias Económicas Escuela de Economía Departamento de Matemáticas y Estadísticas Asignatura: Estadistica II Catedrática: Lic. Saúl Orlando Quintanilla Lemus Grupo Teorico: Nº 11 Contenido: Regresion Lineal Múltiple en las Ramas de la Actividad Económica de la Construcción, Industria Manufacturera y Transporte, Amacenaje y Comunicaciones en el período de 1995 a 2009 con respecto a la Población Económicamente Activa. i

Upload: jorge-zepeda-johezz

Post on 08-Nov-2015

20 views

Category:

Documents


2 download

DESCRIPTION

Trabajo Estadistica

TRANSCRIPT

Universidad de El SalvadorFacultad de Ciencias EconmicasEscuela de EconomaDepartamento de Matemticas y Estadsticas

Asignatura:Estadistica II

Catedrtica:Lic. Sal Orlando Quintanilla Lemus

Grupo Teorico:N 11

Contenido:Regresion Lineal Mltiple en las Ramas de la Actividad Econmica de la Construccin, Industria Manufacturera y Transporte, Amacenaje y Comunicaciones en el perodo de 1995 a 2009 con respecto a la Poblacin Econmicamente Activa.

Integrantes:Efran Ernesto Arvalo Aparicio AA09016Doris Irene Castro DazCD10003Moiss Alexander Chvez VsquezCV10003Adriana Guadalupe Martnez AyalaMA09008

Ciudad Universitaria, 29de Noviembre de 2011, Universidad de El SalvadorFacultad de Ciencias EconmicasEscuela de EconomaDepartamento de Matemticas y Estadsticas

Asignatura:Estadstica II

Catedrtica:Lic. Sal Orlando Quintanilla Lemus

Grupo Teorico:N 11

Contenido:Regresin Lineal Mltiple en las Ramas de la Actividad Econmica de la Construccin, Industria Manufacturera y Transporte, Amacenaje y Comuncaciones en el perodo de 1995 a 2009 con respecto a la Poblacin Econmicamente Activa.Integrantes:NombreCarnePorcentaje de ParticipacinEfran Ernesto Arvalo Aparicio AA0901650%Doris Irene Castro DazCD10003100%Moises Alexander Chvez VsquezCV10003100%Adriana Guadalupe Martnez AyalaMA0900890%

Ciudad Universitaria, 29 de Noviembre de 2011.

ndicendiceiObjetivosiiInvestigacin Realizada6Poblacin Econmicamente Activa6Especificacin del modelo de regresin8Hipotesis del Modelo9Fuente de Datos y Descripcion de Variables9Resultados de la Regresin111. Variables Introducidas/Eliminadas112. Estadisticos descriptivos123.Modelo de Regresin13Resumen del Modelo.13Test sobre Supuestos de Modelo.14Test sobre el supuesto del modelo. (Normalidad: Test de JarqueBera)14Test Significancia global del modelo: Prueba F.18Test de significancia de coeficientes: Prueba T18Determincacion de Intervalos de confianza19 Proyecciones con la regresin obtenida2OConclusiones21Recomendaciones22Bibliografa24Anexos

Objetivos

Objetivo General:Analizar del modelo de Regresin Lineal Mltiple al tema de la Poblacin Econmicamente Activa segn la rama de Actividad econmica durante el periodo comprendido entre 1995 a 2009.

Objetivo Especfico:1. Aplicacin del Mtodo de Regresin Mltiple al Tema de Investigacin.

2. Adquirir conocimiento sobre el manejo del Mtodo de Regresin Lineal Mltiple.

3. Elaborar un Modelo de Regresin Lineal Mltiple que explique de manera precisa el comportamiento de las variables de estudio segn Actividad Econmica en la Poblacin Econmicamente Activa.

Investigacin RealizadaPoblacin Econmicamente ActivaLa poblacin econmicamente activa PEA- es una variable utilizada para medir la fuerza de trabajo de una nacin o territorio, ya que contabiliza el nmero de personas que son capaces de trabajar y desean hacerlo. Segn el VI Censo de Poblacin 2007, la PEA se refiere a las personas de 10 aos y ms, vinculadas a la actividad econmica que conforman la fuerza de trabajo; ya que se encuentren ocupados, desocupados pero buscando trabajo, o que buscan trabajo por primera vez (Ministerio de Economa, 2008). Los resultados del VI Censo de Poblacin 2007 indican que en El Salvador existe una PEA de 1, 909,256 personas, las cuales representan el 33.24% de la poblacin total censada a nivel nacional. Al comparar los resultados del VI Censo de Poblacin 2007 con los obtenidos por el V Censo de Poblacin 1992, se observan algunos cambios en la composicin de la PEA de nacional. Este es el caso de la PEA en la zona urbana, la cual ha aumentado su participacin del 55.5% de la PEA nacional en 1992 al 73.1% en el 2007. En contraste, la PEA en la zona rural ha disminuido del 44.5% al 26.9% de la PEA nacional en el mismo perodo. Es importante mencionar que de acuerdo al VI Censo de Poblacin 2007, en la zona urbana se concentra el 62.7% de la poblacin a nivel nacional, y en la zona rural el 37.3%; mostrando as que existe una mayor concentracin de poblacin en la zona urbana. Llmese as a la parte de la poblacin total que participa en la produccin econmica. En la prctica, para fines estadsticos, se contabiliza en la PEA a todas las personas mayores de una cierta edad (10 aos, por ejemplo) que tienen Empleo o que, no tenindolo, estn buscndolo o a la espera de alguno. Ello excluye a los pensionados y jubilados, a las amas de casa, estudiantes y rentistas as como, por supuesto, a los menores de edad.Si se calcula el porcentaje entre la PEA y la poblacin total se obtiene la tasa de actividad general de un pas. Cuando un pas tiene altas tasas de Crecimiento demogrfico la tasa de actividad suele ser baja, pues existe un alto nmero de menores de edad y estudiantes en relacin al total. Ello ocurre frecuentemente en los pases menos desarrollados, como Producto de la llamada transicin demogrfica, constituyndose en una traba para alcanzar un mayor Crecimiento econmico, pues las personas que laboran tienen que producir -directa o indirectamente- para un gran nmero de personas que no generan Bienes.

Esquema del Total de la Poblacin

Industria.La industria surge con el fin de producir bienes para el consumo humano. Estos bienes se obtienen mediante la transformacin directa o indirecta de los recursos naturales. Actualmente, en El Salvador las actividades industriales se llevan a cabo a diferentes niveles; por ejemplo, se considera industria desde un taller familiar que elabora vestidos, hasta una gran fbrica que produce maquinaria.Las principales actividades industriales en El Salvador son: fabricacin de productos metlicos, elaboracin de sustancias qumicas, productos de caucho y plstico; produccin de alimentos, bebidas y tabaco; elaboracin de textiles y prendas de vestir, entre otras. Muy probablemente, la mayor cantidad de las personas que se encuentran trabajando la industria manufacturera sean trabajadoras (es) de las maquilas de ropa. En El Salvador, el total de personas trabajando en estas empresas son cerca m de 80,000, lo cual corresponde al 84% de las personas que trabajan en la actividad de Textiles y cerca del 37% del total de personal empleado en la rama de Industria manufacturera a nivel nacional. El 83% de estas personas son mujeres con edades promedio entre los 18 y 24 aos y con una escolaridad promedio de octavo grado de educacin bsica (mientras que el promedio nacional de escolaridad de la PEA es de 5 grados de educacin primaria).

Algunos autores reconocen la maquila de ropa como una de las reas en que se concentra la produccin para la exportacin -eje de acumulacin de las economas centroamericanas de la posguerra- y por lo tanto, estos volmenes de empleo ms las caractersticas de la mano de obra, se pueden caracterizar como un fenmeno de nueva proletarizacin y una de las tendencias ms importantes de la lgica de salarizacin en los mercados de trabajo actuales (Prez Sinz, 2000).

Comercio.En nuestros das, el comercio en El Salvador se ha visto favorecido por el aumento delos medios y vas de comunicacin. Existe una gran variedad en cuanto a giro de actividad y tamao, que va desde los pequeos hasta los grandes establecimientos. Los comercios se concentran en las zonas urbanas, especialmente en las entidades donde existe un gran nmero de poblacin.

Transporte, almacenaje y comunicaciones.En nuestro pas, desde hace varios aos se ha impulsado el desarrollo de los transportes y de los medios de comunicacin. Ambos se encuentran muy relacionados con el crecimiento de la poblacin, as como con sus necesidades.

Especificacin del modelo de regresinRegresin Mltiple: Este tipo se presenta cuando dos o ms variables independientes influyen sobre una variable dependiente. Ejemplo: Y= f(x, w, z).

Anlisis de Regresin Mltiple:Dispone de una ecuacin con tres variables independientes adicionales. Se puede ampliar para cualquier nmero "m" de variables independientes:Mediante el modelo de regresin lineal mltiple se explicara el comportamiento de una determinada variable que se denomina variable a explicar, o variable dependiente, (y se representara con la letra Y) en funcin de un conjunto de k variables explicativas (independientes) X1, X2,..., Xk mediante una relacin de dependencia lineal, cuya frmula es:

Siendo el trmino de perturbacin o error estocstico.

Para poder resolver y obtener A, B1 y B2 en una ecuacin de regresin mltiple el clculo se deben asignar valores numricos a los parmetros 1, 2,..., k. Es decir, estimar el modelo de manera que, los valores ajustados de la variable dependiente resulten tan prximos a los valores realmente observados como sea posible. Para poder resolver se puede utilizar programas informticos como Excel con el complemento de XLSTATBajo este concepto, lo que se desea hacer el anlisis de regresin, teniendo como variable dependiente y: la Poblacin Econmicamente Activa y se tienen las variables independientes: Construccin, Industria Manufacturera y Transporte, almacenaje y comunicacin. Mediante el anlisis de regresin se determinara la incidencia de estas variables en la Poblacin Econmicamente Activa.

Hipotesis del Modelo

Hiptesis Nula:No existe relacin lineal entre la PEA y las ramas de actividad Econmica - Industria Manufacturera, Construccin y Transporte, almacenaje y comunicaciones, de tal manera que la contribucin de estas ramas de actividad econmicas no son significativas a la PEA

Hiptesis Alternas:1. Existe relacin lineal entre la PEA y la rama de Actividad Econmica Industria Manufacturera, de tal manera que la contribucin de esta rama es significativa para la PEA.

2. Existe relacin lineal entre la PEA y la rama de Actividad Econmica Construccin., de tal manera que la contribucin de esta rama es significativa para la PEA.

3. Existe relacin lineal entre la PEA y la rama de Actividad Econmica Transporte, almacenaje y comunicaciones de tal manera que la contribucin de esta rama es significativa para la PEA.

Fuente de Datos y Descripcion de Variables

La informacin que presentamos a continuacin es la que utilizamos en la investigacin, fue conseguida en el la DIGESTYC dependencia del Ministerio de Economa.

Aos

Industria Manufacturera(X1)

Construccin(X2)

Transporte, Almacenajey Comunicaciones (X3)Total general PEA Y

1995402945146885864601274575

199639311753415974941090048

19973538671579041017971229133

1998438791146699982141369406

19994513861525991083321426633

20004321691344551136361362520

20014258341475881133731375591

20024245591518161030991360950

20034234491766241092281420605

20043976001767591192581389238

20053910341653321154751345687

20063856461819071102071357526

20074042581694871090111367519

20084175071595271051211366318

20093811561471391076911273981

Variable Dependiente - PEA:Es el total de la poblacin econmicamente activa utilizada para medir la fuerza de trabajo de una nacin o territorio, es una variable cuantitativa que se mide por habitante. Escala nominal. Variable Independiente - Construccin:Es el total de la poblacin econmicamente activa utilizada para medir la fuerza de trabajo en la rama de actividad econmica de la Construccin, la cual consiste en el arte o tcnica de fabricar edificioseinfraestructura en el campo de la Arquitectura e Ingeniera, es una variable cuantitativa que se mide por habitante. Escala nominal Variable Independiente Industria Manufacturera:Es el total de la poblacin econmicamente activa utilizada para medir la fuerza de trabajo en la rama de actividad econmica de la Industria Manufacturera que consiste en consiste en la transformacin dematerias primasenproductos manufacturados,productos elaboradosoproductos terminadospara sudistribuciny consumo, es una variable cuantitativa que se mide por habitante. Escala nominal.

Variable Independiente - Transporte, Almacenaje y Comunicaciones:

Es el total de la poblacin econmicamente activa utilizada para medir la fuerza de trabajo en la rama de actividad econmica de la Transporte, Almacenaje y Comunicaciones que comprende: el transporte terrestre, areo, acutico, transporte por tubera (oleoducto); los servicios conexos y servicios auxiliares que faciliten el funcionamiento de los vehculos de transporte; carga y descarga de los bienes, terminales de puertos, aeropuertos; las agencias de contrata de carga y pasajes; playas de estacionamiento y peajes; los almacenes, agencias de viajes y las actividades de los guas tursticos. El alquiler de equipo de transporte con conductor est relacionado con el transporte y se incluye en esta actividad. Las comunicaciones comprenden telefona, fax, correspondencia escrita, mensajes. Es una variable cuantitativa que se mide por habitante. Escala nominal.Resultados de la Regresin

Variables Introducidas/Eliminadas

En esta tabla se presenta un resumen del proceso de regresin mltiple que se realiza. En esta tabla la columna de variables introducidas muestra las variables tomadas en cuenta para realizar el anlisis de regresin, que en este caso son Industria Manufacturera, Construccin y Transporte, almacenaje y comunicacin. La segunda columna indica si se eliminaron variables, que en este caso se nos haba designado tres variables para el inicio de la investigacin, al momento de una mayor recopilacin de los datos, nos dimos cuenta que las ramas de la Poblacin Econmicamente Activa han ido segmentndose y con el pasar de los aos algunas de sus componentes cambiaron, la nica que eliminamos fue Administracin pblica y defensa y se sustituy por Transporte, almacenaje y comunicacin, las otras dos permanecieron constantes. En la ltima columna aparece el mtodo utilizado, introducir en este caso, que permiti decidir que variables se introducen o extraen del modelo.

CUADRO N 1VARIABLES INTRODUCIDAS/ELIMINADAS

ModeloVariables introducidasVariables eliminadasMtodo

Dimensin 1Industria Manufacturera, Construccin, Transporte, almacenaje y comunicacin.aAdministracin pblica y defensa.Introducir

a. Todas las variables solicitadas introducidas.

b. Variable dependiente: Poblacin Econmicamente Activa por rama de actividad econmica.

Estadisticos descriptivos

La tabla estadsticos descriptivos presenta las variables que se tomaran en cuenta en el anlisis de regresin, muestra los resultados de estas y de los estadsticos media y tpica, as como el nmero de casos incluidos en el anlisis. La media aritmtica y la varianza representan indicadores del estado de validacin de los datos.Los resultados de la media indican que las variables Industria manufacturera, Construccin y Transporte almacenaje y comunicacin tienen medias muy diferentes en comparacin a la variable PEA(por rama de actividad econmica) ya que en esta ultima se incluyen las dems ramas de actividad econmica que no se han tomado en estudio y que en la actualidad son quince pero solo se tomaron tres por motivos de investigacin, es de hacer notar este dato, adems estas medias son una representacin promedio de las quince observaciones que son los datos de los quince aos de estudio; este indicador se considera una de las medidas ms importantes de dispersin y variabilidad. El estadstico de la tercera columna de la tabla 1, desviacin tpica, permite observar que los datos se alejan significativamente de la media, aunque entre las variables independientes en comparacin a la variable dependiente hay una gran diferencia, esto es por la el tamao de sus respetivos datos y por ende de la misma media obtenida. Este ultimo indicador indica que cuanto ms elevado sea, menos fidedignos son los resultados de la media.

MediaDesviacin EstndarN. Observaciones

PEA (por rama de actividad econmica)2398364114272.35934380615

Industria Manufacturera408224.53333333325554.376857054915

Construccin157875.73333333313571.360624842415

Transporte, almacenaje y comunicacin.107226.48876.1345415670715

MODELO de Regresin

FuenteValorDesviacin tpica

Interseccin952114.728574604.687

Industria Manufacturera0.9321.002

Construccin1.2472.076

Transporte, almacenaje y comunicacin.8.1052.996

La constante 0= 952114.728, significa que si la Industria Manufacturera (1), Construccin (2) y Transporte, almacenaje y comunicacin () son iguales a cero, la PEA por rama de actividad econmica se mantendra en 952114.728%.La constante 1= 0.932X1, significa que si la cantidad de personas pertenecientes a la rama a la construccin y transporte, almacenaje y comunicacin se mantienen constante, la rama de la industria manufacturera aumenta en 0.932, por cada unidad que aumente X1.La constante 2=1.247 X2, significa que si la cantidad de personas pertenecientes a la rama de la Industria Manufacturera y Transporte, almacenaje y comunicacin se mantienen constantes, la tasa de la rama de la construccin aumenta en 1.247, por cada unidad que aumente X2.La constante = 8.105X, significa que si la tasa de personas pertenecientes a la rama de la Industria Manufacturera y la Construccin permanece constante, la rama de Transporte, almacenaje y comunicacin aumenta en 8.105 por cada unidad que aumente X.

Resumen del Modelo.El primer dato que muestra se refiere al coeficiente de correlacin mltiple R, es un valor que oscila entre -1 y +1 segn el grado de correlacin entre las variables; y a su cuadrado. R2 es el coeficiente de determinacin y expresa la proporcin de varianza de la variable dependiente que esta explicada por la variable independiente. R2 corregida es una correccin a la baja de R2 que se basa en el nmero de casos y de variables independientes.

Los resultados indican que el 53.0% de la variacin de la Poblacin Econmicamente Activa se explica por la aproximacin lineal de la relacin que existe con las variables Industria Manufacturera, Construccin, Transporte, almacenamiento y comunicacin. Lo cual refleja que el modelo no es tan confiable como se pensara, tomando como referencia que entre mas cercano este al 100% se tiene mucha mas confianza de este. Que el coeficiente de determinacin corregido (40.2%) sea relativamente bajo, no indica que la variable dependiente y las variables explicativas sean estadsticamente independientes. Lo que significa que las variables independientes no son lo suficientemente significativas para poder explicar el modelo.

ModeloRR2R2 corregido

10.7280109880.5300.402

Test sobre Supuestos de Modelo.Test sobre el supuesto del modelo. (Normalidad: Test de JarqueBera)

Prueba de Jarque-Bera (PEA (por ao))

JB (Valor observado)2.488

JB (Valor crtico)5.991

GDL2

p-valor0.288

Alfa0.05

Interpretacin de la prueba:H0: La muestra sigue una ley Normal.Ha: La muestra no sigue una ley Normal.Como el p-valor calculado es mayor que el nivel de significacin alfa=0.05, no se puede rechazar la hiptesis nula H0.El riesgo de rechazar la hiptesis nula H0 cuando es verdadera es de 28.83%.P-P plot (PEA (por ao)):

Conclusin:Al umbral de significacin Alfa=0.050 no se puede rechazar la hiptesis nula segn la cual la muestra sigue una ley normal. Dicho de otro modo, la anormalidad no es significativa. Adems, al observar los puntos vemos que su comportamiento pertenece a una distribucin normal, ya que estos se encuentran cerca de la lnea recta.

Prueba de Jarque-Bera (Industria Manufacturera)

JB (Valor observado)0.299

JB (Valor crtico)5.991

GDL2

p-valor0.861

Alfa0.05

Interpretacin de la prueba:H0: La muestra sigue una ley Normal.Ha: La muestra no sigue una ley Normal.Como el p-valor calculado es mayor que el nivel de significacin alfa=0.05, no se puede rechazar la hiptesis nula H0.El riesgo de rechazar la hiptesis nula H0 cuando es verdadera es de 86.09%.P-P plot (Industria Manufacturera):

La grfica nos indica que existe una distribucin normal de la variable Industria Manufacturera debido a que los puntos observados se posicionan muy cerca de la lnea recta y de forma casual. Esto es evidencia suficiente para aceptar que existe una distribucin normal de dicha variable independiente.

Prueba de Jarque-Bera (Construccin)

JB (Valor observado)0.683

JB (Valor crtico)5.991

GDL2

p-valor0.711

alfa0.05

Interpretacin de la prueba:H0: La muestra sigue una ley Normal.Ha: La muestra no sigue una ley Normal.Como el p-valor calculado es mayor que el nivel de significacin alfa=0.05, no se puede rechazar la hiptesis nula H0.El riesgo de rechazar la hiptesis nula H0 cuando es verdadera es de 71.06%.

P-P plot (Construccin):

La grfica nos indica que existe una distribucin normal de la variable Construccin debido a que los puntos observados se posicionan muy cerca de la lnea recta y de forma casual. Esto es evidencia suficiente para aceptar que existe una distribucin normal de dicha variable independiente.Prueba de Jarque-Bera (Transporte, almacenaje y comunicacin.)

JB (Valor observado)1.142

JB (Valor crtico)5.991

GDL2

p-valor0.565

alfa0.05

Interpretacin de la prueba:H0: La muestra sigue una ley Normal.Ha: La muestra no sigue una ley Normal.Como el p-valor calculado es mayor que el nivel de significacin alfa=0.05, no se puede rechazar la hiptesis nula H0.El riesgo de rechazar la hiptesis nula H0 cuando es verdadera es de 56.49%.

P-P plot (Transporte, almacenaje y comunicacin.):

La grfica nos indica que existe una distribucin normal de la variable Transporte, almacenaje y comunicacin, debido a que los puntos observados se posicionan mucho ms cerca de la lnea recta y de forma casual. Esto es evidencia suficiente para aceptar que existe una distribucin normal de dicha variable independiente.Test Significancia global del modelo: Prueba F.FuenteGDLSuma de los cuadradosMedia de los cuadradosFPr> F

Modelo396880380742.88132293460247.6274.1340.034

Error1185934028797.1197812184436.102

Total corregido14182814409540.000

Variables Productoras: Industria Manufacturera, Construccin y Transporte, almacenaje y comunicacin.Variable dependiente: Poblacin Econmicamente Activa segn rama de actividad econmica.

El valor del nivel critico Pr>F = 0.034 indica que si existe una relacin lineal significativa entre la variable dependiente que es la Poblacin Econmicamente Activa segn la rama de actividad econmica y el conjunto de variables independientes que son la Industria Manufacturera, Construccin y Transporte, almacenaje y comunicacin. Ya que el valor del nivel critico (Pr>F = 0.034), es menor que = 0.05. Por lo tanto se rechaza H0 ya que Pr>F < .

Test de significancia de coeficientes: Prueba T

FuenteValorDesviacin tpicatPr> |t|

Industria Manufacturera0.2080.2240.9290.373

Construccin0.1480.2470.6010.560

Transporte, almacenaje y comunicacin.0.6300.2332.7050.020

Las pruebas t y sus niveles crticos (las ltimas dos columnas de la tabla): en las tres variables podemos observar que tienen valores significativamente distintos de cero por lo cual las tres variables son relevantes en la ecuacin de regresin, esto se corrobora ya que el valor crtico sig., para los casos de Industria Manufacturera y Transporte, almacenaje y comunicacin es menor que 0,05. Esto implica una relacin significativa lineal entre estas dos variables, con la variable dependiente PEA segn rama de actividad econmica y se rechaza que no existe relacin lineal entre las variables independientes con la variable dependiente. En el caso de la variable Construccin su valor es mayor que 0.05 (valor de significancia) por lo tanto con esta variable no se rechaza que no haya una relacin lineal con respeto a la PEA segn rama de actividad econmica. Aun considerando que las variables en estudio tienen relevancia en el modelo por ser distintas a cero. PRUEBA DE SIGNIFICANCIA t : Tambin llamada prueba de significancia individual, esta se utiliza para determinar si cada una de las variables independientes tienen significancia, es decir que habr que hacer una prueba t para cada variable independiente especificada en el modelo.

Hiptesis Nula:No existe relacin lineal entre la PEA y las ramas de actividad Econmica - Industria Manufacturera, Construccin y Transporte, almacenaje y comunicaciones, de tal manera que la contribucin de estas ramas de actividad econmicas no son significativas a la PEA

Determincacion de Intervalos de confianzaFuenteLmite inferior (95%)Lmite superior (95%)

Industria Manufacturera-0.2850.702

Construccin-0.3940.691

Transporte, almacenaje y comunicacin.0.1171.142

Estos intervalos proporcionan la informacin sobre los lmites entre los que se pueden esperar que se encuentre el valor de cada coeficiente de regresin.Los intervalos de confianza indican una estimacin precisa y estable ya que el rango entre los intervalos no es muy amplio.

pROYECCIONES CON LA REGRESION OBTENIDA.AosPEA (por ao) (y)X(X)(X)=952114.728+0.932X+1.247X+8.105X/Y-/

19952,136,450402995146885864602211629.96375,179.963

19962,227,409393117153415974942299997.14772,588.147

19972,245,4193538671579041017972303889.74558,470.745

19982,403,194438791146699982142340026.06363,167.937

19992,444,9594513861525991083322441128.2933,830.707

20002,363,3524321691344551136362443581.40180,229.401

20012,445,4674258341475881133732451922.4176,455.417

20022,366,9694245591518161030992372735.6635,766.663

20032,450,0814234491766241092282452312.2642,231.264

20042,417,6703976001767591192582509682.49192,012.491

20052,461,1873910341653321154752458652.2952,534.705

20062,501,3283856461819071102072431602.56469,725.436

20072,464,4004042581694871190112504817.62840,417.628

20082,495,9084175071595271051212392167.126103,740.874

20092,551,6673811561471391076912363670.008187,996.992

20102602700.343887791500821098452,391,901210,799.2264

20112654754.3473965551530831120422,420,697234,057.5055

20122707849.4344044861561451142832,450,068257,780.9502

20132762006.4224125761592681165682,480,028281,978.8637

20142817246.5514208271624531189002,510,586306,660.7356

Como nos muestra el resultado de la estimacin en base a la ecuacin del modelo, con el valor de cada coeficiente y con los datos estimado de las variables en estudio se puede lograr una estimacin para el periodo comprendido entre 2010 y 2014. Como no se dispone de los datos para esos aos de las variables en estudio, estos se obtuvieron mediante un aumento del 2% para cada ao posterior en cada variable y as lograr una estimacin que pueda reflejar en base a este modelo la Poblacin Econmicamente Activa para esos aos. Se puede observar que las proyecciones () estn ms o menos cercanas al valor observado en (Y). Donde se observ las mayores variaciones estimadas sern en los aos 2013 y 2014 con 281,798.8637 y 306,660.7356 respectivamente y la menor en el ao 2003 con 2,231.264. Tomando en cuenta siempre que los datos estn en funcin del nmero de personas pertenecientes a esa rama de la actividad econmica.

Conclusiones

Por medio del mtodo de regresin lnea, se hizo el anlisis correspondiente de relacin que existe entre el Total de la PEA y las ramas de Actividad Econmica de la Industria Manufacturera, Construccin y Transporte, Almacenaje y Comunicaciones. Al procesar lo datos de la base de datos de por medio del programa Excel utilizando el complemento XLSTAT se obtuvieron los siguientes resultados: El valor de R2 nos indica que la proporcin de la variacin de las variables de Industria Manufacturera, Construccin y Transporte, almacenaje y comunicacin que son explicadas por la lnea de regresin es de 53% tambin podemos decir que el modelo no es tan confiable.

El valor de R nos indica que hay una relacin moderada positiva entre las variables Industria Manufacturera, Construccin y Transporte, almacenaje y comunicacin con respecto a la PEA del 72.8%.

La prueba de Jarque-Bera nos indica que hay suficiente evidencia para aceptar que existe una distribucin normal de cada una de las variables independientes, debido a que existe una distribucin normal.

El test de significancia global del modelo Prueba F nos indica que si existe una relacin lineal significativa entre la variable dependiente que es la Poblacin Econmicamente Activa y las variables independientes Industria Manufacturera, Construccin y Transporte, almacenaje y comunicacin ya que F=0.034, siendo menor que =0.05, por lo que se concluye que se rechaza Ho.

Recomendaciones

Usar una mayor cantidad de variables independientes que ayuden a explicar de una mejor manera el comportamiento de la variable dependiente, para obtener una buena representacin del modelo lineal

Utilizar un modelo de regresin lineal mltiple para analizar la relacin existente en una variable dependiente y una o ms variables independientes, de esta manera se obtendr un estudio confiable de las mismas.

Para mejores resultados se debera utilizar una base de datos lo ms grande posible, esto har que los resultados de la prueba T y la prueba F, sean ms representativos.

Investigar bases de datos de largos periodos, que permitan una mayor confiabilidad en el anlisis de los resultados.

Incentivar a las personas que deseen realizar una investigacin mediante un modelo de regresin lineal mltiple a que utilicen programas estadsticos tales como el que se emple en la presente investigacin que fue Excel con su complemento XLSTAT o los programas SPSS, Eviews, o Minitab.

Si los resultados obtenidos son desfavorables son desfavorables para el caso en estudio, el investigador y analista de los datos debe hacer propuestas de como se pueden mejorar estos resultados, mediante estrategias que permitan alcanzar los resultados deseados

Bibliografa

LIBROS.1. Introduccin al anlisis de regresin lineal, Douglas C. Montgomery, Elizabeth A. Peck, G. Geoffrey Vining; Editorial Continental, Primera edicin, Mxico 2002.

2. Anderson Sweeney Willians Estadstica para Administracin y Economa, Sptima edicin.

3. Econometra Bsica, Damonar N. Gujarati, Bogot, 1997

4. David M. Levine y otros autores. Estadstica para Administracin Mxico: Pearson Educacin, 2006.

INTERNET.1. http://www.eco-finanzas.com/diccionario/P/POBLACION_ECONOMICAMENTE_ACTIVA.htm

2. http://www.eclac.org/publicaciones/xml/4/41104/DocW49.pdf

3. http://www.ilo.org/public/english/dialogue/ifpdial/downloads/wpnr/elsalvador.pdf

4. http://www.bcr.gob.sv/uploaded/content/category/949040148.pdf

Anexos Bitcora de ActividadesFechaResponsableActividad DesarrolladaLimitacionesObservaciones

3de Noviembre 2011A.G.M.ADescarga de los lineamientos del trabajo de investigacin

4 de Noviembre 2011A.G.M.AD.I.C.DM.A.C.VEleccin de posibles Temas de Investigacin Eleccin de tema

8 de Noviembre 2011A.G.M.AM.A.C.V

Presentacin y Aprobacin del Tema de Investigacin.

10 de Noviembre2011

A.G.M.AD.I.C.DM.A.C.V

Objetivos de la Investigacin Marco Terico de la Investigacin

12 de Noviembre2011A.G.M.AD.I.C.DM.A.C.V Especificaciones del modelo de regresin. Hiptesis del Modelo de regresin

14 de Noviembre2011A.G.M.AD.I.C.DM.A.C.VFuente de datos y descripcin de variables

15 de Noviembre2011D.I.C.DM.A.C.VResultados de la regresin

Del 17 al 21 de Noviembre 2011D.I.C.DM.A.C.V

Test sobre supuestos del modelo:1. Normalidad2. Prueba F3. Prueba T4. Intervalos de Confianza Problemas para utilizar el complemento XLSTAT

22 de Noviembre 2011A.G.M.A

Asesora para el desarrollo del trabajo

28 de Noviembre 2011D.I.C.DM.A.C.V

Proyeccin con la regresin Obtenida

FechaResponsableActividad DesarrolladaLimitacionesObservaciones

23 de Noviembre 2011A.G.M.AD.I.C.DM.A.C.V

Proyeccin con la regresin obtenida PortadandiceIntroduccinBibliografaAnexos

29 de Noviembre 2011A.G.M.AD.I.C.DM.A.C.VE.E.A.AEntrega del Trabajo

No Hubo Limitacin Hubo LimitacinA.G.M.A: Adriana Guadalupe Martnez Ayala D.I.C.D Doris Irene Castro Diaz M.A.C.V Moises Alexander Chavez Vasquez E.E.A.A Efrain Ernesto Arevalo Aparicio

TEORIA SOBRE MODELOS DE REGRESION LINEAL

Conceptos bsicos

Modelo de regresinEl anlisis de regresin mltiple es el estudio de la forma en que una variable dependiente, y, se relaciona con dos o ms variables independientes.El modelo de regresin lineal mltiple se define como la ecuacin que describe la forma en que la variable dependiente, y, se relaciona con las variables independientes x1, x2,xp.Otra definicin que se puede hacer sobre modelo de regresin mltiple es, que es una ecuacin matemtica que describe como se relaciona la variable dependiente y con las variables independientes x1, x2,xp. y un trmino de error .[footnoteRef:1] [1: Anderson Sweeney Willians Estadstica Para Administracin y Economa, Sptima edicin ]

En el modelo de regresin mltiple son los parmetros y (letra griega psilon) es una variable aleatoria. Un examen detallado de este modelo indica que y es un funcin lineal de x1, x2,xp mas psilon. El trmino de erros explica la variabilidad en que y que no puede explicar el efecto lineal de las p variables independientes.[footnoteRef:2] [2: Anderson Sweeney Willians Estadstica Para Administracin y Economa, Sptima edicin ]

Interpretacin.Este trmino de modelo de regresin mltiple es de mucha importancia ya que permite relacionar variables independientes con una variable dependiente, y mediante esta relacin que hace este modelo se puede realizar un estudio que permita conocer la relacin que existe entre dichas variables.Ejemplo.Por ejemplo se tiene que el ingreso total del gobierno, depende de los ingresos de capital e ingresos corrientes, es decir que los ingresos totales es la variable dependiente mientras que los ingresos de capital y los ingresos corrientes son las variables independientes. Linealidad de variablesEl principal y quizs ms natural significado de linealidad es que la expectativa condicional de Y es una funcin lineal de X1.[footnoteRef:3] [3: Econometra Bsica, Damonar N. Gujarati, Bogot, 1997]

Interpretacin.Este concepto permite sencillamente identificar cuando una ecuacin es lineal o no depender de cmo las variables estn constituidas, ya que si estn estas elevadas a la potencia 1 es una funcin lineal pero si estn elevadas a otra potencia diferente de uno ya no es una funcin lineal.EjemploPor ejemplo tenemos la siguiente ecuacin: la cual es una funcin lineal ya que geomtricamente la curva que se obtendra al graficar dicha ecuacin es un aliena recta; pero si se tiene una ecuacin en la cual una variable independiente este elevada al cuadrado, esta ya no sera una funcin lineal debido a que una de las variables x aparecera al cuadrado.

Linealidad en parmetrosEl segundo sentido de linealidad es que la esperanza condicional de Y, E(x), es una funcin lineal de los parmetros, de las ; puede ser o no lineal en la variables X.De las dos interpretaciones de linealidad, la linealidad en los parmetros constituye el concepto relevante en la teora del modelo de regresin mltiple. Por lo tanto la expresin regresin lineal mltiple significa siempre un regresin lineal en los parmetros; las (es decir los parmetros se elevan nicamente a la primera potencia), pudiendo o no ser lineales en las variables explicativas, en las X. [footnoteRef:4] [4: Econometra Bsica, Damonar N. Gujarati, Bogot, 1997]

Interpretacin.El concepto de linealidad en parmetros sirve para identificar que si una funcin es lineal en los parmetros, dando a conocer la forma en que se puede identificar si cualquier funcin es lineal o no.EjemploUn ejemplo de este concepto es el siguiente: que digamos el parmetro 1, si 1 aparece solamente con una potencia de 1, pero si este aparece multiplicado o dividido por algn otro parmetro este, ya no pertenece a una funcin lineal por ejemplo 12, 2/1, etc.

Error estocsticoEl error estocstico es la parte de la ecuacin que no recoge con ninguna variable. El termino perturbacin sustituye todas aquellas variables que han sido excluidas del modelo pero afectan conjuntamente a Y. [footnoteRef:5] [5: Econometra Bsica, Damonar N. Gujarati, Bogot, 1997]

No es que sirve o no para algo, es algo que est, en econometra por lo menos el objetivo es estimar de tal forma que la perturbacin sea mnima (a travs de minimizar los errores al cuadrado).

Cuanto se desarrolla un modelo se tiene una variable "Y" que se quiere explicar su comportamiento a travs de las variables independientes.

Y = 0 + 1x1 + 2x2 +ui

Ui es la perturbacin estocstica o error estocstico.Esto existe por varias razones:a) La teora, si existe alguna, que determina el comportamiento de Y, suele ser incompleta.b) Aun en caso de que se conocieran algunas de las variables excluidas y que se procediera entonces a plantear un modelo de regresin mltiple, es posible que no existan cifras sobre dichas variables.c) Algunos datos no se pueden describir a travs de alguna variable (por ejemplo si hablamos de preferencias, no puedes medir las preferencias de las personas)d) Son datos totalmente aleatorios (las personas actan de forma inexplicable a veces que no se puede descifrar)e) Se omiten variables (al momento de definir una ecuacin economtrica, el mismo analista se "olvida" de poner otra variable que si existe pero no la tomas en cuenta.f) Factores que ocurren sin ninguna frecuencia. (terremotos, hechos que ocurren una sola vez)[footnoteRef:6] [6: http://es.answers.com/question/index?qid=20070914160028AANekSM]

Interpretacin.Esta definicin es de mucha ayuda ya que permite saber que al momento de construir modelos de regresin siempre se dejan variables que no se toman en cuenta, y es que existen ciertas condiciones por las cuales no se toman en cuenta o se dejan de considerar.

EjemploSi se quiere explicar la inflacin, se sabe que se mueve por el tipo de cambio, el producto, entre otras, pero nunca, se puede explicarla al 100% porque hay factores inobservables que no se pueden definir por varias razones: o no se tienen datos, o son factores aleatorios, etc.

Regresin muestralEn muchas ocasiones los parmetros, en general no se conocen y se deben determinar a partir de los datos de una muestra. Para calcular los estadsticos de la muestra b0, b1, b2,,bp que se utilizan como estimadores puntuales de los parmetros 0, 1, 2, p, se usan en una muestra aleatoria. Esos estadsticos dan como resultado la ecuacin de regresin mltiple estimada.La ecuacin de regresin mltiple estimada se define como la estimacin de la ecuacin de regresin mltiple, basada en los datos de la muestra y en el mtodo de los mnimos cuadrados; y esta es:

Generalmente es necesario trabajar con informacin muestral y no poblacional, por lo tanto, esta ecuacin servir para trabajar con datos mustrales.[footnoteRef:7] [7: Anderson Sweeney Willians Estadstica Para Administracin y Economa, Sptima edicin ]

Interpretacin.La importancia de este concepto radica en que muchas veces no se pueden manejar o trabajar con datos poblacionales porque son demasiados, sin embargo este concepto proporciona una alternativa para trabajar con datos mustrales que no son ms que datos sacados de un poblacin. Y a partir de la ecuacin se hace una estimacin de los resultados.Ejemplo.Como ejemplo se tiene que para trabajar con datos poblacionales con respecto al producto financiero como variable dependiente, y los intereses sobre prestamos e intereses sobre inversiones como variables independientes, los datos poblacionales son demasiados por lo que para realizar un anlisis estimado se hace en base a una seleccin de una muestra y los resultados del anlisis que se le realice a esta muestra se inferirn a la poblacin.

Error estndar de los mnimos cuadrados[footnoteRef:8] [8: Econometra bsica/ Damodar N. Gujarati, Bogot: McGraw-Hill, 1997.]

El error estndar es la desviacin estndar de la distribucin muestral del estimador y esta es la distribucin de frecuencias o de probabilidades de un estimador.Los estimadores de los mnimos cuadrados estn en funcin de la informacin maestral.Sin embargo como los datos pueden cambiar de fcilmente de una muestra a otra, de igual manera cambiara ipso facto los estimativos que se obtengan, por tanto se hace necesario encontrar alguna medida de la confiabilidad o precisin de los estimadores y . La precisin de un estimativo se mide a travs de su error estndar. Los estimadores de MCO pueden obtenerse de la siguiente manera:Var () = Se ()Var () = Se () = La raz cuadrada positiva de = Se conoce como error estndar de la estimacin bsicamente es la desviacin estndar de los valores y con respecto a la lnea de regresin estimada y que se utiliza con frecuencia como una medida que resume la bondad del ajuste de la lnea de regresin estimada.Caractersticas delas varianzas (y por lo tanto errores estndar) de y .1. La varianza de es directamente proporcional a pero inversamente proporcional a lo cual implica que, dado , cuanto mayor sea la variacin en los valores de X, mas pequea ser la varianza de . Y mayor la precisin en la estimacin de .2. La varianza de es directamente proporcional a y a pero inversamente proporcional a y al tamao de la muestra.3. Puesto que y . Son estimadores no solo varan de una muestra a otra si no que dentro de una muestra dada tienden a depender entre si. Esta dependencia entre los estimadores se mide mediante la covarianza existente entre ellos.Ejemplo.Se recolectan datos de de una muestra de 10 restaurantes (ARMAND PIZZA PARLORS). Calcular el error estndar.Restaurante poblacin de estudiantes (miles) ventas trimestrales (miles de $)ventas pronosticadas y = 60+5xiError - Error al cuadrado ( - )

125870-12144

261059015225

3888100-12144

4811810018324

512117120-39

616137140-39

720157160-39

820169160981

922149178-21441

102620219012144

SCE =1530

s = ECM = = 191.25S= = S= = = 13.829Interpretacin.El error estndar o desviacin estndar es el que no determina el numero de desvos de un conjunto de datos con respecto a su media aritmtica, y el error estndar de los estimadores de los mnimos cuadrados nos ayuda a verificar en que proporcin los estimadores y . Se desvan de su media con respecto a todas las muestras posibles. Supuestos del modelo de regresin lineal [footnoteRef:9] [9: Econometra bsica/ Damodar N. Gujarati, Bogot: McGraw-Hill, 1997.]

Supuesto 1 (el valor medio o promedio de es igual a cero)E (I )=0El supuesto plantea que el valor promedio de , dado un valor de , es igual a cero. Todo lo que se plantea es que aquellos factores que no estn incluidos explcitamente en el modelo, incorporados, por tanto, en , no afecta sistemticamente el valor promedio de Y; dicho de otro modo, los valores positivos de se cancelan con los valores negativos de tal manera que su efecto promedio sobre Y es cero.Supuesto 2 (homocedasticidad o igual varianza para Var ( I ) =E E (A varianza condicional de es un numero positivo constante, igual a tcnicamente representa el supuesto de homocedasticidad o igual (homo) dispersin (cedasticidad) o igual varianza.Supuesto 3 (no existe autocorrelacin alguna entre las perturbaciones)Cov ( , ) = E = E () por el supuesto 1=0iDonde i y j son dos observaciones diferentes y cov significa covarianza, este supuesto se conoce como el supuesto de correlacin no serial o de no auto correlacin.Supuesto 4 las variables explicativas son no estocsticas (es decir fijas para muestreos repetitivos) o si son estocsticas estn distribuidas independientemente de la perturbaciones Supuesto 5 no existe multicolinealidad entre las variables explicativas (las X).Supuesto 6 (cero covarianza entre y )Cov ( , ) = E E= supuesto que E () = 0Afirma que la perturbacin u y la variable explcita I no estn correlacionadas.Este supuesto se cumple automticamente si la variable X no es aleatoria o estocsticaSupuesto 7 El modelo de regresin esta correctamente especificado (no existen sesgos ni errores de especificacin)Este es el supuesto ms riguroso y quizs el menos atractivo, esta para recordarnos que nuestro anlisis de regresin y, por tanto los resultados que se obtengan con base al anlisis, estn condicionados al modelo que se haya escogido, y de otro lado para advertirnos que debemos cuidar debemos pensar cuidadosamente sobre la forma funcional de los modelos economtricos, especialmente cuando existan diferentes teoras que rivalizan entre si para explicar ciertos fenmenos econmicos como, por ejemplo , la tasa de inflacin.Supuesto 8 [footnoteRef:10] [10: html.rincondelvago.com/metodo-de-minimos-cuadrados-ordinarios.html]

El nmero de observaciones debe ser mayor que el nmero de parmetros a estimar.Supuesto 9 [footnoteRef:11] [11: IDEM]

Debe existir variabilidad en los valores de X. No todos los valores de una muestra dada deben ser iguales. Tcnicamente la varianza de X debe ser un nmero finito positivo. Si todos los valores de X son idnticos entonces se hace imposible la estimacin de los parmetros.Supuesto 10 [footnoteRef:12] [12: IDEM]

No hay relaciones perfectamente lineales entre las variables explicativas. No existe multicolinealidad perfecta. Aunque todas las variables econmicas muestran algn grado de relacin entre s, ello no produce excesivas dificultades, excepto cuando se llega a una situacin de dependencia total, que es lo que se excluy al afirmar que las variables explicativas son linealmente dependientes.Interpretacin.Los supuestos son suposiciones o hiptesis con las que se debe relacionar la validez de cualquier conclusin alcanzada mediante le mtodo de regresin lineal, y para poder estimar y y conocer sus respectivas estimaciones y no solo basta con la especificacin del modelo sino se deben plantear los supuestos antes mencionados para demostrar que depende tanto de como de y estos supuestos son importantes para realizar una una interpretacin vlida. Propiedades de los estimadores de mnimos cuadrados: el teorema de Gauss-Markov.[footnoteRef:13] [13: Econometra bsica/ Damodar N. Gujarati, Bogot: McGraw-Hill, 1997.]

Como se menciono anteriormente, dados los supuestos del modelo de regresin lineal clsica, los estimativos de mnimos cuadrados poseen propiedades ideales y optimas, las cuales se encuentran resumidas en el teorema de Gauss- Harkov. Para comprender este teorema es necesario tener en cuenta la propiedad por la cual un estimador se considera el mejor estimador lineal insesgado. Un estimador, digamos el estimador , de MCO, es el mejor estimador lineal insesgado (MELI) de si:1. Es lineal, es decir, una funcin lineal de una variable aleatoria tal como la variable dependiente Y en el modelo de regresin.2. Es insesgado, es decir, su valor promedio o esperado , es igual al valor verdadero 3. Tiene varianza mnima entre la clase de todos los estimadores lineales insesgado; a un estimador insesgado con varianza mnima se le conoce como un estimador eficiente.En el contexto del anlisis de regresin se pude demostrar que los estimadores de MCO son MELI. Esta es la clave del famoso teorema de Gauss-Markov, el cual se puede enunciar de la siguiente forma:Teorema de Gauss-Markov: Dados los supuestos del modelo clsico de regresin lineal, los estimadores de mnimos cuadrados, en la clase de estimadores lineales insesgado, tienen la varianza mnima; es decir, son MELI.Ejemplo. [footnoteRef:14] [14: virtual.unal.edu.co/cursos/ciencias/2007315/lecciones_html/capitulo_5/leccion3/propiedadesparametros]

1.es un estimador insesgado de.Esto es,Demostracin

y comoentonces

2. La matriz de varianzas y covarianzas del vectores covDemostracinLa demostracin es la misma vista ennotacin matricial para regresin simple.Ejemplo

Para los datos del ejemplo se tiene que la estimacin de la matriz de varianzas-covarianzas del vectores

Los errores estndar de cada parmetro es dado en la tabla:ParmetroError estndar

Interpretacin: Esta simtricamente distribuido y el valor del estimador () es igual al valor verdadero de y por ello es un valor insesgado quiere decir que su valor esperado es igual al parmetro, su varianza tambin debe ser mnima la distribucin debe ser concentrado alrededor del valor de la media.

Test de supuestos Normalidad: Test de JarqueBera.[footnoteRef:15] [15: xa.yimg.com/.../Asimetr%C3%ADa+%C2%96+Curtosis+%C2%96+Jarque+Bera.pptx]

Es una prueba asinttica de normalidad para grandes muestras. Una prueba de normalidad es un proceso estadstico utilizado para determinar si una muestra o cualquier grupo de datos se ajustan a una distribucin normal.Analiza la relacin entre el coeficiente de asimetra y la curtosis de los residuos de la ecuacin estimada y los correspondientes de una distribucin normal, de forma tal que si estas relaciones son suficientemente diferentes se rechazar la hiptesis nula de normalidad.La prueba lleva el nombre de Carlos Jarque y Anil K. Bera. El estadstico de prueba JB se define como

Donde n es el nmero de observaciones (o grados de libertad en general), S es la muestra de la asimetra, y K es la muestra de curtosis:

Donde y , son las estimaciones del tercero y cuarto momentos centrales, respectivamente, es la muestra media , y es la estimacin de la varianza .La estadstica de JB tiene un asinttica chi-cuadrado de distribucin con dos grados de libertad y se puede utilizar para probar la hiptesis nula de que los datos son de una distribucin normal. La hiptesis nula es una hiptesis conjunta donde la asimetra es cero y el exceso de curtosis es 0, puesto que las muestras de una distribucin normal tiene un sesgo esperado de 0 y un exceso de curtosis esperado de 0 (que es lo mismo que una curtosis de 3).Test de Jarque-Bera: En qu consiste?El test de simetra se realiza para contrastar:Ho: A=k=0, lo que significa simetra exacta, existe relacin normal.H1: A0 y k=0, lo que significa que existe asimetra, no existe relacin normalSi falla el test de asimetra o el test de curtosis, entonces falla el supuesto de normalidad.Interpretacin del grupo:El test de JarqueBera al aplicarlo ayuda a verificar si se est trabajando con una muestra que est distribuida normalmente o se aproxima a la normal, cumpliendo as alguno de los dos puntos del Teorema del Lmite Central o si la poblacin no es normal. En el caso de ser normal se aceptara la hiptesis nula y si no es normal se aceptara la hiptesis alterna.Ejemplo:Para poder aplicar el test de normalidad de JarqueBera es necesario contar con los datos de asimetra y curtosis de un modelo de regresin, en este caso solo para fines de aplicacin del concepto haremos las siguientes suposiciones:En un estudio sobre Riesgo del test de Raz Unitaria Aumentado de Dickey-Fuller (DFAO) con valores outliers[footnoteRef:16], cuando la serie es estacionaria tenemos los siguientes datos: [16: www.monografias.com]

Ho: La serie tiene raz unitariaH1: La serie no tiene raz unitariaUsando un nivel de significacin del 5%Asimetra de -0.010Curtosis de 3.269Tamao de la Muestra= 30

Sustituyendo en la formula:JB=+JB=13.36Conclusin: en este caso se rechaza la hiptesis nula, entonces el estadstico no se ajusta a la normal. Test de significancia global del modelo: Prueba F.[footnoteRef:17] [17: Estadstica para Administracin. David M. Levine y otros autores. Mxico: Pearson Educacin, 2006.]

La prueba F global se utiliza para probar la significancia del modelo de regresin mltiple global. Esta prueba determina si existe una relacin significativa entre la variable dependiente y todo el conjunto de variables independientes.Prueba F para significancia general

Estadstico de prueba F global

Donde: K= Nmero de variables independientes en el modelo de regresinTabla resumida del anlisis de varianza (ANOVA)FuenteGrados de LibertadSuma de CuadradosMedia cuadrtica (Varianza)F

RegresinKSSRMSR= F=

Errorn-k-1SSEMSE=

Totaln-1SST

Interpretacin del grupo.La prueba F en la estimacin lineal mltiple es de mucha utilidad ya que esta nos demuestra si en un estudio existe relacin lineal entre la variable dependiente y las variables independientes y adems si esta relacin es significativa es por eso que es llamada prueba de significancia global, en este caso si se rechaza estaremos aceptando que existe una relacin entre las variables de lo contrario la prueba F mostrara que no existen los suficientes recursos como para aceptar que existe una relacin verdaderamente significativa.Ejemplo.Se tiene la siguiente ecuacin de regresin estimada para relacionar ventas con activo en inventario y gastos de publicidad[footnoteRef:18]: [18: Ejercicio N 22 del capitulo 15 libro de Anderson Sweeney Willians, Estadstica para Administracin y Economa, sptima edicin.]

Los datos que se usaron para determinar el modelo provinieron de una encuesta de 10 tiendas; para esos datos, SST= 16000 y SSR= 12000a) Calcule SSE, MSE y MSRSSE= SST-SSR = 1600012000 = 4000MSR= = =6000MSE= = = 571.4285714b) Mediante una prueba F con un nivel de significancia de 0.05, determine si hay una relacin entre las variables.

Grados de libertad para el numerador: 2Prueba F:Grados de libertad para el denominador: 7F= = = 10.5Nivel de significancia: 0.05Conclusin:El valor de F se sita en la zona de rechazo, por lo que se rechaza la hiptesis nula es decir con un nivel de significacin del 5% existe una relacin lineal significativa entre las ventas con activo de inventario y gastos de publicidad. Determinacin de intervalos de confianza para los coeficientes estimados. [footnoteRef:19] [19: Pag. 480, Estadstica para Administracin. David M. Levine y otros autores. Mxico: Pearson Educacin, 2006.]

En lugar de probar la significancia de una pendiente poblacional. Quiz se desee estimar el valor de la pendiente poblacional. La siguiente ecuacin define la estimacin del intervalo de confianza para una pendiente poblacional en un modelo de regresin mltiple.

Interpretacin del grupo:En la estimacin del intervalo de confianza podemos obtener un intervalo donde probablemente se encuentren los valores tanto de , ya que se debe ser precavido al interpretar un intervalo porque no siempre se pueden encontrar los verdaderos valores de esto depender tambin del nivel de confianza con el que se est trabajando, adems es preciso recordar que se trata de una estimacin.Ejemplo:Si se quiere elaborar una estimacin del intervalo de confianza del 95% para una pendiente poblacional (el efecto del precio sobre las ventas Y, manteniendo constante el efecto de los gastos promocionales ), donde:Nivel de confianza = 95%Grados de Libertad= 31Valor t= 2.0395Valor de = -53.2173Valor = 6.8522

-53.2173 (2.0395)(6.8522)-53.2173 13.9752-67.1925 -39.2421Conclusin:Tomando en cuenta el efecto de los gastos promocionales, el efecto estimado de un aumento de 1 centavo en el precio reduce la media de las ventas de 39.2 a 67.2 barras, aproximadamente. Hay un 95% de confianza de que este intervalo estima de manera correcta la relacin entre estas variables. Desde el punto de vista de la prueba de hiptesis, como este intervalo de confianza no incluye al 0 se concluye que el coeficiente de regresin tiene un efecto significativo.

Test de significancia de coeficientes: Prueba t [footnoteRef:20] [20: Anderson Sweeney Willians, Estadstica para Administracin y Economa, sptima edicin.]

La prueba t se aplica para determinar si cada una de las variables independientes tiene significancia. Se hace una prueba t por separado para cada variable independiente en el modelo; a cada una de esas pruebas t se le llama prueba de significancia individual.Prueba t de significacin individualPara cualquier parmetro

Estadstico de prueba Interpretacin del grupo:La prueba t nos muestra la significacin de cada uno de los parmetros en el modelo de regresin, nos muestra ms especficamente a diferencia de la prueba F si cada una de las variables independientes tienen relacin lineal significativa con la variable dependiente ya que los resultados de sus respectivos estadsticos de prueba se comparan con el valor de t y dependiendo de los resultados se rechaza o se acepta la hiptesis nula.

Base de datos y diccionario de base de datos.

Aos

Industria Manufacturera(X1)

Construccin(X2)

Transporte, Almacenajey Comunicaciones (X3)Total general PEA Y

1995402945146885864601274575

199639311753415974941090048

19973538671579041017971229133

1998438791146699982141369406

19994513861525991083321426633

20004321691344551136361362520

20014258341475881133731375591

20024245591518161030991360950

20034234491766241092281420605

20043976001767591192581389238

20053910341653321154751345687

20063856461819071102071357526

20074042581694871090111367519

20084175071595271051211366318

20093811561471391076911273981

DICCIONARIO.

Industria Manufacturera (X1). Se entiende como industria manufacturera a las actividades orientadas a la transformacin mecnica, fsica o qumica de bienes naturales o semiprocesados en artculos cualitativamente diferentes. . Realiza el ensamble de piezas para armar productos destinados al consumidor final; como aparatos electrnicos, vestido, calzado y autos, entre otros. En la industria manufacturera se ubica la industria alimenticia, textil, electrnica y automotriz.

Construccin (X2). El sector de la construccin comprende un amplio abanico de actividades entre las que destacan la ingeniera y la obra civil, la construccin de edificios y otras actividades auxiliares (tales como obras de aislamiento, fontanera, instalacin de moldes y escayolas, pinturas, etc.) y la demolicin de tales edificios (incluyendo el alquiler de la maquinaria necesaria para ello, la remocin de la tierra y los exmenes y evaluaciones de las fincas).

Transporte, Almacenaje y Comunicaciones (X3). El sector Transporte, Almacenamiento y Comunicaciones comprende: el transporte terrestre, areo, acutico, transporte por tubera (oleoducto); los servicios conexos y servicios auxiliares que faciliten el funcionamiento de los vehculos de transporte; carga y descarga de los bienes, terminales de puertos, aeropuertos; las agencias de contrata de carga y pasajes; playas de estacionamiento y peajes; los almacenes, agencias de viajes y las actividades de los guas tursticos. El alquiler de equipo de transporte con conductor est relacionado con el transporte y se incluye en esta actividad. Las comunicaciones comprenden telefona, fax, correspondencia escrita, mensajes, etc.

PEA. La poblacin econmicamente activa (PEA) est compuesta por todas las personas de 10 y ms, que se encuentran en condiciones de trabajar, y est formada por los ocupados y desocupados. Grupo poblacional constituido por las personas que estando en edad de trabajar, efectivamente forma parte de la fuerza de trabajo, al mantenerse en una ocupacin o buscarla activamente

Tablas y graficos.Matriz de Correlacion:VariablesIndustria ManufactureraConstruccinTransporte, almacenaje y comunicacin.PEA (por ao)

Industria Manufacturera1.000-0.3320.0420.185

Construccin-0.3321.0000.4180.342

Transporte, almacenaje y comunicacin.0.0420.4181.0000.700

PEA (por ao)0.1850.3420.7001.000

Estadisticas de Multicolienalidad:EstadsticaIndustria ManufactureraConstruccinTransporte, almacenaje y comunicacin.

Tolerancia0.8500.7030.789

VIF1.1761.4221.267