métodos lineales y estimación por mínimos cuadrados

7
Métodos lineales y estimación por mínimos cuadrados 1. Introducción 2. Métodos de los mínimos cuadrados 3. Error estándar en la estimación 4. Coeficiente de determinación 5. Coeficiente de correlación 6. Regresión lineal múltiple 7. Estimación de los coeficientes 8. Inferencias en la regresión lineal múltiple 9. Predicción 10. Correlación 11. Bibliografía 12. INTRODUCCIÓN 13. El presente trabajo forma parte de los objetivos y contenidos de aprendizaje de la cátedra ESTADÍSTICA, que pretende desarrollar las habilidades para la utilización de los métodos lineales y estimación de mínimos cuadrados. 14. Para lograr este fin, se realizo la consulta de una bibliografíabásica la cual permitió desarrollar los conceptos y ejemplos, como base para realizar una exposiciónadecuada en el salón de clases. 15. En este trabajo básicamente se habla de cómo desarrollar la aplicación de los métodos lineales y estimación por mínimos cuadrados, además de inferencia, predicción y correlación. 16. Se desarrollaron una serie de ejemplos mediante los cuales se trata de presentar manera mas sencilla usar estos métodos. 17. El Equipo # 4 18. 19. Métodos de mínimos cuadrados. 20. El procedimiento mas objetivo para ajustar una recta a un conjunto de datos presentados en 21. un diagrama de dispersión se conoce como "el método de los mínimos cuadrados". La recta 22. resultante presenta dos características importantes: 23. 1. Es nula la suma de las desviaciones verticales de los puntos a partir de la recta de ajuste 24. (Y ー - Y) = 0. 25. 2. Es mínima la suma de los cuadrados de dichas desviaciones. Ninguna otra recta daría 26. una suma menor de las desviaciones elevadas al cuadrado (Y ー - Y)² → 0 27. (mínima).

Upload: guimo-lastra

Post on 08-Jul-2016

6 views

Category:

Documents


2 download

DESCRIPTION

Estadística

TRANSCRIPT

Page 1: Métodos Lineales y Estimación Por Mínimos Cuadrados

Métodos lineales y estimación por mínimos cuadrados

1. Introducción 2. Métodos de los mínimos cuadrados 3. Error estándar en la estimación 4. Coeficiente de determinación 5. Coeficiente de correlación 6. Regresión lineal múltiple 7. Estimación de los coeficientes 8. Inferencias en la regresión lineal múltiple 9. Predicción 10.Correlación 11.Bibliografía

12.INTRODUCCIÓN13.El presente trabajo forma parte de los objetivos y contenidos de

aprendizaje de la cátedra ESTADÍSTICA, que pretende desarrollar las habilidades para la utilización de los métodos lineales y estimación de mínimos cuadrados.

14.Para lograr este fin, se realizo la consulta de una bibliografíabásica la cual permitió desarrollar los conceptos y ejemplos, como base para realizar una exposiciónadecuada en el salón de clases.

15.En este trabajo básicamente se habla de cómo desarrollar la aplicación de los métodos lineales y estimación por mínimos cuadrados, además de inferencia, predicción y correlación.

16.Se desarrollaron una serie de ejemplos mediante los cuales se trata de presentar manera mas sencilla usar estos métodos.

17.El Equipo # 4 18.  19.Métodos de mínimos cuadrados.20.El procedimiento mas objetivo para ajustar una recta a un conjunto de

datos presentados en21.un diagrama de dispersión se conoce como "el método de los mínimos

cuadrados". La recta22.resultante presenta dos características importantes:23.1. Es nula la suma de las desviaciones verticales de los puntos a partir

de la recta de ajuste24.∑ (Y ー - Y) = 0.

25.2. Es mínima la suma de los cuadrados de dichas desviaciones. Ninguna otra recta daría

26.una suma menor de las desviaciones elevadas al cuadrado ∑ (Y ー - Y)² → 0

27. (mínima).28.El procedimiento consiste entonces en minimizar los residuos al

cuadrado Ci²

Page 2: Métodos Lineales y Estimación Por Mínimos Cuadrados

Re emplazando nos queda

29.  30.La obtención de los valores de a y b que minimizan esta función es un

problema que se puede resolver recurriendo a la derivación parcial de la función en términos de a y b: llamemos G a la función que se va a minimizar:

31.  32.Tomemos las derivadas parciales de G respecto de a y b que son las

incógnitas y las igualamos a cero; de esta forma se obtienen dos ecuaciones llamadas ecuaciones normales del modelo que pueden ser resueltas por cualquier método ya sea igualación o matrices para obtener los valores de a y b.

33.  

34.35.  36.Derivamos parcialmente la ecuación respecto de a

37.

38.

39.

40.

41.   Primera ecuación normal42.  43.Derivamos parcialmente la ecuación respecto de b

44.

45.

46.

47.

Page 3: Métodos Lineales y Estimación Por Mínimos Cuadrados

48.

49.   Segunda ecuación normal50.  51.Los valores de a y b se obtienen resolviendo el sistema de ecuaciones

resultante. Veamos el siguiente ejemplo:52.En un estudio económico se desea saber la relación entre el nivel de

instrucción de las personas y el ingreso. 53.EJEMPLO 154.Se toma una muestraaleatoria de 8 ciudades de una región geográfica

de 13 departamentos y se determina por los datos del censo el porcentaje de graduados en educaciónsuperior y la mediana del ingreso de cada ciudad, los resultados son los siguientes:  

55.CIUDAD : 1 2 3 4 5 6 7 856.% de (X)57.Graduados : 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.258. Ingreso (Y)59.Mediana : 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 (0000)60.  61.Tenemos las ecuaciones normales62.  63.∑y = na + b∑x64.∑xy = a∑x + b∑x²65.  66.Debemos encontrar los términos de las ecuaciones67.∑y, ∑x, ∑xy, ∑ x² Por tanto procedemos de la siguiente forma:68.  

Y X XY X²

       

4.2 7.2 30.24 51.84

4.9 6.7 32.83 44.89

7.0 17.0 119.00 289.00

6.2 12.5 77.50 156.25

3.8 6.3 23.94 39.69

7.6 23.9 181.64 571.21

4.4 6.0 26.40 36.00

5.4 10.2 55.08 104.04

43.5 89.8 546.63 1292.92

Page 4: Métodos Lineales y Estimación Por Mínimos Cuadrados

69.  70.Sustituyendo en las ecuaciones los resultados obtenidos tenemos: 43.50

= 8a + 89.8b71.546.63 = 89.8a + 1292.92b72.multiplicamos la primera ecuación por (-89.8) y la segunda por (8) así:73.43.50 = 8a + 89.8b (-89.8) 546.63 = 89.8a + 1292.92b (8)74. -3906.30 = -718.4a - 8064.04b 4373.04 = 718.4a + 10343.36b75.466.74 = -0- 2279.32b76.  

77.78.Este valor de b lo reemplazamos en cualquiera de las ecuaciones para

obtener a así:79.  80.Reemplazando b = 0.20477 en la primera ecuación normal81.  82.43.5 = 8a + 89.8 (0.20477) 43.5 = 8a + 18.3880 43.5 - 18.3880 = 8a

25.1120 = 8a

83.84.Tenemos entonces que los coeficientes de regresión son : a = 3.139 y b

= 0.20477. Por tanto la ecuación de regresión nos queda:

85.86.Significa entonces que por cada incremento en una unidad en X el valor

de se aumenta en 0.20477

87.Esta ecuación permite estimar el valor de para cualquier valor de X, por ejemplo: Una ciudad que tiene un porcentaje de graduados a nivel superior del 28% la mediana de ingreso para la ciudad será:

88.  

89.

90.91.Los valores a y b también se pueden obtener de la siguiente forma:

partiendo de las ecuaciones normales tenemos:

92.

93.94.Si dividimos todos los términos de la ecuación (1) entre n nos queda:95.  

Page 5: Métodos Lineales y Estimación Por Mínimos Cuadrados

96.

97.Tenemos entonces que el primer termino es el segundo termino es la

incógnita a y el tercer termino es la incógnita b multiplicada por por tanto nos queda:

98.  

99.   entonces

100.101.  102.  103. Reemplazando a en la ecuación (2) tenemos104.  

105.

106.

107.

108.

109.

110.

111.

112.113.  

114.115. a = 5.4375 – 0.20477 (11.2250) = 5.4375 – 2.2985 = 3.139

116. Se debe tener presente la diferencia entre el valor de obtenido

con la ecuación de regresión y el valor de Y observado. Mientras es

Page 6: Métodos Lineales y Estimación Por Mínimos Cuadrados

una estimación y su bondad en la estimación depende de lo estrecha que sea la relación entre las dos variablesque se estudian; Y ー es el valor efectivo, verdadero obtenido mediante la observacióndel investigador. En el ejemplo Y ー es el valor mediano del ingreso que obtuvo el investigador

117. utilizando todos los ingresos observados en cada ciudad y es el valor estimado con base en el modelo lineal utilizado para obtener la ecuación de regresión

118. Los valores estimados y observados pueden no ser iguales por ejemplo la primera ciudad tiene un ingreso mediano observado de Y ー = 4.2 al reemplazar en la ecuación el porcentaje

119. de graduados obtenemos un estimado de

120.121. Gráficamente lo anterior se puede mostrar así:122.  

123.124. Claramente se observa en la gráfica que hay una diferencia entre

el valor efectivo de Y ー y el valor estimado; esta diferencia se conoce como error en la estimación, este error se puede medir. A continuación se verá el procedimiento.

125. Error estándar en la estimación126. El error estándar de la estimación designado por sYX mide la

disparidad "promedio" entre

127. los valores observados y los valores estimados de . Se utiliza la siguiente formula.

128.

Page 7: Métodos Lineales y Estimación Por Mínimos Cuadrados

129. Debemos entonces calcular los valores de para cada ciudad sustituyendo en la ecuación los valores de los porcentajes de graduados de cada ciudad estudiada.

130.131.