Métodos lineales y estimación por mínimos cuadrados
1. Introducción 2. Métodos de los mínimos cuadrados 3. Error estándar en la estimación 4. Coeficiente de determinación 5. Coeficiente de correlación 6. Regresión lineal múltiple 7. Estimación de los coeficientes 8. Inferencias en la regresión lineal múltiple 9. Predicción 10.Correlación 11.Bibliografía
12.INTRODUCCIÓN13.El presente trabajo forma parte de los objetivos y contenidos de
aprendizaje de la cátedra ESTADÍSTICA, que pretende desarrollar las habilidades para la utilización de los métodos lineales y estimación de mínimos cuadrados.
14.Para lograr este fin, se realizo la consulta de una bibliografíabásica la cual permitió desarrollar los conceptos y ejemplos, como base para realizar una exposiciónadecuada en el salón de clases.
15.En este trabajo básicamente se habla de cómo desarrollar la aplicación de los métodos lineales y estimación por mínimos cuadrados, además de inferencia, predicción y correlación.
16.Se desarrollaron una serie de ejemplos mediante los cuales se trata de presentar manera mas sencilla usar estos métodos.
17.El Equipo # 4 18. 19.Métodos de mínimos cuadrados.20.El procedimiento mas objetivo para ajustar una recta a un conjunto de
datos presentados en21.un diagrama de dispersión se conoce como "el método de los mínimos
cuadrados". La recta22.resultante presenta dos características importantes:23.1. Es nula la suma de las desviaciones verticales de los puntos a partir
de la recta de ajuste24.∑ (Y ー - Y) = 0.
25.2. Es mínima la suma de los cuadrados de dichas desviaciones. Ninguna otra recta daría
26.una suma menor de las desviaciones elevadas al cuadrado ∑ (Y ー - Y)² → 0
27. (mínima).28.El procedimiento consiste entonces en minimizar los residuos al
cuadrado Ci²
Re emplazando nos queda
29. 30.La obtención de los valores de a y b que minimizan esta función es un
problema que se puede resolver recurriendo a la derivación parcial de la función en términos de a y b: llamemos G a la función que se va a minimizar:
31. 32.Tomemos las derivadas parciales de G respecto de a y b que son las
incógnitas y las igualamos a cero; de esta forma se obtienen dos ecuaciones llamadas ecuaciones normales del modelo que pueden ser resueltas por cualquier método ya sea igualación o matrices para obtener los valores de a y b.
33.
34.35. 36.Derivamos parcialmente la ecuación respecto de a
37.
38.
39.
40.
41. Primera ecuación normal42. 43.Derivamos parcialmente la ecuación respecto de b
44.
45.
46.
47.
48.
49. Segunda ecuación normal50. 51.Los valores de a y b se obtienen resolviendo el sistema de ecuaciones
resultante. Veamos el siguiente ejemplo:52.En un estudio económico se desea saber la relación entre el nivel de
instrucción de las personas y el ingreso. 53.EJEMPLO 154.Se toma una muestraaleatoria de 8 ciudades de una región geográfica
de 13 departamentos y se determina por los datos del censo el porcentaje de graduados en educaciónsuperior y la mediana del ingreso de cada ciudad, los resultados son los siguientes:
55.CIUDAD : 1 2 3 4 5 6 7 856.% de (X)57.Graduados : 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.258. Ingreso (Y)59.Mediana : 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 (0000)60. 61.Tenemos las ecuaciones normales62. 63.∑y = na + b∑x64.∑xy = a∑x + b∑x²65. 66.Debemos encontrar los términos de las ecuaciones67.∑y, ∑x, ∑xy, ∑ x² Por tanto procedemos de la siguiente forma:68.
Y X XY X²
4.2 7.2 30.24 51.84
4.9 6.7 32.83 44.89
7.0 17.0 119.00 289.00
6.2 12.5 77.50 156.25
3.8 6.3 23.94 39.69
7.6 23.9 181.64 571.21
4.4 6.0 26.40 36.00
5.4 10.2 55.08 104.04
43.5 89.8 546.63 1292.92
69. 70.Sustituyendo en las ecuaciones los resultados obtenidos tenemos: 43.50
= 8a + 89.8b71.546.63 = 89.8a + 1292.92b72.multiplicamos la primera ecuación por (-89.8) y la segunda por (8) así:73.43.50 = 8a + 89.8b (-89.8) 546.63 = 89.8a + 1292.92b (8)74. -3906.30 = -718.4a - 8064.04b 4373.04 = 718.4a + 10343.36b75.466.74 = -0- 2279.32b76.
77.78.Este valor de b lo reemplazamos en cualquiera de las ecuaciones para
obtener a así:79. 80.Reemplazando b = 0.20477 en la primera ecuación normal81. 82.43.5 = 8a + 89.8 (0.20477) 43.5 = 8a + 18.3880 43.5 - 18.3880 = 8a
25.1120 = 8a
83.84.Tenemos entonces que los coeficientes de regresión son : a = 3.139 y b
= 0.20477. Por tanto la ecuación de regresión nos queda:
85.86.Significa entonces que por cada incremento en una unidad en X el valor
de se aumenta en 0.20477
87.Esta ecuación permite estimar el valor de para cualquier valor de X, por ejemplo: Una ciudad que tiene un porcentaje de graduados a nivel superior del 28% la mediana de ingreso para la ciudad será:
88.
89.
90.91.Los valores a y b también se pueden obtener de la siguiente forma:
partiendo de las ecuaciones normales tenemos:
92.
93.94.Si dividimos todos los términos de la ecuación (1) entre n nos queda:95.
96.
97.Tenemos entonces que el primer termino es el segundo termino es la
incógnita a y el tercer termino es la incógnita b multiplicada por por tanto nos queda:
98.
99. entonces
100.101. 102. 103. Reemplazando a en la ecuación (2) tenemos104.
105.
106.
107.
108.
109.
110.
111.
112.113.
114.115. a = 5.4375 – 0.20477 (11.2250) = 5.4375 – 2.2985 = 3.139
116. Se debe tener presente la diferencia entre el valor de obtenido
con la ecuación de regresión y el valor de Y observado. Mientras es
una estimación y su bondad en la estimación depende de lo estrecha que sea la relación entre las dos variablesque se estudian; Y ー es el valor efectivo, verdadero obtenido mediante la observacióndel investigador. En el ejemplo Y ー es el valor mediano del ingreso que obtuvo el investigador
117. utilizando todos los ingresos observados en cada ciudad y es el valor estimado con base en el modelo lineal utilizado para obtener la ecuación de regresión
118. Los valores estimados y observados pueden no ser iguales por ejemplo la primera ciudad tiene un ingreso mediano observado de Y ー = 4.2 al reemplazar en la ecuación el porcentaje
119. de graduados obtenemos un estimado de
120.121. Gráficamente lo anterior se puede mostrar así:122.
123.124. Claramente se observa en la gráfica que hay una diferencia entre
el valor efectivo de Y ー y el valor estimado; esta diferencia se conoce como error en la estimación, este error se puede medir. A continuación se verá el procedimiento.
125. Error estándar en la estimación126. El error estándar de la estimación designado por sYX mide la
disparidad "promedio" entre
127. los valores observados y los valores estimados de . Se utiliza la siguiente formula.
128.
129. Debemos entonces calcular los valores de para cada ciudad sustituyendo en la ecuación los valores de los porcentajes de graduados de cada ciudad estudiada.
130.131.