![Page 1: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/1.jpg)
Índice
Regresión lineal simple
José Gabriel Palomo Sánchez
E.U.A.T.
U.P.M.
Julio de 2011
1
![Page 2: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/2.jpg)
Índice
Índice I
1 El problema general. Dependencia e independencia de variables
1 Dependencia determinista2 Dependencia estadística3 Modelo para la dependencia estadística
2 Los modelos de regresión
1 Los modelos de regresión. Generalidades2 Cálculo de un modelo de regresión3 Conjetura del modelo4 El coe�ciente de covarianza5 El coe�ciente de correlación lineal6 Estructura de un modelo de regresión simple. Partes
determinista y aleatoria7 Nomenclatura en un modelo de regresión simple
2
![Page 3: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/3.jpg)
Índice
Índice II
3 Cálculo de los parámetros del modelo de regresión simple
1 El criterio de mínimos cuadrados2 Cálculo de los parámetros del modelo de regresión lineal simple
por mínimos cuadrados3 Interpretación de los parámetros de un modelo de regresión
lineal simple
4 Inferencia en un modelo de regresión lineal simple
1 Problemas abiertos2 Las hipótesis del modelo3 Consecuencias de las hipótesis del modelo4 Estimadores de los parámetros de la recta de regresión.
Propiedades5 Estimador de la varianza del error experimental. La varianza
residual. Propiedades6 Cálculo de intervalos de con�anza para el coe�ciente de
regresión7 El contraste de regresión
3
![Page 4: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/4.jpg)
Índice
Índice III
5 Diagnosis y validación del modelo
1 Diagnosis y validación del modelo2 Diagnosis y validación del modelo. Grá�cos de residuos3 Transformaciones
6 Predicción en regresión lineal simple
1 Precisión de la estimación de E (Y |X = xi )2 Precisión de la estimación de una observación3 Precisión en regresión. Resumen y observaciones
7 Los valores atípicos en regresión
1 Los valores atípicos en regresión. Puntos in�uyentes y puntos
palanca2 Estrategia ante los valores atípicos en regresión
4
![Page 5: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/5.jpg)
Índice
El problema general. Dependencia eindependencia de variables.
definición
Dos variables son dependientes cuando el conocimiento del valor de
una de ellas en un individuo aporta información sobre el valor de la
otra en ese individuo.
definición
Cuando dos variables no son dependientes se dice que son
independientes.
5
![Page 6: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/6.jpg)
Índice
Dependencia determinista I. Ejemplo
Si a un cuerpo de masa m se le aplica una fuerza F, esta
fuerza comunica una aceleración al cuerpo, cuyo módulo viene
expresado por la ecuación:
a =F
m.
Esta ecuación permite calcular con exactitud, el módulo de la
aceleración que una fuerza determinada comunicará a un
cuerpo de masa conocida.
6
![Page 7: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/7.jpg)
Índice
Dependencia determinista II. Ejemplo
El siguiente grá�co muestra los distintos valores de las
aceleraciones provocadas sobre un cuerpo de masa 10 Kg , pordistintas fuerzas ejercidas sobre él.
La ecuación a = F10
es el modelo que
explica la relación
de dependencia
entre estas
variables.
7
![Page 8: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/8.jpg)
Índice
Dependencia determinista III. Ejemplo
El espacio recorrido por un cuerpo en caída libre, en el vacío,
viene dado por la expresión:
e =1
2gt2,
donde g representa el valor de la aceleración de la gravedad, y
t es el valor del tiempo transcurrido.
Despejando:
t =
√2e
g
8
![Page 9: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/9.jpg)
Índice
Dependencia determinista IV. Ejemplo
El siguiente grá�co muestra los distintos valores del tiempo
transcurrido hasta que un cuerpo en caída libre alcanza el suelo, en
función de la distancia entre éste y el punto en el que inicia la caída.
La ecuación
t =√
2eg
es el
modelo que explica
la relación de
dependencia entre
estas variables.
9
![Page 10: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/10.jpg)
Índice
Dependencia determinista V
Cuando el conocimiento del valor de una variable permite el
cálculo exacto de otra, se dice que entre ellas hay una relación
de dependencia determinista o funcional.
La ecuación que posibilita este cálculo determina el modelo
que explica la relación entre ambas variables.
10
![Page 11: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/11.jpg)
Índice
Dependencia estadística I
En ocasiones, cuando dos variables son dependientes, NO se puede
calcular con exactitud el valor de una variable cuando el de la otra
es conocido.
En estos casos se dice que la relación de dependencia entre las
variables es estadística o aleatoria.
11
![Page 12: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/12.jpg)
Índice
Dependencia estadística II. Ejemplo
El siguiente grá�co representa los diámetros en la base del tronco, y
las alturas, de un conjunto de cerezos.
¾Qué altura le
corresponde a un
cerezo que tenga un
diámetro en la base
de 14 unidades?
12
![Page 13: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/13.jpg)
Índice
Dependencia estadística III. Ejemplo
El siguiente grá�co representa la esperanza de vida en un conjunto
de paises en función de su producto interior bruto, (en el grá�co las
unidades del PIB son miles de millones de dólares).
¾Qué esperanza de
vida le corresponde
a un país que tenga
un PIB de 15
unidades?
¾Y a otro con un
PIB de 5 unidades?
13
![Page 14: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/14.jpg)
Índice
Dependencia estadística IV
Problema
En los casos de dependencia estadística no existe un modelo
matemático (ecuación) que permita calcular con exactitud el valor
de una variable, cuando la otra es conocida.
Solución
En ocasiones se puede establecer un modelo que permita calcular,
de manera aproximada, el valor de una variable aleatoria, cuando el
de la otra, también aleatoria, es conocida.
14
![Page 15: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/15.jpg)
Índice
Dependencia estadística V. Ejemplo
La recta del grá�co permite el cálculo aproximado de la altura de
un cerezo, conocido su diámetro en la base.
Su ecuación es:
y = 61′55 + 1′066x
La altura aproximada de
un cerezo, cuyo diámetro
en la base sea 14, será:
y = 61′55 + 1′066× 14 =76′47
15
![Page 16: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/16.jpg)
Índice
Dependencia estadística VI. Ejemplo
La curva del grá�co permite el cálculo aproximado de la esperanza
de vida de un país, conocido el número de miles de millones de su
PIB.
Su ecuación es:
y = 2′03 + 7′76× ln(x)
La esperanza de vida
aproximada en un país de
5000 millones de dólares
de PIB es: y = 2′03 +7′76× ln(5000) = 68′12
16
![Page 17: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/17.jpg)
Índice
Dependencia estadística VII. Resumen
1 Cuando dos variables son dependientes, el conocimiento del
valor de una de ellas aporta información sobre el valor de la
otra.
2 En el caso de dependencia funcional, conocido el valor de una
de las variables, la ecuación del modelo, y = f (x), permite el
cálculo exacto del valor de la otra.
3 En el caso de dependencia estadística, el conocimiento del
valor de una variable aleatoria permite, sólo, el cálculo
aproximado del valor de la otra.
17
![Page 18: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/18.jpg)
Índice
Los modelos de regresión. Generalidades I
Definición
Un modelo de regresión es una expresión matemática que permite
calcular, de forma aproximada, el valor de una variable aleatoria
en un individuo, cuando se conoce el valor de una o varias variables
en ese mismo individuo (regresores), que también son aleatorias.
Cuando se contempla únicamente un regresor se trata de un
modelo de regresión simple. En el caso en que se trate más de un
regresor se tratará de un modelo de regresión múltiple. En este
capítulo, solo se tratarán modelos de regresión simple.
18
![Page 19: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/19.jpg)
Índice
Los modelos de regresión. Generalidades II
A lo largo de este capítulo se tratará de dar respuesta a las
siguientes preguntas:
1 ¾Cuándo es útil un modelo de regresión?
2 ¾Cómo se calcula un modelo de regresión?
3 ¾Cómo se emplea un modelo de regresión?
4 ¾Qué �abilidad ofrece un modelo de regresión?
19
![Page 20: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/20.jpg)
Índice
Los modelos de regresión. Generalidades III
Principio básico
Un modelo de regresión es útil cuando describe correctamente la
relación de dependencia entre variables.
20
![Page 21: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/21.jpg)
Índice
Los modelos de regresión. Generalidades IV.Ejemplo
La recta del siguiente grá�co describe, de forma aproximada, y
según la información disponible, la relación entre la altura de los
cerezos y su diámetro en la base.
21
![Page 22: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/22.jpg)
Índice
Los modelos de regresión. Generalidades V.Ejemplo
La recta del siguiente grá�co no describe, de forma aproximada, y
según la información disponible, la relación entre la esperanza de
vida en un país y su producto interior bruto.
22
![Page 23: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/23.jpg)
Índice
Cálculo de un modelo de regresión
Para el cálculo de un modelo de regresión es necesario establecer
una metodología que tenga en cuenta:
La clase de modelo que explique la relación de dependencia
entre las variables, (lineal, polinómico, logarítmico,...).
La estructura matemática de dicho modelo.
Un criterio de cálculo de los parámetros del modelo.
23
![Page 24: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/24.jpg)
Índice
Conjetura del modelo I
¾Qué modelo es el adecuado?
La conjetura de la conveniencia de un modelo de regresión, para
explicar la relación de dependencia entre variables, se realiza, en
primer lugar, a través del análisis grá�co de la información
disponible.
24
![Page 25: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/25.jpg)
Índice
Conjetura del modelo II. Ejemplo
Para analizar la relación de dependencia entre dos variables
aleatorias X e Y se toman datos (pareados), según la tabla:
X Y
x1 y1x2 y2...
...
xn yn
25
![Page 26: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/26.jpg)
Índice
Conjetura del modelo III. Ejemplo
Grá�camente,
¾Qué tipo de modelo
explicaría esta relación de
dependencia entre X e Y ?
Parece razonable, en este
caso, conjeturar una recta
como el modelo adecuado.
26
![Page 27: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/27.jpg)
Índice
Conjetura del modelo IV. Ejemplo
El siguiente grá�co resume la información de un conjunto de datos,
obtenidos para analizar la relación de dependencia entre las
variables aleatorias X e Y .
¾Qué tipo de modelo
explicaría esta relación de
dependencia entre X e Y ?
No parece razonable, en
este caso, conjeturar una
recta como el modelo
adecuado.
27
![Page 28: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/28.jpg)
Índice
Conjetura del modelo V. El caso lineal
En el caso en que la nube de puntos sugiera una relación lineal, con
forma de recta, entre las variables, existen dos coe�cientes que
complementan la información grá�ca:
Covarianza.
Coe�ciente de correlación lineal.
28
![Page 29: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/29.jpg)
Índice
El coeficiente de covarianza I
El coe�ciente de covarianza se construye para medir la
intensidad de la dependencia lineal entre dos variables.
Supóngase que para medir esta relación de dependencia se
dispone de una muestra de datos pareados como los expuestos
en la siguiente tabla:
X Y
x1 y1x2 y2...
...
xn yn
29
![Page 30: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/30.jpg)
Índice
El coeficiente de covarianza II
definición
Se de�ne el coe�ciente de covarianza entre X e Y como:
COV (X ,Y ) =
∑(xi − x)(yi − y)
n
Donde x e y representan las medias muestrales de X e Y ,respectivamente.
30
![Page 31: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/31.jpg)
Índice
Interpretación de la covarianza I
Para interpretar el
signi�cado del coe�ciente
de covarianza, considérese
la representación grá�ca
de los datos de la tabla. .
b b
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b b
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
X
Y
131
![Page 32: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/32.jpg)
Índice
Interpretación de la covarianza II
Considéres una traslación
de los ejes al punto (x , y):.
b b
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b b
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
(x, y)
b
132
![Page 33: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/33.jpg)
Índice
Interpretación de la covarianza III
Para todo punto del primer
cuadrante, se observa que:
(xi − x)(yi − y) > 0
.
(x, y)
b
(yi − y) > 0
b
(xi − x) > 0
133
![Page 34: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/34.jpg)
Índice
Interpretación de la covarianza IV
Del mismo modo, para los
puntos del segundo
cuadrante:
(xi − x)(yi − y) < 0
.
(x, y)
b
(xi − x) < 0b
(yi − y) > 0
134
![Page 35: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/35.jpg)
Índice
Interpretación de la covarianza V
De forma similar, en el
tercer cuadrante:
(xi − x)(yi − y) > 0
.
(x, y)
b
(xi − x) < 0
b
(yi − y) < 0
135
![Page 36: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/36.jpg)
Índice
Interpretación de la covarianza VI
Y en el cuarto cuadrante:
(xi − x)(yi − y) < 0
.
(x, y)
b
(xi − x) > 0
b
(yi − y) < 0
136
![Page 37: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/37.jpg)
Índice
Interpretación de la covarianza VII
Por lo tanto, en distribuciones de puntos como las de las �guras
adjuntas cabe esperar un coe�ciente de covarianza próximo a cero.
b b
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b b
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
(−)
(−) (+)
(+)
b
1
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b
b
b
b
b
b
b
bb
b
b
bb
b
b
b
b
bb
b
b
b
(−)
(−) (+)
(+)
b
137
![Page 38: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/38.jpg)
Índice
Interpretación de la covarianza VIII
Sin embargo, en distribuciones de puntos como las de las �guras
adjuntas cabe esperar un coe�ciente de covarianza alto en valor
absoluto.
b b
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
(−)
(−) (+)
(+)
b
1
b
bb
b
b
bb
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
(−)
(−) (+)
(+)
b
1
38
![Page 39: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/39.jpg)
Índice
Propiedades de la covarianza
La covarianza tiene unidades, las de la variable X multiplicadas
por las de la variable Y .
La covarianza no tiene escala y se puede hacer, en valor
absoluto, arbitrariamente grande o pequeña con el mismo
conjunto de datos.
39
![Page 40: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/40.jpg)
Índice
El coeficiente de correlación lineal
Para corregir los inconvenientes de la covarianza se de�ne el
coe�ciente de correlación, que también mide la intensidad de
la dependencia lineal entre dos variables.
Definición
El coe�ciente de correlación entre dos variables es:
ρ =COV (X ,Y )
sX sY
Donde sX y sY representan las desviaciones típicas de X e Y ,
respectivamente.
40
![Page 41: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/41.jpg)
Índice
Propiedades del coeficiente de correlación I
El coe�ciente de correlación tiene las siguientes propiedades:
Es un número adimensional.
En todo caso:
−1 ≤ ρ ≤ 1
|ρ| = 1 implica dependencia lineal exacta entre X e Y .
ρ = 0 implica falta de dependencia lineal entre X e Y .
41
![Page 42: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/42.jpg)
Índice
Propiedades del coeficiente de correlación II
En situaciones como las que muestran los siguinetes grá�cos, cabe
esperar un coe�ciente de correlación próximo a cero.
b b
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b b
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
(−)
(−) (+)
(+)
b
1
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b
b
b
b
b
b
b
bb
b
b
bb
b
b
b
b
bb
b
b
b
(−)
(−) (+)
(+)
b
142
![Page 43: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/43.jpg)
Índice
Propiedades del coeficiente de correlación III
Sin embargo, en los casos que resumen los siguientes grá�cos cabe
esperar un coe�ciente de correlación próximo a uno en valor
absoluto.
b b
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
(−)
(−) (+)
(+)
b
1
b
bb
b
b
bb
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
(−)
(−) (+)
(+)
b
1
43
![Page 44: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/44.jpg)
Índice
Estructura de un modelo de regresión simple.Partes determinista y aleatoria I
Para analizar la estructura
de un modelo de regresión,
supóngase que se ha
ajustado uno de estos
modelos a un conjunto de
datos.
Sin pérdida de generalidad,
se supondrá que se analiza
el caso de dependencia
entre dos variables, y que
se puede considerar que el
modelo adecuado es una
recta:
.
y = f(x)
ρ ∼= 1b b
b
b
b
b
b
b
b
b
X
Y
1
44
![Page 45: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/45.jpg)
Índice
Estructura de un modelo de regresión simple.Partes determinista y aleatoria II
Sea (xi , yi ) un punto
correspondiente a un dato
cualquiera del conjunto: .y = f(x)
b b
b
b
b
b
b
b
b
b
(xi, yi)
b
xiX
Y
1
45
![Page 46: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/46.jpg)
Índice
Estructura de un modelo de regresión simple.Partes determinista y aleatoria III
yi se puede descomponer
como se describe en el
grá�co: .y = f(x)
b b
b
b
b
b
b
b
b
b
(xi, yi)
b
b
xi X
Y
1
46
![Page 47: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/47.jpg)
Índice
Estructura de un modelo de regresión simple.Partes determinista y aleatoria IV
La parte inferior,
yi = f (xi ), representa el
valor que el modelo prevé
para la variable Y , en un
individuo cuyo valor en X
es xi . .
y = f(x)
yi = f(xi)
b b
b
b
b
b
b
b
b
b
(xi, yi)
b
xi X
Y
1
47
![Page 48: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/48.jpg)
Índice
Estructura de un modelo de regresión simple.Partes determinista y aleatoria V
La parte superior, ei , es ladiferencia entre el valor
observado de Y en el
individuo yi , y el previsto
por el modelo, yi , para ese
individuo. .
y = f(x)ei
b b
b
b
b
b
b
b
b
b
(xi, yi)
b
xiX
Y
1
48
![Page 49: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/49.jpg)
Índice
Estructura de un modelo de regresiónsimple.Partes determinista y aleatoria VI
En consecuencia,
yi = yi + ei . .y = f(x)
ei
b b
b
b
b
b
b
b
b
b
(xi, yi)
b
xi
yi = f(xi)
X
Y
1
49
![Page 50: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/50.jpg)
Índice
Estructura de un modelo de regresión simple.La parte determinista.
Calculado el modelo, el
valor de yi queda
determinado para cada xi ,yi = f (xi )
yi = f (xi ) es la parte
determinista, o
funcional del modelo.
.
y = f(x)
b b
b
b
b
b
b
b
b
b
bb b
xix1 x2 X
Y
1
50
![Page 51: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/51.jpg)
Índice
Estructura de un modelo de regresión simple.La parte aleatoria.
Calculado el modelo, el
valor de ei no queda
determinado por xi
Puede haber dos
observaciones con el
mismo xi y distinto ei
ei = yi − yi es la parte
aleatoria del modelo.
(Error aleatorio.) .
y = f(x)
b b
b
b
b
b
b
b
b
b
*
X
Y
1
51
![Page 52: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/52.jpg)
Índice
Estructura de un modelo de regresión simple.Resumen
En consecuencia, la estructura de un modelo de regresión simple es:
yi︸︷︷︸Valor observado
= f (xi )︸︷︷︸Parte determinista, yi
+ ei︸︷︷︸Error aleatorio
De manera resumida:
y=f(x)+E
52
![Page 53: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/53.jpg)
Índice
Nomenclatura de un modelo de regresiónsimple y = f (x) + E
y es la variable explicada, dependiente o respuesta.
x es la variable explicativa, el regresor o la variable
independiente.
E representa el error aleatorio. Contiene el efecto sobre y de
todas las variables distintas de x .
53
![Page 54: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/54.jpg)
Índice
Cálculo de los parámetros del modelo de R.S.Mínimos cuadrados I
Supóngase que un
conjunto de datos sugiere
que entre dos variables, X
e Y , existe una relación de
dependencia.
Grá�camente, .b
b
b
b
b
b
b
b
b
X
Y
154
![Page 55: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/55.jpg)
Índice
Cálculo de los parámetros del modelo de R.S.Mínimos cuadrados II
A la vista del grá�co se
conjetura como un modelo
posible una parábola de la
forma:
y = c(x − h)2 + k .b
b
b
b
b
b
b
b
b
y = f(x)
X
Y
155
![Page 56: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/56.jpg)
Índice
Cálculo de los parámetros del modelo de R.S.Mínimos cuadrados III
¾Qué valores de k , c y h
se deben tomar?
Distintos valores de los
parámetros modi�can la
ecuación del modelo
ajustado. .b
b
b
b
b
b
b
b
b
y = f(x)
156
![Page 57: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/57.jpg)
Índice
Cálculo de los parámetros del modelo de R.S.Mínimos cuadrados IV
Recuérdese que, para
cualquier modelo ajustado,
cada valor observado lleva
asociado su error aleatorio:
ei = yi − yi
Interesaría que,
globalmente, el error
cometido por el modelo
fuera mínimo. .
b
b
b
b
b
b
b
b
b
y = f(x)
e2
e1
ei
en
X
Y
157
![Page 58: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/58.jpg)
Índice
Cálculo de los parámetros del modelo de R.S.Mínimos cuadrados V
�� ��¾Cómo se minimiza globalmente el error asociado al modelo?
58
![Page 59: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/59.jpg)
Índice
Cálculo de los parámetros del modelo de R.S.Mínimos cuadrados VI
Criterio de mínimos cuadrados:
Sea e = (e1, e2, . . . , en) el vector de errores asociado al
modelo.
El módulo de este vector viene dado por la expresión:
|e| =√e21 + e22 + · · ·+ e2n
El criterio de mínimos cuadrados selecciona los valores de los
parámetros del modelo que minimizan el módulo del vector
error, (equivalentemente el∑
(e2i ).)
59
![Page 60: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/60.jpg)
Índice
Cálculo de los parámetros del modelo de R.S.Mínimos cuadrados VII. Ejemplo
Se se ajustan dos modelos de regresión a una nube de puntos, y
uno de ellos es el de mínimos cuadrados:
b
b
b
b
b
b
b
b
b
X
Y
1
60
![Page 61: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/61.jpg)
Índice
Cálculo de los parámetros del modelo de R.S.Mínimos cuadrados VIII. Ejemplo
b
b
b
b
b
b
b
b
b
y = f(x)
MODELO DE MÍNIMOS CUADRADOS
e2
e1
ei
en
X
Y
b
b
b
b
b
b
b
b
b
y = f(x)
MODELO CUALQUIERA
e′
2
e′
1
e′
i
e′
n
X
Y
Necesariamente, ∑e2i <
∑(e ′i )
2
61
![Page 62: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/62.jpg)
Índice
Los parámetros del modelo de regresiónlineal por mínimos cuadrados I
El modelo de regresión lineal con una variable independiente tiene
la forma:
y = β0 + β1x︸ ︷︷ ︸Recta
+E
62
![Page 63: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/63.jpg)
Índice
Los parámetros del modelo de regresiónlineal por mínimos cuadrados II
El modelo de regresión lineal simple es el modelo de regresión
más sencillo.
Se utiliza cuando:
1 La nube de puntos se asemeja a una recta.
2 El coe�ciente de correlación lineal es alto en valor absoluto.
63
![Page 64: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/64.jpg)
Índice
Los parámetros del modelo de regresiónlineal por mínimos cuadrados III
Supóngase que la relación
entre dos variables sugiere
una alta relación lineal. . |ρ| ∼= 1
b b
b
b
b
b
b
b
b
b
X
Y
1
64
![Page 65: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/65.jpg)
Índice
Los parámetros del modelo de regresiónlineal por mínimos cuadrados IV
Para ajustar una recta por
mínimos cuadrados hay
que minimizar:
S(β0, β1) =n∑
i=1
e2i
.
y = β0 + β1x
ei
e1
en
b b
b
b
b
b
b
b
b
b
**
X
Y
1
65
![Page 66: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/66.jpg)
Índice
Los parámetros del modelo de regresiónlineal por mínimos cuadrados V
Como S es función de β0 y de β1, para que S sea mínimo:
∂S
∂β0= 0
y∂S
∂β1= 0
66
![Page 67: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/67.jpg)
Índice
Los parámetros del modelo de regresiónlineal por mínimos cuadrados VI
Ahora bien, como
ei = yi − yi , con yi = β0 + β1xi ,
se tiene que:
ei = yi − (β0 + β1xi )
67
![Page 68: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/68.jpg)
Índice
Los parámetros del modelo de regresiónlineal por mínimos cuadrados VII
De donde:
∂S
∂β0=
∂[∑n
i=1 e2i
]∂β0
=∂[∑n
i=1(yi − (β0 + β1xi ))2]
∂β0= 0
y
∂S
∂β1=
∂[∑n
i=1 e2i
]∂β1
=∂[∑n
i=1(yi − (β0 + β1xi ))2]
∂β1= 0
68
![Page 69: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/69.jpg)
Índice
Los parámetros del modelo de regresiónlineal por mínimos cuadrados VIII
Operando para resolver el sistema anterior se tiene que:
n∑i=1
ei = 0.
n∑i=1
eixi = 0, e
y = β0 + β1x
Siendo β0 y β1 las soluciones del sistema.
69
![Page 70: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/70.jpg)
Índice
Los parámetros del modelo de regresiónlineal por mínimos cuadrados IX
Resolviendo el sistema, se tiene que:
β1 =COV (X ,Y )
s2x
Por lo que la ecuación de la recta de regresión es:
(y − y) =COV (X ,Y )
s2x(x − x)
70
![Page 71: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/71.jpg)
Índice
Interpretación de los parámetros de unmodelo de regresión lineal simple I
En el modelo y = β0 + β1x que relaciona las variables X e Y :
β0 representa el valor medio de la variable Y |X = 0, que en
muchas ocasiones carece de sentido.
β1 representa la variación de la variable Y , cuando X aumenta
o disminuye una unidad.
71
![Page 72: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/72.jpg)
Índice
Interpretación de los parámetros de unmodelo de regresión lineal simple II
Si y = β0 + β1x es la recta
de regresión calculada por
mínimos cuadrados,
asociada a una muestra, .
y = β0 + β1x
X
Y
172
![Page 73: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/73.jpg)
Índice
Interpretación de los parámetros de unmodelo de regresión lineal simple III
β0 = y(0). Grá�camente,
Obsérvese que β0 no
siempre tiene
signi�cado físico.
.
β0
y = β0 + β1x
0 X
Y
173
![Page 74: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/74.jpg)
Índice
Interpretación de los parámetros de unmodelo de regresión lineal simple IV
β1 representa la variación
de la variable Y cuando X
aumenta o disminuye una
unidad. En efecto:
y(x) = β0 + β1x ,
y(x + 1) = β0 + β1(x + 1),
De donde,
y(x + 1)− y(x) = β1.
.
1
β1
x x + 1
b
b
y = β0 + β1x
X
Y
174
![Page 75: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/75.jpg)
Índice
Problemas abiertos
Una vez calculado un modelo de regresión, cabe preguntarse
1 ¾Cómo se emplea un modelo de regresión?
2 ¾Qué �abilidad ofrecen las previsiones de un modelo de
regresión?
75
![Page 76: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/76.jpg)
Índice
Hipótesis del modelo I
Idea clave
Para poder usar correctamente un modelo de regresión y para
analizar su �abilidad es necesario controlar el error.
76
![Page 77: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/77.jpg)
Índice
Hipótesis del modelo II
Recordando que para cada
observación, (xi , yi )
ei = yi − yi ,
Se tiene que
Cada error, ei , es una
variable aleatoria.
.
y = β0 + β1x
ei
e1
en
b b
b
b
b
b
b
b
b
b
**
X
Y
1
77
![Page 78: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/78.jpg)
Índice
Hipótesis del modelo III
Al ajustar un modelo de regresión lineal simple, se supondrá que se
veri�can las siguientes hipótesis:
1 Para un valor �jo de X , xi , se tiene que yi = β0 + β1xi + eidonde β0 y β1 son constantes desconocidas.
2 Cada error ei ≈ N (0, σ2) .
La hipótesis de normalidad se basa en el teorema central del
límite.
El hecho de que la varianza sea constante recibe el nombre de
homocedasticidad.
3 Cualquier par de errores ei y ej son independientes.
78
![Page 79: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/79.jpg)
Índice
Consecuencias de las hipótesis del modelo I
Las hipótesis impuestas al modelo tienen las siguientes
consecuencias:
1 Para cada valor, xi , de X la variable aleatoria (Y |X = xi ) tieneuna distribución:
(Y |X = xi ) ≈ N(β0 + β1xi , σ2)
2 Las observaciones yi de la variable Y son independientes.
79
![Page 80: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/80.jpg)
Índice
Consecuencias de las hipótesis del modelo II
Grá�camente, si las
hipótesis del modelo son
ciertas, cuando X = xi , Yes una V.A. normal. .
y = β0 + β1x
xiX
Y
180
![Page 81: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/81.jpg)
Índice
Consecuencias de las hipótesis del modelo III
La esperanza matemática
de esta distribución es
β0 + β1xi . .
y = β0 + β1x
E(Y |X = xi) = β0 + β1xi
xi X
Y
181
![Page 82: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/82.jpg)
Índice
Consecuencias de las hipótesis del modelo IV
La desviación típica de
esta distribución coincide
con la del error aleatorio,
σ. .
y = β0 + β1x
σ
xiX
Y
182
![Page 83: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/83.jpg)
Índice
Consecuencias de las hipótesis del modelo V
En general, si el modelo es
correcto,los valores de la
variable Y , cuando
X = xi , se encontrarán en
el intervalo
(β0 + β1xi )± 3σ, con una
probabilidad 0′997. .
y = β0 + β1x
b
b
b
b
b
b
b
b
b
b
xiX
Y
183
![Page 84: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/84.jpg)
Índice
Consecuencias de las hipótesis del modelo VI
Para dos valores distintos
de X , X = xi y X = xj , lasdistribuciones de Y serán:
.
y = β0 + β1x
σ
σ
xi xj X
Y
184
![Page 85: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/85.jpg)
Índice
Consecuencias de las hipótesis del modelo VII
Y los individuos de
Y |X = xi y de Y |X = xise situarán,
respectivamente, como
muestra la �gura: .
y = β0 + β1x
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
xi xj X
Y
185
![Page 86: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/86.jpg)
Índice
Consecuencias de las hipótesis del modeloVIII.Resumen
Si las hipótesis del modelo son ciertas:
1 Existe una recta, y = β0 + β1x que, para cada valor de
X = xi , permite obtener el valor de la esperanza de
(Y |X = xi ):E (Y |X = xi ) = β0 + β1xi
2 La varianza de la distribución de (Y |X = xi ), que es normal,
no depende de xi y coincide con la varianza del error, σ2.
86
![Page 87: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/87.jpg)
Índice
Estimadores de los parámetros de la recta deregresión I
Problema
Si existe una recta, y = β0 + β1x , que pasa por los puntos (xi , µxi),
donde µxirepresenta la media de la distribución de Y condicionada
por X = xi , ¾coincide con la recta y = β0 + β1x calculada por
mínimos cuadrados?
87
![Page 88: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/88.jpg)
Índice
Estimadores de los parámetros de la recta deregresión II
Discusión del problema
1 Si existe una recta, y = β0 + β1x , que pasa por los puntos
(xi , µxi), donde µxi
representa la media de la distribución de Y
condicionada por X = xi , ésta debería ser única.
2 La recta y = β0 + β1x calculada por mínimos cuadrados
depende de la muestra (x1, y1), . . . , (xn, yn)
88
![Page 89: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/89.jpg)
Índice
Estimadores de los parámetros de la recta deregresión III
Grá�camente se observa
cómo dos muestras
distintas darían lugar a
rectas distintas. .
b b
b
b
b
b
b
b
b
b
l
l
l
ll
ll
ll
l
X
Y
1
89
![Page 90: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/90.jpg)
Índice
Estimadores de los parámetros de la recta deregresión IV
Conclusión
La recta y = β0 + β1x es una aproximación de la recta
y = β0 + β1x .
Los valores β0 y β1 son estimaciones de β0 y β1,respectivamente.
β0 y β1 son estimadores de β0 y β1.
90
![Page 91: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/91.jpg)
Índice
Propiedades de los estimadores de losparámetros de la recta de regresión I
Recordando que los estimadores de un parámetro siempre son
variables aleatorias, se puede demostrar que:
1
β1 ≈ N
(β1,
σ
sx√n
).
2
β0 ≈ N
(β0,
σ√n
√1 +
x2
s2x
),
donde σ representa la desviación típica del error experimental,
y x y sx son la media y la desviación típica de los valores
observados de X , respectivamente.
91
![Page 92: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/92.jpg)
Índice
Propiedades de los estimadores de losparámetros de la recta de regresión II
Observaciones
1 Tanto β0 como β1 son estimadores centrados de β0 y de β1,respectivamente.
2 Las desviaciones típicas de ambos estimadores crecen con el
error experimental, σ, y disminuyen cuando aumenta la
varianza de los valores observados de X .
3 La realización de un estudio inferencial para β0 y β1, requiereel conocimiento de σ.
92
![Page 93: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/93.jpg)
Índice
Estimador de la varianza del errorexperimental. La varianza residual I
La estimación por mínimos cuadrados no aporta información
sobre la variabilidad del error experimental.
La información sobre el error experimental se encuentra en los
valores de ei , con i = 1, . . . , n
93
![Page 94: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/94.jpg)
Índice
Estimador de la varianza del errorexperimental. La varianza residual II
Los métodos de los momentos y de máxima verosimilitud
proponen como estimador de σ2, la varianza de los residuos:
σ2 =
∑e2in
Este estimador de σ2 no tiene en cuenta las relaciones de
dependencia entre los residuos:∑ei = 0 y
∑eixi = 0,
y origina un estimador no centrado de σ2, es decir:
E (σ2) 6= σ2.
94
![Page 95: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/95.jpg)
Índice
Estimador de la varianza del errorexperimental. La varianza residual III
Alternativamente, se de�ne la varianza residual en la forma:
s2R =
∑e2i
n − 2.
s2R será el estimador habitual de σ2.
95
![Page 96: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/96.jpg)
Índice
Propiedades de la varianza residual
1 s2R es un estimador centrado de σ2, esto es:
E (s2R) = σ2
2 Además, ∑e2i
σ2=
(n − 2)s2Rσ2
−→ χ2n−2.
Esta distribución permite realizar inferencia respecto del valor
de σ2.
96
![Page 97: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/97.jpg)
Índice
Cálculo de intervalos de confianza para elcoeficiente de regresión, β1 I
Como
β1 ≈ N
(β1,
σ
sx√n
),
se deduce que:
β1 − β1sR
sx√n
−→ tn−2,
por lo que, con el (1− α)× 100% de con�anza,
β1 ∈(
β1 ± tα/2 ;(n−2) ×sR
sx√n
)
97
![Page 98: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/98.jpg)
Índice
Cálculo de intervalos de confianza para elcoeficiente de regresión, β1 II. Ejemplo
Al calcular una recta de regresión que describa la relación entre el
tamaño de un conjunto de siete guisantes con el de sus
descendientes, se obtuvieron los siguientes resultados:
β1 = 0′21. sx = 2′00002871. Y sR = 0′204324741.
¾Cuál sería un intervalo de con�anza al 95% para β1?
98
![Page 99: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/99.jpg)
Índice
Cálculo de intervalos de confianza para elcoeficiente de regresión, β1 III. Ejemplo
Como
β1 − β1sR
sx√n
−→ tn−2,
con el 95% de probabilidad,
−2′57 ≤ 0′21− β10′204324741
2′000002871×√7
≤ 2′57.
99
![Page 100: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/100.jpg)
Índice
Cálculo de intervalos de confianza para elcoeficiente de regresión, β1. Ejemplo III
Y operando,
−2′57 ≤ 0′21− β10′03861
≤ 2′57,
de donde se deduce que, con el 95% de con�anza,
β1 ∈ (0′21− 2′57× 0′03861, 0′21 + 2′57× 0′03861).
Es decir, al 95%,
β1 ∈ (0′11076, 0′30923).
100
![Page 101: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/101.jpg)
Índice
El contraste de regresión I
Se denomina contraste de regresión al análisis de la hipótesis
H0 : β1 = 0, frente a la hipótesis alternativa H1 : β1 6= 0.
La realización del contraste se realiza teniendo en cuenta la
distribución:β1 − β1
sR
sx√n
−→ tn−2.
101
![Page 102: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/102.jpg)
Índice
El contraste de regresión II
Por lo que, si la hipótesis nula, β1 = 0, es cierta, debería ser
β1sR
sx√n
−→ tn−2,
lo que permite discutir el resultado del contraste.
Si
−tα/2 ;(n−2) ≤β1sR
sx√n
≤ tα/2 ;(n−2)
se aceptará la hipótesis nula, rechazándose en caso contrario.
102
![Page 103: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/103.jpg)
Índice
El contraste de regresión III. Ejemplo
Al calcular una recta de regresión que describa la relación entre el
tamaño de un conjunto siete de guisantes con el de sus
descendientes, se obtuvieron los siguientes resultados:
β1 = 0′21. sx = 2′00002871. Y sR = 0′204324741.
¾Se aceptaría, con una con�anza del 95%, la hipótesis de que
β1 = 0?
103
![Page 104: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/104.jpg)
Índice
El contraste de regresión IV. Ejemplo
Si la hipótesis nula, β1 = 0, es cierta, debería ser
β1sR
sx√n
−→ tn−2,
por lo tanto, con el 95% de con�anza, debería cumplirse que:
−2′57 ≤ 0′21
0′204324741
2′00002871√7︸ ︷︷ ︸
5′438
≤ 2′57.
104
![Page 105: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/105.jpg)
Índice
El contraste de regresión V. Ejemplo
Y como
5′438 /∈ (−2′57, 2′57)
se rechaza la hipótesis nula de que β1 = 0, y se acepta que β1 6= 0.
Naturalmente, se podría haber llegado a la misma conclusión
con el análisis del intervalo de con�anza para β1 calculado
anteriormente, que no contiene al 0.
105
![Page 106: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/106.jpg)
Índice
El contraste de regresión VI. Interpretación
Observaciones:
La aceptación del contraste de regresión, β1 = 0, se interpretacomo falta de relación lineal entre las variables y, por lotanto, supone la inutilidad del modelo de regresión.
Si β1 = 0, puede ser debido a que X e Y sean independientes.
Si β1 = 0, puede ser debido, también, a que entre X e Y haya
una relación NO lineal.
106
![Page 107: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/107.jpg)
Índice
El contraste de regresión VII.Interpretación. Ejemplo
Los puntos del grá�co
muestran cómo no existe
relación de dependencia
entre las variables X e Y . .
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
X
Y
1
107
![Page 108: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/108.jpg)
Índice
El contraste de regresión VIII.Interpretación. Ejemplo
En este caso se aceptaría
la hipótesis nula, β1 = 0.
Grá�camente, .
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
y = β0
X
Y
1
108
![Page 109: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/109.jpg)
Índice
El contraste de regresión IX. Interpretación.Ejemplo
Los puntos del grá�co
muestran cómo existe una
relación de dependencia no
lineal entre las variables X
e Y . .b
b b
b
b
b
b
b
b
b
b
X
Y
1
109
![Page 110: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/110.jpg)
Índice
El contraste de regresión X. Interpretación.Ejemplo
Esta relación sería,
posiblemente, descriptible
por un modelo cuadrático.
Grá�camente, .
b
b b
b
b
b
b
b
b
b
b
X
Y
1
110
![Page 111: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/111.jpg)
Índice
El contraste de regresión XI. Interpretación.Ejemplo
En este caso se aceptaría
la hipótesis nula, β1 = 0.
Grá�camente, .
b
b b
b
b
b
b
b
b
b
b
y = β0
X
Y
1
111
![Page 112: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/112.jpg)
Índice
El contraste de regresión XII. Interpretación
Observaciones:
El rechazo del contraste de regresión, β1 = 0, supone la
aceptación de la hipótesis alternativa β1 6= 0, y se interpreta
como síntoma de la existencia de relación lineal entre las
variables X e Y , resumida por la recta de regresión.
La aceptación de que β1 6= 0 no garantiza por sí sola la
bondad del modelo de regresión.
112
![Page 113: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/113.jpg)
Índice
Diagnosis y validación del modelo I
Una vez calculado el modelo de regresión siguiendo los pasos
anteriores, antes de emplearlo, es necesario veri�car las
hipótesis de linealidad y las de normalidad, homocedasticidad e
independencia de los errores, impuestas anteriormente.
Este proceso se conoce como la validación o diagnosis del
modelo.
Observación: Debe tenerse en cuenta que para que un modelo
de regresión pueda utilizarse, es imprescindible que supere el
requisito de su validación.
113
![Page 114: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/114.jpg)
Índice
Diagnosis y validación del modelo II
La diagnosis del modelo se realiza a través de los grá�cos de
los residuos.
Cada residuo, ei , está de�nido por la diferencia:
ei = yi − yi .
114
![Page 115: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/115.jpg)
Índice
Diagnosis y validación del modelo III.Gráficos de residuos
Las hipótesis de linealidad, homocedasticidad e independencia
se contrastan a través del grá�co que enfrenta los valores de
los residuos con los previstos para cada valor de xi observado.
La hipótesis de independencia se contrasta también a través
del grá�co que enfrenta los valores de los residuos con el orden
de la obtención de datos.
115
![Page 116: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/116.jpg)
Índice
Diagnosis y validación del modelo IV.Gráficos de residuos
Al representarlos
grá�camente, los residuos
deberían formar una nube
de puntos sin estructura, y
con, aproximadamente, la
misma variabilidad por
todas las zonas del grá�co.
Grá�camente, .
b
b
b
b
b
bb
b
b
b
b
b
bb
yi
0
ei
−3σ
3σ
1
116
![Page 117: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/117.jpg)
Índice
Diagnosis y validación del modelo V. Gráficosde residuos. Ejemplo
Los residuos de la �gura
muestran una estructura
que sugiere una relación no
lineal entre las variables: .
b
b
b
b
b b b
b
b
b
b
yi
0
ei
−3σ
3σ
1
117
![Page 118: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/118.jpg)
Índice
Diagnosis y validación del modelo VI.Gráficos de residuos. Ejemplo
Los residuos de la �gura
sugieren la asusencia de
homocedasticidad
(heterocedasticidad). .b
b
b
b b
b
b
b
b
b
b
b
b
b
b
b
yi
0
ei
−3σ
3σ
1
118
![Page 119: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/119.jpg)
Índice
Diagnosis y validación del modelo VII.Gráficos de residuos. Ejemplo
El grá�co de la �gura
contiene una
representación temporal de
los residuos.
El eje de abscisas indica el
orden de obtención de los
datos, y la estructura del
grá�co sugiere falta de
independencia en los
mismos:
.
b
b
b
b
b
b
b
b
b
b
T
0
ei
−3σ
3σ
1
119
![Page 120: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/120.jpg)
Índice
Diagnosis y validación del modelo VIII.Gráficos de residuos. Ejemplo
La unión de los puntos por
medio de una línea ayuda
a detectar la falta de
independencia en los
residuos.
¾Sabría colocar
aproximadamente el
siguiente residuo en el
grá�co? .
b
b
b
b
b
b
b
b
b
b
T
0
ei
−3σ
3σ
1
120
![Page 121: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/121.jpg)
Índice
Diagnosis y validación del modelo IX.Gráficos de residuos. Ejemplo
La representación de los residuos en papel probabilístico
normal permite contrastar la hipótesis de normalidad. Esta
hipótesis será aceptada cuando los residuos originen,
aproximadamente, una línea recta.
Observación: Esta hipótesis puede, en el caso en el que el
número de datos sea grande, contrastarse por medio del test
de la chi cuadrado, aunque los residuos no son independientes,
ya que existen dos relaciones algebraicas que los relacionan,
como se vió anteriormente.
121
![Page 122: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/122.jpg)
Índice
Diagnosis y validación del modelo X. Gráficosde residuos. Ejemplo
El grá�co de la �gura
representa un conjunto de
residuos sobre papel
probabilístico normal, que
hace razonable la
aceptación de la hipótesis
de normalidad. .
ei
b
b
b
b
b
b
b
b
b
b
1
122
![Page 123: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/123.jpg)
Índice
Transformaciones I
En el caso en el que el análisis de los residuos no permitavalidar el modelo, bien por
Falta de linealidad en la relación entre las variables X e Y .
Falta de homocedasticidad.
Falta normalidad.
En ocasiones se puede obtener un modelo lineal que sí veri�que las
hipótesis a través de transformaciones en X , en Y , o en ambas.
123
![Page 124: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/124.jpg)
Índice
Transformaciones II. Algunos Modeloslinealizables
Modelo real (desconocido) Transformación Modelo lineal
y = β0 + β1xk z = xk y = β0 + β1z
y = β0 + β1 ln(x) z = ln(x) y = β0 + β1z
y = β0eβ1x v = ln(y) v = ln(β0) + β1x
y = Kxβ1 v = ln(y) v = β0 + β1 ln x
124
![Page 125: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/125.jpg)
Índice
Transformaciones III. Interpretación de losparámetros de regresión
Observaciones
Cuando se realiza una transformación, la interpretación de los
parámetros del modelo estimado se modi�ca.
Pueden encontrarse las interpretaciones de los parámetros del
modelo, cuando se realizan algunas transformaciones de
interés, por ejemplo las logarítmicas, en Peña (2002).
125
![Page 126: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/126.jpg)
Índice
Predicción en regresión simple
Una vez calculada la recta de regresión, y validado el modelo, se
puede emplear dicha recta para hacer predicciones.
1 Se puede emplear y(xi ) para predecir el valor de E (Y |X = xi ),la media de la variable (Y |X = xi ).
2 También se puede emplear y(xi ) para predecir el valor de unindividuo de la variable (Y |X = xi ).
Obsérvese que los dos valores se estiman por el mismo número.
126
![Page 127: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/127.jpg)
Índice
Predicción en regresión simple. Precisión dela estimación de E (Y |X = xi) I
Se puede demostrar que si µXi= E (Y |X = xi ),
se cumple que:
y(xi )− µXi
DT (y(xi ))−→ tn−2,
lo que permite calcular un intervalo de con�anza para µXi,
siendo DT (y(xi )) la desviación típica de y(xi )
Con el (1− α)× 100% de con�anza,
µXi∈ (y(xi )± tα/2 ;(n−2) × DT (y(xi )))
127
![Page 128: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/128.jpg)
Índice
Predicción en regresión simple. Precisión dela estimación de E (Y |X = xi) II
Grá�camente: .
y(xi) − tα/2 ;(n−2) × DT (y(xi))
y(xi) + tα/2 ;(n−2) × DT (y(xi))
y(xi)
xi
b
b
b
X
Y
1
128
![Page 129: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/129.jpg)
Índice
Predicción en regresión simple. Precisión dela estimación de E (Y |X = xi) III
Observaciones:
El valor exacto de
DT (y(xi )) puedeconsultarse en Peña
(2002).
Se puede comprobar
que DT (y(xi ))aumenta cuando (xi )se aleja de x .
.
b
b
b
b
b
b
b
b
b
y = β0 + β1x
x X
Y
1
129
![Page 130: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/130.jpg)
Índice
Predicción en regresión simple. Precisión dela estimación de E (Y |X = xi) IV
Uniendo los extremos de
todos los intervalos de
con�anza de µx , para todo
x , se observa cómo la
precisión de la estimación
disminuye cuando x se
aleja de x , originándose la
hipérbola que se
representa en el grá�co. .
b
b
b
b
b
b
b
b
b
y = β0 + β1x
x
1
130
![Page 131: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/131.jpg)
Índice
Predicción en regresión simple. Precisión dela estimación de una observación. I
Si se utiliza y(xi ) parapredecir el valor de un
individuo de la población
Y |X = xi , teniendo en
cuenta el intervalo de
con�anza para µXi
calculado anteriormente,
cuya representación grá�ca
es .
b
b
b
y = β0 + β1x
xi X
Y
1
131
![Page 132: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/132.jpg)
Índice
Predicción en regresión simple. Precisión dela estimación de una observación. II
La distribución de
(Y |X = xi ), para los
posibles valores extremos
de µXi, sería,
grá�camente: .
b
y = β0 + β1x
xi X
Y
1
132
![Page 133: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/133.jpg)
Índice
Predicción en regresión simple. Precisión dela estimación de una observación. III
O bien: .b
y = β0 + β1x
xi X
Y
1
133
![Page 134: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/134.jpg)
Índice
Predicción en regresión simple. Precisión dela estimación de una observación. IV
Por lo tanto, cabría
esperar que los individuos
de la variable (Y |X = xi )se encuentren en el
intervalo: .b
b
y = β0 + β1x
xi X
Y
1
134
![Page 135: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/135.jpg)
Índice
Predicción en regresión simple. Precisión dela estimación de una observación. V
Con el nivel de con�anza
deseado, una observación
de la variable (Y |X = xi )se encontraría en el
intervalo: .
b
b
y = β0 + β1x
xi
1
135
![Page 136: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/136.jpg)
Índice
Predicción en regresión simple. Precisión dela estimación de una observación. VI
Uniendo los extremos de
los intervalos de con�anza
para una observación de
(Y |X = x), para todo x ,
se observa cómo la
precisión de la estimación
disminuye cuando x se
aleja de x , originándose la
hipérbola que se
representa en el grá�co. .
b
b
y = β0 + β1x
xi X
Y
1
136
![Page 137: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/137.jpg)
Índice
Predicción en regresión simple. Resumen I
El valor de y(x) se puede emplear para estimar tanto µx , como
una observación de (Y |X = x).
La precisión de la estimación disminuye al aumentar la
distancia de x a x .
La precisión de la estimación de µx es mayor que la de una
observación de (Y |X = x).
137
![Page 138: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/138.jpg)
Índice
Predicción en regresión simple. Resumen II
Grá�camente, la hipérbola
interior ofrece intervalos de
con�anza para el valor de
µx .
Y la exterior para el valor
de un individuo de
(Y |X = x). .
b
b
b b
y = β0 + β1x
*
*
xjxi X
Y
1138
![Page 139: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/139.jpg)
Índice
Predicción en regresión simple. Observaciones
Es importante no emplear la recta para hacer previsiones fuera
del rango muestral.
Fuera de este rango no hay garantía de que la recta de
regresión describa correctamente la relación entre las variables.
139
![Page 140: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/140.jpg)
Índice
Predicción en regresión simple. Observaciones
Puede observarse,
como ejemplo, el
siguiente grá�co.
La recta de regresión
sólo es útil en la zona
de linealidad.
Esta zona, en general,
se descubre
experimentalmente.
.
zona de linealidad
Y
X
b b
1140
![Page 141: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/141.jpg)
Índice
Los valores atípicos en regresión I.
Un punto atípico, en regresión, es un punto muy separado del
resto.
Un punto atípico es in�uyente si modi�ca sustancialmente la
ecuación de la recta de regresión.
Los puntos atípicos en la variable X , puntos palanca, son los
que poseen mayor potencialidad de in�uencia.
Los puntos atípicos en Y pueden no afectar a la pendiente de
la recta.
141
![Page 142: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/142.jpg)
Índice
Los valores atípicos en regresión II. Ejemplo
El grá�co de la �gura
representa la recta de
regresión calculada sin
considerar el punto P.
.
b
b
b
b
b
b
b
b
b
b
b
b
*P
X
Y
1142
![Page 143: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/143.jpg)
Índice
Los valores atípicos en regresión III. Ejemplo
El punto P es in�uyente,
puesto que su inclusión
modi�ca sustancialmente
la recta de regresión. .
b
b
b
b
b
b
b
b
b
b
b
b
*P
X
Y
1143
![Page 144: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/144.jpg)
Índice
Los valores atípicos en regresión IV. Ejemplo
El grá�co de la �gura
representa la recta de
regresión calculada sin
considerar el punto P. .
b
b
b
b
b
b
b
b
b
b
b
b
*P
X
Y
1144
![Page 145: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/145.jpg)
Índice
Los valores atípicos en regresión V. Ejemplo
El punto P NO es
in�uyente, puesto que su
inclusión NO modi�ca
sustancialmente la recta de
regresión. .
b
b
b
b
b
b
b
b
b
b
b
b
*P
X
Y
1145
![Page 146: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/146.jpg)
Índice
Los valores atípicos en regresión VI. Ejemplo
El grá�co de la �gura
representa la recta de
regresión calculada sin
considerar el punto P. .b
b
b
b
b
b
b
b
b
b
*P
X
Y
1146
![Page 147: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/147.jpg)
Índice
Los valores atípicos en regresión VII. Ejemplo
La inclusión del punto P
no supone variación
signi�cativa en la
pendiente de la recta de
regresión estimada. . b
b
b
b
b
b
b
b
b
b
*P
X
Y
1147
![Page 148: Regresión lineal simple - UPMocw.upm.es/pluginfile.php/797/mod_label/intro/Regresion.pdf · Índice Índice III 5 Diagnosis y validación del modelo 1 Diagnosis y validación del](https://reader034.vdocumento.com/reader034/viewer/2022051603/5ff1b8618fe0f31184720f1a/html5/thumbnails/148.jpg)
Índice
Estrategia ante los valores atípicos.
Si en un análisis se observan valores atípicos, una estrategia
recomendable es la siguiente:
1 Descartar que se trata de un error.
2 Analizar si el punto es in�uyente.
3 Si el punto es in�uyente, calcular las rectas de regresiónincluyéndole y excluyéndole, eligiendo la que mejor se adapteal conocimiento del problema y a las observaciones futuras.
Observación: En caso de duda, se debe utilizar el modelo con
precaución. No se debe descartar, en ningún caso, recabar más
información.
148