las hipótesis de gauss-markov
DESCRIPTION
Transparencias para un curso de regresión lineal multivarianteTRANSCRIPT
Las hipótesis de Gauss-Markov
Las hipótesis de Gauss-Markov
1. Número de individuos y de variables
2. No colinealidad
3. Media nula de los errores
4. Homocedasticidad
5. No correlación entre los errores
Lema previo
Las matrices X, X’ y X’X tienen el mismo rango
1. Número de individuos y de variables
• El número de individuos (n) es mayor que el número de variables explicativas (k).
• Si esta condición no se cumple, el rango de la matriz no será y no tendrá inversa.
kn
XX' 1k
2. No colinealidad
• Las variables explicativas no son linealmente dependientes:– El rango de la matriz es .– El rango de la matriz es . No es
singular –su determinante no es nulo y, en consecuencia, tendrá inversa.
XXX'
1k1k
1krango XX'
Modelo de regresión
εXβY ConocidoAleatorio
ConocidoNo aleatorio
DesconocidoNo aleatorio
DesconocidoAleatorio
Modelo de regresión
εXβY
Son variables aleatorias
Es constante
3. Media nula de los errores
• Cada término de error ( ) es una variable aleatoria.• La media –valor esperado- de cada término de error es nula:
1 siendo 0 niE i
0ε E¡Es un vector!
i
4. Homocedasticidad
• Todos los términos de error tienen la misma varianza.
1 siendo 2 niVar i
Varianza condicionada de la
distribución de la variable dependiente
4. Homocedasticidad (II)
• Cada observación de la variable dependiente ( ) es una variable aleatoria -función de -.
• La varianza de cada observación de la variable dependiente (la varianza condicionada) y la varianza del correspondiente término de error son iguales:
niVarxxVaryVar iiikkii 1 siendo ... 211
niyVar i 1 siendo 22 k1 X,...,Y/X
i iy
5. No correlación entre los errores
• Los términos de error son variables aleatorias. Estas variables aleatorias son independientes. La covarianza entre cualesquiera dos de ellas es nula:
siendo1 0, jin ; i,jCov ji
5. No correlación entre los errores(II)
nnn
n
n
VarCovCov
CovVarCov
CovCovVar
ECov
...,,
............
,...,
,...,
21
2221
1211
εε'ε
• Las hipótesis cuarta y quinta las podemos expresar así:
Iεε' 2
2
2
2
...00
............
0...0
0...0
E
Consecuencias de las hipótesis de Gauss-Markov
• La esperanza matemática (condicionada) de la variable dependiente es:
• La matriz de covarianzas (condicionada) de la variable dependiente es:
XβεXβY EE
IεεεεXβY 2' ECovCovCov
Consecuencias de las hipótesis de Gauss-Markov (II)
• La esperanza matemática del estimador es:
• La matriz de covarianzas del estimador es:
βXβXXXYXXX
YXXXB
''''
''11
1
E
EE
1211
1
''''
''
XXXXXYXXX
YXXXB
Cov
CovCov
βB E
1XX'B 2Cov
Estimadorinsesgado
Teorema de Gauss-Markov
• Si se cumplen las hipótesis de G-M, entonces el estimador B obtenido por el método de los mínimos cuadrados es el estimador óptimo.
• Se dice entonces que B es un estimador BLUE:– Best
– Linear
– Unbiased
– Estimator
Mejor estimador lineal e insesgado
YX'XX'B 1
Error estándar de la estimación
• La varianza común de los términos de error ( ) es desconocida. Para estimar dicha varianza emplearemos la siguiente expresíón:
11
ˆˆ 1
2
22
knkn
yys
n
iii ee'
2
Error estándar de la estimación (II)
11
ˆˆ 1
2
22
knkn
yys
n
iii ee'
11
ˆ1
2
knkn
yys
n
iii ee'
Error estándar de la estimación (III)
• El error estándar de la estimación es una medida de la calidad del ajuste.
• Cuanto menor sea el error mejor es la calidad del ajuste.
11
ˆ1
2
knkn
yys
n
iii ee'
Estimación de la matriz de covarianzas del estimador
• Hemos obtenido que pero como no conocemos la varianza de los errores utilizaremos su estimación:
1XX'B 2Cov
kkk
k
k
bsbbsbas
bbsbsbas
basbasas
s
21
22
12
12
12
21
22
2
...,,
............
,...,
,...,
1XX'S
Estimación de la matriz de covarianzas del estimador(II)
• A las raíces cuadradas de los elementos de la diagonal principal de la matriz S los llamaremos errores estándar de los coeficientes.
• El error estándar de un coeficiente es una medida de la variabilidad de ese coeficiente.
kkk
k
k
bsbbsbas
bbsbsbas
basbasas
s
21
22
12
12
12
21
22
2
...,,
............
,...,
,...,
1XX'S
Ejercicio
• En el ejemplo de ilustración (alquileres):– Calcular el error estándar de la estimación.– Calcular los errores estándar de los
coeficientes.