principles of econometrics, 4ª. ed, wiley un economista agrícola … · 2020. 9. 30. ·...
TRANSCRIPT
Guía para Examen Extraordinario de Econometría I
Profesor: Juan Francisco Islas Aguirre
Solución a los 3 ejercicios seleccionados en sesión abierta del 21 septiembre 2020
Del libro de Carter, Griffiths y Lim (2011) Principles of Econometrics, 4ª. Ed, Wiley
Ejercicio 5.8 POE4
Un economista agrícola realiza un experimento para estudiar la relación entre la variable dependiente YIELD = rendimiento
de la producción de cacahuate (en libras por acre) y las variables independientes de los insumos de producción
NITRO = cantidad de nitrógeno aplicado (en cientos de libras por acre)
PHOS = cantidad de fósforo fertilizante (en cientos de libras por acre)
Un total de N=27 observaciones fueron obtenidas empleando pruebas en diferentes terrenos de cultivo. El modelo
cuadrático estimado, con un término de interacción, es:
(a) Encontrar las ecuaciones que describen el efecto marginal del nitrógeno sobre el rendimiento y efecto marginal del
fósforo sobre el rendimiento. ¿qué le dicen a Usted éstas ecuaciones?
(b) ¿ Cuáles son los efectos marginales del nitrógeno y del fósforo cuando i) y y ii) cuando
y ? Comente sus hallazgos.
(c) Pruebe las hipótesis de que el efecto marginal del nitrógeno es cero cuando
i) y
ii) y
iii) y
Nota: La siguiente información puede ser útil:
(d) Para la función estimada, ¿qué niveles de nitrógeno y de fósforo dan el máximo rendimiento? ¿Son éstos los niveles de
aplicación óptimos de fertilización para el productor de cacahuates?
Solución
(a) La ecuación que describe el efecto marginal del nitrógeno sobre el rendimiento es
es decir
La ecuación que describe el efecto marginal del fósforo sobre el rendimiento es
es decir
Estas ecuaciones indican que el efecto marginal de ambos fertilizantes declina –se tienen rendimientos marginales
decrecientes con la producción– y éstos efectos marginales eventualmente empiezan a ser negativos. También, se observa
que, el efecto marginal de un fertilizante es pequeño conforme aumenta la cantidad del otro fertilizante a ser aplicado.
(b) Los efectos marginales del nitrógeno son:
cuando
i) y
⌉
ii) y
⌉
Los efectos marginales del fósforo son:
cuando
i) y
⌉
ii) y
⌉
(c) Prueba de hipótesis de que el efecto marginal del nitrógeno es cero
Nota: La siguiente información puede ser útil:
A partir del modelo teórico
y del modelo estimado
Se tienen N=27 observaciones, K=6 parámetros a estimar en el modelo. Así, N-K=27-6=21 grados de libertad del error.
El efecto marginal del nitrógeno al rendimiento es la primera derivada parcial del rendimiento respecto al nitrógeno:
Igualando el efecto marginal a cero
Caso i) y
Efecto marginal igual a cero
Planteamiento de la prueba de hipótesis
Estadístico de prueba
( )
√ ( )
√
El valor crítico o teórico para esta prueba a dos colas de la distribución con 21 grados de libertad, lo buscamos en las
tablas de la distribución de Student, en STATA, en R, en Python, en GRETL o en cualquier software. En este caso:
Medio o software Imagen, comando o instrucción Resultado
Tablas de la distribución de Student
Fuente: Carter, Griffiths y Lim (2018) Principles of Econometrics, Statistical Tables, Appendix D, TABLE D.2,
2.080
Percentiles of the t-distribution, disponibles en: http://www.principlesofeconometrics.com/poe5/poe5tables.pdf
Microsoft Excel =DISTR.T.INV(0.05,21) 2.079613845
R qt(p=0.975,df=21)
qt(c(0.025,0.975),df=21)
2.079614 -2.079614 2.079614
Python import scipy.stats as stats
print(stats.t.ppf(0.975,21)) 2.079613844727662
SAS
DATA INVCDFT;
t = TINV(0.975,21);
PROC PRINT;
RUN;
2.0796138447
GRETL ? t=critical(t,21,0.025) 2.07961
STATA display invttail(21,0.025) 2.0796138
por lo tanto
2.080
El estadístico calculado es mayor que el valor crítico, se rechaza la hipótesis nula.
Se rechaza que el efecto marginal del nitrógeno sea cero cuando y .
Caso ii) y
Efecto marginal igual a cero
Planteamiento de la prueba de hipótesis
Estadístico de prueba
( )
√ ( )
√
El valor absoluto del estadístico calculado es menor que el valor absoluto crítico, no se rechaza la hipótesis nula.
| | | |
| | | |
No se rechaza que el efecto marginal del nitrógeno sea cero cuando y .
Caso iii) y
Efecto marginal igual a cero
Planteamiento de la prueba de hipótesis
Estadístico de prueba
( )
√ ( )
√
El valor absoluto del estadístico calculado es mayor que el valor absoluto crítico, se rechaza la hipótesis nula.
| | | |
| | | |
Se rechaza que el efecto marginal del nitrógeno sea cero cuando y .
(d) Para la función estimada, los niveles de nitrógeno y de fósforo que dan el máximo rendimiento se obtienen al igualar a
cero las primeras derivadas obtenidas en (a) y resolviendo para obtener el nivel de nitrógeno y de fósforo óptimos,
respectivamente:
Se resuelve este sistema de ecuaciones simultáneas. A continuación se presentan tres métodos posibles de solución:
1 Método de sustitución
Despejando a en la primera ecuación
se obtiene
Sustituyendo esta expresión en la segunda ecuación del sistema
[
]
Agrupando términos semejantes
[
]
Despejando
Resolviendo para
Sustituyendo esta solución para en la ecuación donde se tiene despejada
2 Método de igualación
Despejamos a en cada una de las ecuaciones, obteniendo
Igualando estas expresiones en y resolviendo para
Agrupando términos semejantes
[
]
Despejando
Resolviendo para
Sustituyendo esta solución para en cualquiera de las ecuaciones donde está despejada
3 Regla de Cramer
Se expresa de manera compacta el sistema de ecuaciones, en la forma Ax=b, donde A es la matriz de coeficientes asociados a las variables, x es el vector de incógnitas y b es el vector de términos independientes. Se ordenan los términos por variable y los términos independientes se trasladan a la derecha de la igualdad. La regla de Cramer señala que la solución al sistema de ecuaciones lineales es x=A-1b. Así, se tiene
Planteado en forma matricial
[
] [
] [
]
Para despejar al vector de incógnitas, premultiplicamos ambos lados de la igualdad por la inversa de la matriz A
[
]
[
] [
] [
]
[
]
[
] [
] [
]
[
]
[
] [
]
[
]
[
] [
] [
]
La solución es
[
] [
]
En Excel
Pulsar doble clic sobre el cuadro y F2 sobre las celdas calculadas para visualizar la fórmula en Excel
Solución de sistema de 2 ecuaciones en 2 incógnitas por Regla de Cramer
3.888 0.567 8.011 0.2716 -0.0990 8.011 1.701
0.567 1.556 4.800 -0.0990 0.6787 4.800 2.465A = b = x = A-1b = =
¿Son éstos los niveles de aplicación óptimos de fertilización para el productor de cacahuates?
Los niveles que maximizan el rendimiento ( ) no necesariamente son los niveles óptimos de fertilización. Los niveles
óptimos son los que satisfacen la condición de que el costo marginal de los insumos es igual al valor de la productividad
marginal de dichos insumos.
Así, para cambios infinitesimalmente pequeños en los factores productivos, los niveles óptimos son aquellos para los
cuales:
[ ]
[ ]
Ejercicio 6.5 POE4
Considere la ecuación de salarios
(a) Suponga que desea probar la hipótesis de que un año de educación tiene el mismo efecto sobre que un
año de experiencia. ¿Qué hipótesis nula y alternativa podría plantear?
(b) ¿Cuál es el modelo restringido, suponiendo que la hipótesis nula es verdadera?
(c) Dado que la suma de cuadrados de los errores del modelo restringido es , pruebe la hipótesis en
(a). (Para use el valor relevante a partir de la Tabla 6.4. El tamaño de la muestra es .)
Solución:
(a) La prueba de hipótesis se pueden plantear como sigue, partiendo del modelo teórico
Asumiendo que el efecto lineal de un año adicional de educación es igual al efecto lineal de un año adicional de experiencia
sobre el
es decir
Y el efecto cuadrático de un año adicional de educación sea igual al el efecto cuadrático de un año adicional de experiencia
sobre el
es decir
La prueba de hipótesis queda planteada como sigue
y
ó ó ambas
Si la hipótesis nula planteada en (a) no se rechaza, el modelo teórico restringido es
(c) El estadístico de la prueba de hipótesis es una (POE4, expresión 6A.1, pág. 254)
donde
es la suma de cuadrados de los errores del modelo restringido (restricted)
es la suma de cuadrados de los errores del modelo no restringido (unrestricted)
es el número de restricciones lineales en la prueba de hipótesis, en este caso se tienen 2 restricciones lineales sobre
parámetros, que son y
es el número de grados de libertad de la variación no explicada, en este caso N=1,000 y K=6 parámetros que se
estiman en el modelo que son , , , , , , por lo tanto N-K=1,000-6=994
Dado el valor de , para obtener la calculada se debe buscar en la Tabla dada el valor de que
corresponde al modelo completo, es decir al modelo irrestricto. Al mirar la tabla referida se observa que el modelo
completo es el de la Ecuación (B), es decir sin el término de interacción , por lo tanto
El valor crítico o teórico para esta prueba a una cola de la distribución , con 2 grados de libertad en el numerador y 994
grados de libertad en el denominador lo buscamos en las tablas de la distribución , en STATA, en R, en Python, en GRETL o
en cualquier software. En este caso:
Medio o software Imagen, comando o instrucción Resultado
Tablas de la distribución
Fuente: Carter, Griffiths y Lim (2018) Principles of Econometrics, Statistical Tables, Appendix D, TABLE D.4, 95th Percentile for the F-distribution, disponibles en: http://www.principlesofeconometrics.com/poe5/poe5tables.pdf
3.00
Microsoft Excel =INV.F(0.95,2,994) 3.004779025
R qf(p=0.95, df1=2, df2=994) 3.004779
Python import scipy.stats as stats
print(stats.f.ppf(0.95,2,994)) 3.0047790246
SAS
DATA INVCDFF;
F = FINV(0.95,2,994);
PROC PRINT;
RUN;
3.0047790246
GRETL ? f=critical(f,2,994,0.05) 3.00478
STATA display invFtail(2,994,0.05) 3.004779
por lo tanto
3.005
El estadístico calculado es mayor que el valor crítico, se rechaza la hipótesis nula.
Se rechaza la hipótesis nula de que la educación y la experiencia tienen el mismo efecto sobre el . Los efectos de
la educación y la experiencia sobre el salario son diferentes.
Ejercicio 8.14 POE4
En el archivo cloth.dta se encuentra una serie de tiempo de 28 observaciones sobre el costo total y el producto para 2
firmas manufactureras de ropa. La base de datos se encuentra disponible en el sitio del libro de texto POE4 en los
siguientes formatos:
Excel : http://www.principlesofeconometrics.com/poe4/data/excel/cloth.xlsx
SAS : http://www.principlesofeconometrics.com/poe4/data/sas/cloth.sas7bdat
R : https://github.com/ccolonescu/PoEdata/blob/master/data/cloth.rda
Stata : http://www.principlesofeconometrics.com/poe4/data/stata/cloth.dta
GRETL : http://www.learneconometrics.com/gretl/POE4data.exe
Código ASCII : http://www.principlesofeconometrics.com/poe4/data/dat/cloth.dat
Se tiene la hipótesis de que las funciones de costos de ambas firmas son cúbicas y pueden ser escritas como
Firma 1 :
Firma 2 :
donde
[ ] [ ] , [ ] y [ ]
. También y son independientes uno del otro y en el tiempo.
(a) Estime cada función empleando Mínimos Cuadrados Ordinarios (MCO). Reporte y comente los resultados. ¿Los
coeficientes estimados tienen los signos esperados?
(b) Empleando un nivel de significancia del 10%, pruebe la hipótesis nula de que
contra la hipótesis
alternativa de que
.
(c) Estime un modelo de ecuación conjunta, asumiendo que , , , . Reporte y comente los
resultados.
(d) Pruebe la hipótesis , , y
Comente sobre los resultados de la prueba.
(a) A continuación se despliega el código y los resultados de las ecuaciones estimadas por MCO, en STATA
use "http://www.principlesofeconometrics.com/poe4/data/stata/cloth.dta", clear
* Ecuación 1
gen q12=q1*q1
gen q13=q1*q1*q1
regress c1 q1 q12 q13
* Ecuación 2
gen q22=q2*q2
gen q23=q2*q2*q2
regress c2 q2 q22 q23
. * Ecuación 1
Source | SS df MS Number of obs = 28
-------------+------------------------------ F( 3, 24) = 566.40
Model | 551990.189 3 183996.73 Prob > F = 0.0000
Residual | 7796.48998 24 324.853749 R-squared = 0.9861
-------------+------------------------------ Adj R-squared = 0.9843
Total | 559786.679 27 20732.8399 Root MSE = 18.024
------------------------------------------------------------------------------
c1 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
q1 | 83.65857 23.65464 3.54 0.002 34.83779 132.4793
q12 | -13.79592 4.59683 -3.00 0.006 -23.28331 -4.30853
q13 | 1.191122 .272075 4.38 0.000 .6295867 1.752657
_cons | 72.7743 35.73352 2.04 0.053 -.9760699 146.5247
------------------------------------------------------------------------------
. * Ecuación 2
Source | SS df MS Number of obs = 28
-------------+------------------------------ F( 3, 24) = 186.97
Model | 475455.147 3 158485.049 Prob > F = 0.0000
Residual | 20343.8174 24 847.659059 R-squared = 0.9590
-------------+------------------------------ Adj R-squared = 0.9538
Total | 495798.964 27 18362.9246 Root MSE = 29.115
------------------------------------------------------------------------------
c2 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
q2 | 108.2858 28.93327 3.74 0.001 48.5705 168.0012
q22 | -20.01463 6.1564 -3.25 0.003 -32.72081 -7.308444
q23 | 1.613098 .38016 4.24 0.000 .8284869 2.39771
_cons | 51.18521 37.59725 1.36 0.186 -26.4117 128.7821
------------------------------------------------------------------------------
Las ecuaciones de costos estimadas por firma son Para la firma 1
Para la firma 2
Para la función de costos estimada en ambas firmas se valida la hipótesis de que son cúbicas al ser estadísticamente significativo el término cúbico de la cantidad de producto y la variabilidad del costo se explica en más de 95% por la cantidad de producto.
El costo marginal para la firma 1 es
A partir del modelo estimado:
El costo marginal para la firma 2 es
A partir del modelo estimado:
En ambas funciones estimadas de costo marginal se observa que es positivo cuando la cantidad de producto es cero, es
decir
si y
si .
Los coeficientes estimados en ambas ecuaciones son del mismo signo, aunque los estimadores de varianza son diferentes,
siendo mayor el de la firma 2, de 847.66 unidades cuadráticas en comparación con el de la firma 1 que es de 324.85
unidades cuadráticas.
(b) Para comparar las varianzas de los modelos de costos de las firmas 1 y 2, empleamos la distribución para probar la
hipótesis nula de que
contra la hipótesis alternativa de que
. Así, la a calcular es el siguiente
cociente de varianzas:
El valor crítico o teórico al 95% de confianza para esta prueba en dos colas de la distribución , con 24 grados de libertad en
el numerador y 24 grados de libertad en el denominador lo buscamos en las tablas de la distribución , en STATA, en R, en
Python, en GRETL o en cualquier software. En este caso, se muestran los comandos de software:
Medio o software Imagen, comando o instrucción Resultado
Microsoft Excel =INV.F(0.05,24,24) 0.5041
R qf(p=0.05, df1=24, df2=24) 0.5040933
Python import scipy.stats as stats
print(stats.f.ppf(0.05,24,24)) 0.504093346736
SAS
DATA INVCDFF;
F = FINV(0.05,24,24);
PROC PRINT;
RUN;
0.5040933467
GRETL ? f=critical(f,24,24,0.95) 0.504093
STATA display invFtail(24,24,0.95) 0.50409335
por lo tanto
El estadístico calculado es mayor que el valor crítico, se rechaza la hipótesis nula.
Las varianzas de las funciones de costos son diferentes. Los datos de la muestra dada no soportan que las varianzas de las
funciones de costos de las firmas sean iguales.
(d) Para estimar la ecuación de costos conjunta (para las firmas 1 y 2) se separan bases de datos de observaciones de
acuerdo a una variable dicotómica que identifique la firma a la que correspondan. Se unifican en una sola base de datos y
se estima la regresión, asumiendo que ambas firmas tienen los mismos efectos en todos los términos
, , , Para incorporar el efecto de las varianzas diferentes por firma que se validó en el inciso anterior, se debe realizar la estimación por el método de Mínimos Cuadrados Generalizados (MCG) sobre la base de datos combinada, con las observaciones transformadas mediante el ponderador de varianza empleando
y . Así el código de instrucciones en
STATA para estimar la ecuación por MCG es: drop _all
use "http://www.principlesofeconometrics.com/poe4/data/stata/cloth.dta", clear
keep c1 q1
ren c1 c
ren q1 q
gen firma1=1
save "C:/DATA/firma1.DTA",replace
use "http://www.principlesofeconometrics.com/poe4/data/stata/cloth.dta", clear
keep c2 q2
ren c2 c
ren q2 q
gen firma2=1
save "C:/DATA/firma2.DTA",replace
use "C:/DATA/firma1.DTA",clear
append using "C:/DATA/firma2.DTA"
gen q2=q*q
gen q3=q*q*q
replace firma1=0 if firma2==1
replace firma2=0 if firma1==1
regress c q q2 q3 [aweight=firma1]
scalar v1=e(rmse)^2
regress c q q2 q3 [aweight=firma2]
scalar v2=e(rmse)^2
gen wv=firma1*v1+firma2*v2
regress c q q2 q3 [aweight=1/wv]
Los resultados obtenidos en STATA son: . regress c q q2 q3 [aweight=1/wv]
(sum of wgt is 1.1922e-01)
Source | SS df MS Number of obs = 56
-------------+------------------------------ F( 3, 52) = 809.92
Model | 1080707.02 3 360235.672 Prob > F = 0.0000
Residual | 23128.6282 52 444.781312 R-squared = 0.9790
-------------+------------------------------ Adj R-squared = 0.9778
Total | 1103835.65 55 20069.739 Root MSE = 21.09
------------------------------------------------------------------------------
c | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
q | 89.92024 16.97292 5.30 0.000 55.86158 123.9789
q2 | -15.40791 3.41461 -4.51 0.000 -22.25983 -8.555993
q3 | 1.302565 .2065344 6.31 0.000 .8881237 1.717007
_cons | 67.27048 24.49386 2.75 0.008 18.11996 116.421
------------------------------------------------------------------------------ Así, la ecuación conjunta estimada es:
(d) Para igualdad de coeficientes , , , bajo el supuesto de varianzas iguales en costos por firma,
.
El modelo restringido a varianzas iguales es a partir de los resultados obtenidos en STATA
regress c q q2 q3
Source | SS df MS Number of obs = 56
-------------+------------------------------ F( 3, 52) = 631.11
Model | 1051323.38 3 350441.128 Prob > F = 0.0000
Residual | 28874.3313 52 555.275602 R-squared = 0.9733
-------------+------------------------------ Adj R-squared = 0.9717
Total | 1080197.71 55 19639.9584 Root MSE = 23.564
------------------------------------------------------------------------------
c | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
q | 95.17905 17.73497 5.37 0.000 59.59123 130.7669
q2 | -16.74544 3.644999 -4.59 0.000 -24.05967 -9.431219
q3 | 1.393998 .2228122 6.26 0.000 .9468929 1.841104
_cons | 62.67455 24.73758 2.53 0.014 13.03497 112.3141
------------------------------------------------------------------------------
El estadístico de la prueba Chow que corresponde es
donde es la suma de cuadrados de los errores a partir de los modelos de variables dicotómicas identificadoras de las firmas 1 y 2, por lo que , así
donde
es la suma de cuadrados de los errores del modelo restringido (restricted) a varianzas iguales en costos por firma.
es la suma de cuadrados de los errores del modelo no restringido (unrestricted), es decir, de los
modelos de varianzas diferentes en costos por firma.
es el número de restricciones lineales en la prueba de hipótesis, en este caso se tienen 4 restricciones lineales sobre
parámetros, que son , , , .
es el número de grados de libertad de la variación no explicada, en este caso N=56 y K=4 parámetros
que se estiman en el modelo que son , , , en el modelo de la firma 1 y , , , en el modelo de la firma 2 por
lo tanto N-K=N-k1-k2=56-4-4=56-8=48
Así, el estadístico calculado de la prueba Chow
El valor crítico o teórico para esta prueba a una cola de la distribución , con 4 grados de libertad en el numerador y 48
grados de libertad en el denominador lo buscamos en las tablas de la distribución , en STATA, en R, en Python, en GRETL o
en cualquier software. En este caso:
Medio o software Imagen, comando o instrucción Resultado
Tablas de la distribución
Fuente: Carter, Griffiths y Lim (2018) Principles of Econometrics, Statistical Tables, Appendix D, TABLE D.4, 95th Percentile for the F-distribution, disponibles en: http://www.principlesofeconometrics.com/poe5/poe5tables.pdf
2.56
Microsoft Excel =INV.F(0.95,4,48) 2.565240508
R qf(p=0.95, df1=4, df2=48) 2.565241
Python import scipy.stats as stats
print(stats.f.ppf(0.95,4,48)) 2.56524050848
SAS
DATA INVCDFF;
F = FINV(0.95,4,48);
PROC PRINT;
RUN;
2.5652405085
GRETL ? f=critical(f,4,48,0.05) 2.56524 STATA display invFtail(4,48,0.05) 2.5652405
por lo tanto
2.565
No se rechaza la hipótesis nula, pues el estadístico calculado es menor que el valor crítico.
No se rechaza la hipótesis nula de igualdad en coeficientes para las firmas, es decir , , , .