Download - Manual Stata10 Jdc
MMAANNUUAALL DDEE SSTTAATTAAVVVeeerrrsssiiióóónnn ..1000
Autor:PhD.Eco JORGE EDWING DEL CARPIO GONZALES
Copyright ©2008 JDC®-- 3ª Edición
DC CONSULTING - Reservados todos los derechos
2008La Paz - Bolivia
Introduccion a Stata
Descripcion del Curso
1. Introduccion
El objetivo del curso es el de dar un panorama amplio de las capacidades
estadısticas y econometricas del paquete Stata. Comparado con otros paque
tes econometricos los cuales solo cuentan con un formato de ıconos (SPSS,
Eviews, LimDep, etc.), aprender a manejar Stata utilizando comandos tiene
un costo inicial relativamente alto. Sin embargo, los beneficios que ofrece
Stata m´ onas que compensan estos costos iniciales. Este curso de introducci´
nalando los comandos m´ ´pretende minimizar dichos costos, se˜ as utiles para
aquellos analistas que tiene la intencion de hacer de Stata su paquete de uso
diario.
Stata ofrece dos opciones para realizar analisis estadıstico. La primera de ellas
es utilizando ventanas que ya cuentan con funciones y opciones predetermi
nandas (formato de ıconos). La segunda es usando comandos, los cuales deben
ser escritos en la barra de comandos Stata. A lo largo del curso se har´ enfasisa ´
1
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
en el uso de comandos, senalando la forma alternativa de realizar los ejercicios
utilizando ventanas. Nos concentramos en el uso de comandos ya que consid
eramos que los beneficios asociados a este tipo de uso es uno de los principales
atractivos de Stata con respecto a otros paquetes econometricos. El beneficio
inmediato de aprender a utilizar los comandos Stata es que esto permite al
analista construir rutinas (do-files ) con el tipo de an´ unmente alisis que com´
realiza. De esta forma se pueden llevar al cabo analisis estadısticos de forma
rutinaria sin la necesidad de escribir las operaciones (o usar las ventanas)
de nuevo. El uso de comandos tambien abre toda una posibilidad a realizar
estimaciones que van m´ ultimo, el as alla de las incluidas en las ventanas. Por ´
beneficio de largo plazo de aprender a utilizar los comandos Stata es que el
usuario podrıa eventualmente crear sus propios programas con aplicaciones
que responden a sus necesidades particulares.
A parte de la flexibilidad que da el uso de comandos, Stata ofrece otras
ventajas con respecto a otros paquetes econometricos. La primera de ellas es
la red internacional de analistas que utilizan el paquete (como Angus Deaton
y S.P. Jenkins) de la cual Stata se “nutre” con las rutinas y comandos escritas
por esta red de usuarios. Estos comandos y rutinas estan disponibles sin costo
para todo usuario de Stata. Una tercera ventaja comparativa es que Stata se
especializa en bases de datos grandes permitiendo ajustes por diseno muestral
y analisis de datos longitudinarios (panel).
El curso esta dividido en seis apartados, los cuales explicamos brevemente a
continuacion.
1. Funciones B´ on, se tocar´asicas En esta primera sesi´ an los puntos
asicos sobre el funcionamiento de Stata. Iniciaremos la sesi´b´ on per
sonalizando Stata. Una vez familiarizado con las ventanas del progra
ma, veremos las diferentes formas de introducir datos, modificarlos,
analizarlos y salvarlos. Finalmente aprenderemos a utilizar los recursos
disponibles en la red para responder a nuestras preguntas y estar al dia
sobre los desarrollos de Stata.
2
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
2. Estadısticas Descriptivas y G´ on del curso preaficos En esta sesi´
sentamos las distintas herramientas que se pueden utilizar—como un
primer paso—para analizar los datos. Las dos formas mas usuales de
empezar un analisis estadıstico son las tablas con estadısticas descrip
tivas y el an´ afico.alisis gr´
3. An´ on Lineal En esta clase aprenderemos a realizar alisis de Regresi´
regresiones en Stata incluyendo variables dummy e interacciones como
determinantes. Veremos las diferentes hipotesis que podemos evaluar
justo despues de haber corrido el modelo. Otra parte fundamental del
an´ on es obtener los diagn´alisis de regresi´ osticos necesarios para probar
si el modelo cumple con los supuestos clasicos de Mınimos Cuadrados
Ordinarios (OLS, por sus siglas en ingles.)
4. Modelos con Variables Discretas El objetivo de la sesion es el de
ilustrar la manera de estimar modelos cuya variable dependiente toma
valores discretos. Este tipo de modelos son muy utilizados en economıa
laboral aplicada para encontrar los determinantes de la participacion
y ocupacion laboral. Los dos tipos de modelos con variables discre
tas son los binomiales (es decir dos alternativas) y los multinomiales.
Las tecnicas utilizadas para estimar este tipo de modelos difieren del
convencional OLS ya que la discontinuidad de la variable dependiente
implica una relacion no lineal. El documento hace enfasis en la teorıa
on ası como la mec´que hay detras de la estimaci´ anica de la misma. Se
ilustra con un ejemplo en donde estimamos la participaci´ onon y ocupaci´
laboral usando datos de la ENIGH.
5. An´ on es el indicar los alisis de Datos Panel El objetivo de esta sesi´
beneficios de tener una base de datos que combina corte transversal con
series de tiempo. Las tecnicas de estimacion pueden ser ajustadas para
explotar toda la variacion contenida en esta clase de bases de datos.
Todo tipo de modelos como variables continuas usando OLS, modelos
discretos, modelos de mınimos cuadrados generales (GLS), etc. pueden
3
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
ser estimados bajo esta estructura de datos. Nos enfocaremos a dos
tipo de modelos que derivan—como lo es caso en cualquier otra especi
ficacion econometrica—del supuesto que hagamos sobre los residuales
de la ecuacion objetivo. Estos modelos son los de efectos fijos y efectos
aleatorios.
onEsta ultima sesi´6. Principios de Programaci´ ´ on la destinaremos a
describir las ventajas de invertir un poco mas de tiempo en Stata y
aprender los procesos b´ on. El hecho que podamos asicos de programaci´
programar y crear nuestros propios comandos es una de las grandes
ventajas que tiene Stata sobre otros paquetes econometricos. Es im
portante explotar esta ventaja y en esta parte veremos ejemplos de
manejo de datos utilizando ‘macros’ locales y loops (repeticion de op
eraciones.)
2. Lecturas Sugeridas
Hamilton, L. C. (2004) ‘Statistics with Stata. Updated for version 8’,
Thomson. (Libro de Texto)
Maddala, G. S. (1983) ‘Limited dependent and qualitative variables in
econometrics’, Cambridge University Press. (Capıtulos 1, 2 y 3)
Wooldrich, J. M. (2003) ‘Introductory econometrics: A modern ap
proach, 2e’, Thomson. (Capıtulos 2, 3, 4 y 8)
Wooldrich, J. M. (2002) ‘Econometric analysis of cross section and
panel data’ MIT press
4
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Introduccion a Stata
Clase 1: Funciones Basicas
1. Introduccion
En esta primera sesi´ an los puntos b´ on, se tocar´ asicos sobre el funcionamiento
de Stata. Iniciaremos la sesion personalizando Stata. Una vez familiarizado
con las ventanas del programa, veremos las diferentes formas de introducir
datos, modificarlos, analizarlos y salvarlos. Finalmente aprenderemos a uti
lizar los recursos disponibles en la red para responder a nuestras preguntas
y estar al dia sobre los desarrollos de Stata.
2. Personalizando Stata
El depliegue de Stata presenta cuatro ventas diferentes: “Review”, “Results”,
“Variables” y “Commands”. En “Review” aparencen los comandos que han
sido utilizados durante las sesi´ olo los resultados m´ on en turno. S´ as recientes *[email protected]
1
MANUAL DE STATA 10.0Por: PhD.Eco. Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
son visibles en la pantalla “Review”, mientras que “Command” sirve para
utilizar Stata de forma interactiva.1
Al instalar Stata, varios archivos son creados para su uso posterior. El mas
utilizado es el archivo “Stata” cuya direccion esta indicada en la parte inferior
izquierda de la pantalla; es aquı donde son salvados los datos y resultados si
no se especifica otra ruta. Para visulizar la ruta de todos los archivos creados
por Stata, escriba la palabra sysdir en la barra de comandos.2 La ruta
de estos archivos puede ser modificada utilizando el comando sysdir set
nombre del archivo seguido por la nueva direccion. La ruta del archivo
“Stata” tambien puede ser modificada escribiendo el comando cd seguido
por la nueva ruta.
Comandos : sysdir
3. Manejando la Base de Datos
Hay varias formas en que podemos introducir datos en Stata. Una de las
mas comunes es utilizando el comando insheet seguido por la ruta del
archivo, este comando premite a Stata leer archivos en formato ASCII3 que
son comunmente realizados en Excel (separados por comas o bien por tabu
ladores). Otros comandos que pueden ser utilzados son: infile1, infile2 e
infix. Tambien es posible introducir datos “a mano” utilizando el comando
edit, el cual abre una hoja de calculo. Aunque no es muy recomendable, los
datos pueden ser introducidos a Stata cortandolos desde Excel y pegandolos
en la hoja de calculo de Stata.
Si los datos ya estan en formato de Stata (terminacion .dta), estos pueden
1El tama˜ on de las ventanas puede ser ajustado seg´ no y posici´ un las preferencias del
usuario y estas pueden ser salvadas utilizando “Prefs” → “Save Windowing Preferences”. 2Es importante se˜ usculas, todos los comandosnalar que Stata es sencible al uso de may´
Stata deben ser escritos utilizando s´ usculas.olo min´ 3American Standard Code for Information Interchange
2
MANUAL DE STATA 10.0Por: PhD.Eco. Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
ser cargados al programa utilizando el comando use seguido por la ruta en
donde se encuentra la base de datos. Por ejemplo:
use ‘‘C:/Mis Documentos/Stata/Datos1.dta’’
Comandos : insheet, infile1, infile2, infix, edit, use
3.1. Asignando Memoria y Tamano de la Matriz
Stata cuenta con un optimizador de memoria el cual asigna una cantidad
predeterminada de memoria a cada observacion, la cantidad asignada au
tomaticamente es de 10M. El usuario debe incrementar esta cantidad si con
sidera que la base de datos necesita mas recursos utilizando el comando set
memory seguido por la cantidad en mega bytes. Si la memoria asignada es in
suficiente dado el tama˜ a el siguiente error: no de la base de datos, Stata emitir´
‘‘no room to add more observations’’. Una ves que los datos han sido
cargados, estos se pueden comprimir usando compress, un comando muy util
cuando se manejan varias bases de datos grandes.
Otro valor que debe ser asignado de acuerdo al tamano de la base de datos y
el tipo de an´ no de la matriz. alisis que se pretende realizar con ella, es el tama˜
El valor asignado por Stata (en su edicion especial) es de 400 variables, este
puede ser incrementado hasta 11,000 en el caso de la edicion especial (800 en
la versi´ as peque˜ on m´ na de Stata) usando el comando set matsize.
Comandos : memory, compress, matsize
3.2. Leyendo los Datos
Stata almacena las varaibles asignandoles diferentes formatos dependiendo
del tipo de informacion de sus observaciones. Para obtener esta y otra infor
maci´ umero de variables u observaciones use el comando describe.on como n´
3
MANUAL DE STATA 10.0Por: PhD.Eco. Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Para ver las observaciones en pantalla, se puede utilizar edit o bien list
seguido por el nombre de la variable o variables que se deseen visualizar.
La diferencia entre edit y list es que el primero despliega toda la hoja
de calculo mientras el segundo despliega los datos en la ventana de resulta
dos.
Comandos : describe, edit, list
3.3. Guardando los datos
Para guardar los datos use el comando save seguido por la ruta en donde se
quieren salvar. Para borrar una base de datos no deseada utilice el comando
erase seguido por la ruta. El comando clear descarga los datos de la memo
ria temporal de Stata; notese que al utilizar clear no se realizara ninguna
advertencia antes de descargar los datos y si la base de datos original ha sido
modificada sin ser salvada estos cambios se perderan.
Comandos : save, erase, clear
4. Modificando la Base de Datos
Una vez cargada la base de datos, es muy comun modificarla para crear
nuevas variables o bien cambiar el orden o contenido de las mismas. Los
siguientes comandos son muy utiles para estas tareas: ´
label Este comando sirve para anadir etiquetas tanto a variables (label
variable) como a bases de datos (label data).
order, move y aorder Estos comandos cambian el orden en que se encuen
tran las variables. order seguido por lista de var cambia el orden segun
sea especificado por la lista de variables. move var1 var2 en cambio,
sustituye la variable1 en la posicion de la variable2. aorder acomoda
las varibles en orden alfabetico.
4
MANUAL DE STATA 10.0Por: PhD.Eco. Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
sort Ordena de forma acendente las observaciones basado en una o mas
variables.
generate Genera una nueva variable definida en base a una expresion numeri-
ca la cual puede contener otras variables. Por su flexibilidad, este es uno
de los comandos mas importantes de Stata, ya que se pueden utilizar
umero de operaciones l´ aticas para un gran n´ ogicas, aritmeticas y matem´
definir expresion. En el siguiente cuadro tratamos de resumir las expre
siones mas utilizadas con generate.
5
MANUAL DE STATA 10.0Por: PhD.Eco. Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Cuadro 1: Expresiones usadas por generate
ones L´ Expresi´ ogicas Significado
&, Y (AND), O (OR) | >, < Mayor que, Menor que
==, ! = Igual a, Diferente a
>=, <= Mayor o Igual, Menor o Igual
Expresiones Aritmeticas
+, − Mas, Menos
on, Divisi´ ∗, / Multiplicaci´ on
n, N N´ on corriente, N´ umero de observaci´ umero de
observaciones totales
Algunas funciones Matematicas
abs()
cond(x; y; z)
exp()
round(x; y)
log()
min(x1; x2; : : :)
max(x1; x2; : : :)
sqrt()
sum()
uniform()
See: help functions
Valor absoluto
si x es igual a 0, entonces y.., de otra forma z..
funci´on exponencial
redondea x en unidades de y; round(.,1) rodondea a
la integral mas cercana.
logaritmo natural
el mınimo de x1; : : : ; xn
el maximo de x1; : : : ; xn
raiz cuadrada
La suma para la expresion entre parentesis.
Genera numeros aleatoreos entre 0 y 1 con
una distribucion uniforme.
egen Es una extencion de generate que contiene una gran cantidad de fun
ciones pre-establecidas con las que se pueden generar nuevas variables.
replace Cambia el contenido de una variable ya existente sustituyendola
por una expresion.
6
MANUAL DE STATA 10.0Por: PhD.Eco. Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
encode Cuando una variable esta en formato string (es decir no-numerico) no
se pueden obtener estadısticas sobre ella. encode y su opuesto decode
cambian el formato de una variable string a numerico y viceversa. Alete
nativamente podemos utilizar los comandos tostring y destring los
cuales realizan las mismas funciones pero con mas opciones.
reshape wide, long Este comando transforma la base de datos de una for
mato ancho (wide) a uno largo (long ) y viceversa. reshape puede trans
formar de una base de datos como la siguiente en formato ancho:
Cuadro 2: Datos en formato wide
Xij
id sexo ing80 ing81 ing82
1 0 5000 5500 6000
2 1 2000 2200 3300
3 0 3000 2000 1000
A uno largo como este:
Cuadro 3: Datos en formato long
i j Xij
id ano sexo Ing
1 80 0 5500
1 81 0 5500
1 82 0 6000
2 80 1 2000
2 81 1 2200
2 82 1 3300
3 80 0 3000
3 81 0 2000
3 82 0 1000
7
MANUAL DE STATA 10.0Por: PhD.Eco. Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
keep Seguido por una lista de variables mantiene las variables especificadas
eliminando las no incluidas en la lista. Analogamente el comando drop
elimina las variables que le siguen al comando conservando las no-
incluidas.
5. Combinando Bases de Datos
Muchas veces es necesario combinar dos o mas bases de datos para formar
una sola. Para ello se pueden utilizar los comandos merge o append. merge
une dos bases de datos utilizando una variable en comun. Las dos bases de
datos deben estar en formato .dta (Stata) y las observaciones deben estar
ordenas (utilizando sort) de acuerdo a la variable que sirve como referencia.
El objetivo de merge es anexar variables no observaciones. Por ejemp
lo:
use ds2
sort recid
save ds2, replace
use ds1
sort recid
merge recid using ds2
Lo que este peque˜ odigo nos dice es que carguemos la base de datos ds2no c´
(use) y la ordenemos de acuerdo al identificador recid (sort) y guardemos los
cambios reeplasando ds2 (save). Posteriormente abrimos la segunda base de
datos utilizando el comando use, la ordenemos en base a recid y finalmente
la pegamos (merge) de acuerdo a recid utilizando la base de datos ds2.
En el caso de append sucede lo contrario, lo que se busca es anexar observaciones—
por lo general—a una misma serie de variables. La sintaxis es mucho mas
8
MANUAL DE STATA 10.0Por: PhD.Eco. Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
sencilla pues solo se tiene que nombrar la base da datos que se desea anexar.
Por ejemplo:
append using ndatos
Por ultimo, si se desea contruir una nueva base de datos que contenga in´
formacion condensada de la base original, esto se puede hacer utilizando el
comando collapse. Supanga que tiene una base de datos sobre hogares y que
cada hogar tiene una observacion para cada miembro que lo integra. Si cada
hogar dispone de un identificador unico, entonces se puede formar una base ´
de datos alternativa que contenga una sola observacion por hogar (en lugar
de una observacion por individuo) para cada una de las variables deseadas.
Esta observaci´ on estandar, la suma u on puede contener la media, la desviaci´
otro estadıstico por hogar. Por ejemplo:
collapse (mean) edad educacion ingreso, by(hogar)
El codigo anterior crea una base de datos con cuatro variables (hogar, edad,
educaci´ on por hogar, la cual contiene el promeon e ingreso) con una observaci´
dio de cada variable por hogar.
Comandos : merge, append, collapse
6. Sintaxis y Obteniendo Ayuda
Como lo podemos ver en los ejemplos anteriores, la sintaxis de los comandos
Stata tienen un formato comun. Esta sintaxis es la siguiente:
[by lista de var :] comando lista de var [if expresion] [in rango]
[ponderadores ] [using nombre del archivo], [opciones ]
Sin embargo para la moyor parte del curso s´ onolo necesitaremos una versi´
mucho mas simple como:
[by lista de var :] comandolista de var [if expresion], [opciones ]
9
MANUAL DE STATA 10.0Por: PhD.Eco. Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
El prefijo by permite aplicar el mismo comando separando la base de datos en
subgrupos definidos por lista de var. Posteriormente viene el comando seguido
por una segunda lista de var a las cuales se les aplicara el comando elegido.
Los datos utilizados para evaluar el comando pueden ser limitados con las
opciones if e in. Las opciones especıficas al comando tienen que ser precedi
das por una coma. A lo largo del tutorial se utilizara esta sintaxis de forma
continua de manera que al final del curso el participante estara familiarizado
con ella.
Vea: help language
Otra informacion clave es la forma en que podemos obtener ayuda. Todos
los comandos Stata tienen informacion acerca de la manera en que deben
utilizarce (sintaxis y opciones); para acceder a ella es s´ on de esolo cuesti´
cribir la palabra help seguida por el nombre del comando en la ventana
de comandos de Stata. Si no conoce el nombre del comando que realiza la
tarea que tiene en mente, escriba la palabra findit seguida por una palabra
que este relacionada con dicha tarea. Este comando busca en toda la docu
mentaci´ agina red de on tanto interna como aquella que se encuetra en la p´
Stata. Adicionalmente, existen p´ acticos,aginas de internet con materiales did´
estos son algunas de las mas importantes:
http://www.stata.com/support/
http://www.stata.com/support/faqs/
http://www.ats.ucla.edu/stat/stata/sk/
http://www.ats.ucla.edu/stat/stata/
http://ideas.repec.org/s/boc/bocode.html
Stata se actualiza casi continuamente, los usuarios pueden escribir programas
y mandarlos al archivo de SSC (Statistical Software Components), por lo
tanto es necesario hacer actualizaciones de forma regular. El comando update
10
MANUAL DE STATA 10.0Por: PhD.Eco. Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
query le indicara si es necesario hacer actulizaciones.4
7. Resumen
En esta primera sesi´ as b´ on aprendimos los puntos m´ asicos del funcionamien
to de Stata incluyendo la importaci´ on y el manejo de bases on, tranformaci´
de datos. Otros puntos clave consistieron en el procedimiento para cargar las
bases de datos en formatos diferentes a Stata, ası como asignar la suficiente
memoria y tama˜ alino de matriz para cargar los datos y llevar al cabo el an´
sis. La combinaci´ on de nuevas variables on de bases de datos y la generaci´
utilizando las expresiones del comando generate fueron entre las tareas mas
importantes de la sesion.
4Para hacer las actualizaciones es necesario que su computadora este conactada a la
red; si su conexion utiliza un proxy, tiene que configurar Stata, vea help netio.
11
MANUAL DE STATA 10.0Por: PhD.Eco. Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Introduccion a Stata
Clase 2: Estadısticas Descriptivas y Graficos
1. Introduccion
En esta sesion del curso presentamos las distintas herramientas que se pueden
utilizar—como un primer paso—para analizar los datos. Las dos formas mas
usuales de empezar un analisis estadıstico son las tablas con estadısticas
descriptivas y el an´ afico.alisis gr´
2. Tablas con Estadısticas Descriptivas
codebook es un comando muy util para empezar a analizar la base de datos.
Si no se especifica una variable codebook presenta estadısticas descriptivas
sobre cada una de las variables en la base de datos, alternativamente se puede
obtener informaci´ olo alguna(s) variable(s) en particular escribiendo on sobre s´
el nombre de la(s) variable(s) despues de codebook. Un comando alternativo
1
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
que presenta estadısticos similares a codebook pero de forma resumida es
summarize. Aqui se presenta un ejemplo del comando summarize:
sysuse auto
summarize price mpg
Cuadro 1: summarize
Variable Obs Mean Std. Dev. Min Max
price 74 6165.25 2949.49 3291 15906
mpg 74 21.29 5.78 12 41
El cuadro 1 presenta informaci´ umero de observaciones, la meon sobre el n´
dia, desviacion estandar y el rango de las variables. Muchas veces necesitamos
crear una tabla con determinados estadısticos descriptivos, para hecer esto se
puede hacer uso de los comandos tabstat o table. Estos comandos tienen
mucha flexibilidad no solo en los estadısticos que se pueden incluir pero tam-
bien en el formato en que estos se presentan como se puede ver en el siguiente
ejemplo:
sysuse auto
tabstat price mpg trunk weight, statistics(mean n sum sk
median)
Cuadro 2: tamstat
Variable price mpg trunk weight
mean 6165.25 21.29 13.75 3019.45
N 74 74 74 74
sum 456229 1576 1018 223440
skewness 1.65 .948 .029 .148
p50 5006.5 20 14 3190
2
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
El comando inspect es una forma sencilla de obtener informacion sobre
la distribuci´ nas gr´on de una variable. Presenta peque˜ aficas con puntos de
frecuencias relativas y algunos estadısticos sobre el numero de observaciones
distintas de cero, etc. tabulate, por otro lado, realiza tablas con frecuencias
y presenta varios estadısticos de correlacıon entre dos variables previamente
seleccionadas:
sysuse auto
tabulate rep78 foreign
Cuadro 3: tabulate
Repair record Car type
1978 domestic foreign Total
1 2 0 2
2 8 0 8
3 27 3 30
4 9 9 18
5 2 9 11
Total 48 21 79
Comandos : codebook, summarize, inspect, tabstat, table, tabulate
2.1. Estadısticos de Momentos
Toda distribuci´ ason puede ser inferida por sus momentos. Los momentos m´
utilizados son el primero (la media) y el segundo (la varianza). En la seccion
anterior vimos como podemos obtenerlos. Para probar estadısticamente la
diferencia entre dos medias provenientes de distribuciones independientes, es
necesario utilizar informacion acerca del segundo momento. Esto se puede
llevar al cabo utilizando el comando ci para formar intervalos de confianza
3
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
de las medias y ver si se intersectan o no. La no interseccion quiere decir que
no hay evidencia suficiente para rechazar la Ho: igualdad de medias.
Los momentos tercero y cuarto de la distribucion tambien nos dan infor-
maci´ on es on valiosa. La skewness o tercer momento nos dice si la distribuci´
simetrica con respecto a la media. Valores de este estadıstico iguales a cero
indican una distribucion simetrica mientras que valores mayores (menores)
a cero indican que la cola de la distribucion esta sesgada hacia la derecha
(izquierda). La kurtosis o cuarto momento, mide la densidad que se concen
tra en las colas ; una distribucion normal (del tipo Gauss) tiene una kurtosis
igual a tres. Valores que difieren de la normal se dice que tienen colas con
algunos picos (no nos referimos a picos en sentido estricto—numero infinito
de derivadas—sino solo a vecindarios en donde la distribucion no es tan suave
como la normal.)
Para obtener informaci´ on podemos on hacerca de los momentos de la distribuci´
usar el comando summarize con la opcion detail. Pruebas para normalidad
de una distribucion—en base al tercer y cuarto momento—se pueder realizar
utilizando el comando sktest.
Comandos : ci, summarize, sktest
3. Graficos
La mejor manera de resumir la informacion contenida en los datos es haciendo
un an´ afico de los mimsos. Stata tiene un gran n´ aficasalisis gr´ umero de gr´
siendo scatter, twoway, histogram y kdensity entre los comandos mas
utlizados.
Las graficas twoway pueden presentarse de diferentes maneras, una de las
mas comunes es en forma de puntos.1 El comando scatter se utiliza en el
siguiente ejemplo para observar como se ha comportado la expectiativa de
1Los siguientes ejemplos se pueden aplicar a gr´ areas o barras. aficas de lineas, ´
4
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
40
45
50
55
60
65
life e
xpecta
ncy
1900 1910 1920 1930 1940Year
40
45
50
55
60
65
life e
xpecta
ncy
1900 1910 1920 1930 1940Year
vida al nacer (le) a travez del tiempo (year). La base de datos (uslifeexp2)
que usamos para realizar la grafica 1 es una de las que provee el sistema
(integradas en Stata) y es llamada utilizando el programa sysuse. En el
segundo rengl´ afica del tipo on del ejemplo especificamos que queremos una gr´
“scatter” que relacione las variables le y year.
sysuse uslifeexp2, clear
scatter le year
Figura 1: Grafica en forma de Puntos
O bien estos puntos se pueden unir utilizando la opcion connect:
scatter le year, connect(l)
Figura 2: Grafica en forma de Puntos Unidos
5
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
50
60
70
80
50
60
70
80
0 10000 20000 30000 40000
0 10000 20000 30000 40000
Eur & C.Asia N.A.
S.A.
Life e
xpecta
ncy a
t birth
GNP per capitaGraphs by Region
010
20
30
40
50
60
Fre
quency
5,000 10,000 15,000 20,000 25,000Volume (thousands)/x
mean−1 s.d. +1 s.d.−2 s.d. 17,493Volume (thousands)
La mayorıa de las opciones gr´ alisis por grupos utilizando aficas permite un an´
el comando by:
scatter lexp gnppc, by(region)
Figura 3: Grafica por Grupos
Histogramas de frecuencias y distribuciones de densidad kernel pueden ser
graficados utilizando los comandos histogram y kdensity respectivamente.
Tambien es posible combinar ambas funciones en un s´ afico como se olo gr´
muestra en el siguiente ejemplo:
histogram volume, freq kdensity xaxis(1 2) ylabel(0(10)60,
grid) xlabel(12321 "mean"9735 1 s.d."14907 "+1 s.d."7149
2 s.d."17493)
Figura 4: Histograma y Kernel
6
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Note como dentro de las opciones de histogram se incluye el formato freq
indicando que la altura de las barras del histograma miden el numero de
observaciones en cada rango (las frecuencias). La opcion kdensity le dice a
Stata que queremos una funcion de densidad del tipo kernel superimpuesta
al histograma. Las otras dos opciones, ylabel y xlabel son solo los tıtulos
de los ejes.
El intervalo que define el area de las barras de histogram puede ser ajustado
utilizando las opciones bar y width. Si se reduce el area de las barras de
un histograma hasta formar una grafica con lineas en lugar de barras, el
resultadeo es una distribucion de densidad en lugar de frecuencias. La forma
en que pasamos de un gr´ un la afico de frecuencias a uno de densidad varia seg´
tecnica utilizada, siendo el metodo kernel uno de los mas comunes. La ventaja
de utilizar densidades kernel es que no se impone ninguna estructura, ya que
la linea que produce lo hace utilizando estadısiticos no parametricos.
aficas de Stata le permiten a˜Las opciones gr´ nadir marcos, tıtulos a los ejes,
cambiar de colores las distintas varibles graficadas, elegir la escala de los ejes,
etc. (vea help twoway options.)
Comandos : graph, twoway, scatter, histogram, kernel
4. Resumen
En esta sesi´ on de on exploramos varias opciones para comenzar una inspecci´
la base de datos. Lo m´ un es empezar un an´as com´ alisis produciendo tablas
con estadısticos descriptivos y de corralacion simple entre dos variables; los
comandos summarize, tabstat y tabulate son los ideales para estas tareas.
Por otro lado, vimos c´ aficos de puntos y lineas relacionanomo producir gr´
do dos variables, asi mismo, aprendimos a graficar frecuencias relativas y
densidades usando histogram y kernel repectivamente.
7
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Introduccion a Stata
Clase 3: Analisis de Regresion Lineal
1. Introduccion
En esta clase aprenderemos a realizar regresiones en Stata incluyendo vari
ables dummy e interacciones como determinantes. Veremos las diferentes
hipotesis que podemos evaluar justo despues de haber corrido el modelo.
Otra parte fundamental del an´ on es obtener los diagn´alisis de regresi´ osticos
necesarios para probar si el modelo cumple con los supuestos clasicos de Mıni-
mos Cuadrados Ordinarios (OLS, por sus siglas en ingles.) El que se rompa
con uno o mas de los supuestos de OLS tiene diferentes repercusiones sobre
el valor de los parametros en algunos casos o sobre la inferencia estadıstica
en otros.
En esta documento, al contrario de los dos anteriores, casi no se presen
tan ejemplos, concentr´ as en los comandos que podemos utilizar andonos m´
en Stata para realizar las distintas tareas dejando para el ejercicio la im-
plementaci´ atica. El documento se divide en cinco aparatados dedicando on pr´
1
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
uno para el comando reg, otro para el prefijo xi, seguido por los diagnosticos
(regdiag), estimaciones con errores estandar robustos (robust), pruebas de
hip´ on del modelo (predict).otesis (test) y finalmente la predicci´
2. Regresion
Si, basados en una relaci´ orica, tenemos elementos para suponer que las on te´
variaciones en y son causadas por las variaciones en x, podemos utilizar el
an´ on para probar esta relaci´alsis de regresi´ on estadısticamente. En forma muy
simple, lo que la regresi´ onon hace es encontrar los parametros de la ecuaci´
y = α + βx + � tal que la sumatoria de errores al cuadrado sea mınima (de
ahı su nombre OLS.) Esto se realiza en Stata utilizando el comando reg
seguido por y y x en donde x puede tener mas de un elemento (es decir se
pueden incluir cuantas variables independientes se quiera—dado un numero
finito de grados de libertad.) Por ejemplo si estamos interesados en la relacion
ente ingreso y y educacion s escribimos en Stata:
reg y s
Comando: reg
3. Variables Dummy y el Prefijo xi
El modelo anterior es el m´ as probable as sencillo que podemos estimar, lo m´
es que no tome en cuenta muchas otras variables que estan determinando el
ingreso. Por ejemplo si pensamos que el ingreso de los hombres es mayor al
percibido por las mujeres entonces podemos correr el siguiente modelo:
reg y s m
En donde m es una variable indicador (dummy) la cual toma el valor de 1
si la observacion corresponde a una mujer y cero de lo contrario. Utilizando
2
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
datos de la ENIGH se arrojaron los siguientes resultados:
Cuadro 1: regress
Variable Coefficient (Std. Err.)
yschooling 1147.498 (11.927)
mujer -2844.586 (109.824)
Intercept -936.559 (109.701)
En terminos de nuestro modelo, y = α + βs + δm + �, si δ es diferente de
cero (lo que es cierto en nuestro ejemplo) entonces quiere decir que hay evi
dencia suficiente para afirmar que los ingresos de las mujeres difieren del de
los hombres controlando por el nivel de educaci´ un nuestros resultaon. Seg´
dos un a˜ on formal representa un incremento de $1,147 no extra de educaci´
pesos en el salario trimestral y las mujeres ganan, en promedio, $2,844 pesos
menos que los hombres. Ahora suponga que se introduce una variable discre
ta (llamemosla sector) tomando valores del 0 al 6 indicando cada una de las 7
industrian en la muestra. A partir de sector se podrıan contruir 7 variables in
dicadores tomando cada una el valor de 1 cuando la observacion corresponde
a un trabajador de determinada industria y cero de otra forma. Sospechamos
que el ingreso varıa entre industrias y no solo eso sino que el retorno a la
educacion (medido por β en nuestro modelo) tambien toma valores diferentes
dependiendo de la industria. Para probar esto podemos generar variables de
interaccion entre x y los 6 diferentes indicadores de industria o bien utilizar
el prefijo xi. El modelo que estimaremos es el siguiente:
y = α + βs + δm + φ0I0 + . . . + φ5I5 + γ0(s)I0 + . . . + γ5(s)I5 + � (1)
En donde I son los indicadores para cada industria. En Stata este modelo se
correrıa de la siguiente forma:
xi: reg y m i.sector*s
3
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Los resultados son presentados en el siguiente cuadro:
Cuadro 2: xi reg
Variable Coefficient (Std. Err.)
Isector 0 2707.292 (315.385)
Isector 1 3089.960 (299.282)
Isector 2 3658.951 (1029.817)
Isector 3 3570.618 (474.277)
Isector 4 183.165 (377.134)
Isector 5 1419.964 (384.152)
yschooling 1367.352 (21.367)
IsecXyscho 0 -932.026 (37.764)
IsecXyscho 1 -1239.702 (41.611)
IsecXyscho 2 320.377 (102.659)
IsecXyscho 3 -629.909 (59.936)
IsecXyscho 4 120.991 (40.711)
IsecXyscho 5 -532.240 (41.359)
mujer -2927.649 (111.873)
Intercept -1545.552 (240.282)
Las primeras 6 varaibles en el cuadro 2 (con el prefijo I) miden el impacto
que tienen las diferentes industrias (o sectores) sobre el intercepto α, mientras
que las las que le siguen a la variable “yschooling” miden el impacto sobre
la pendiente β. Si solo nos interesara el impacto sobre la pendiente entonces
el modelo se hubiera estimado incluyendo i.sector sin el asterisco seguido
por la variable educacion.
Opcion: xi
4
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
�
4. Diagnosticos
Para que los resultados obtenidos por reg sean validos es necesario que se
cumplan los supuestos clasicos de OLS, es decir, normalidad en los residuales,
hemosedasticidad, no autocorrelacion (en el caso de series de tiempo) y no
multicolinealidad entre otros.
osticos de la regresi´Los diagn´ on son obtenidos justo despues de la prueba es
cribiendo cualquiera de los siguientes comandos: hettest para heterosedas
ticidad, vif para multicolinealidad y ovtest para variables omitidas y es
pecificacion incorrecta.
1. hettest Esta prueba utiliza los residuales obtenidos de la regresion
original, los eleva al cuadrado y posterirormente los corre contra las
variables independientes. De este segundo modelo se obtiene un es-
tadıstico de pueba con distribucion F. Esto es lo que se conoce como
la prueba Breusch-Pagan (1980).
2. ovtest Realiza lo prueba RESET, Regression Specification Error Test,
[Ramsey 1969]. En esta prueba se agregan polinomios de valores ajus
tados para y. Suponga el modelo y = α + βx + � de aquı se obtienen
los valores estimados y, se crean las variables de orden dos o mayor 2 3 y yy , y , . . .. Se corre el modelo alternativo: y = α + βx + ˆ2 + ˆ3 + . . . + �
y por ultimo se prueba el modelo alternativo contra el original utilizan
do un estadistico F. Si el primero es preferido al segundo, entonces
tenemos un problema de especificacion.
3. vif Esta prueba presenta la proporcion de la varianza total de cada
una las variables independientes que no es explicada por las variables
independientes restantes (Variance Inflation Factor.) El procedimiento
consiste en crear regresiones del tipo xi = α + βxj + ε, i = j; j =
1, 2...J en donde xi y xj son regresores en el modelo original. De los
resultados de esta regresion, se calcula el estadıtico R2, el valor vif es
igual a (1 − R2). Valores altos de vif nos indican que gran parte de la
5
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
variacion en xi no es explicada por variaciones en las restantes xj por
lo tanto no hay evidencia para afirmar que tenemos un problema de
multicolinealidad.
Comandos : hettest, ovtest, vif
5. Violacion de los Supuestos OLS
Si alguno de los diagnosticos nos indican la presencia de un problema con
los supuestos OLS, hay varias formas de lidiar con el problema. Aquı pre
sentamos las tecnicas mas comunes. El problema de heterosedasticidad, se
da cuando la varianza de los errores no es constante, por lo tanto los inter
valos de confianza que utilizamos para probar hipotesis (compuestos en base
a la varianza del error) tampoco van a ser constantes impidiendo con ello
toda inferencia estadıstica. Corregir este problema es relativamente sencil
lo, en Stata se utiliza la opci´ on de regresi´on robust al final de la ecuaci´ on
para que Stata calcule errores estandar robustos (es decir corrigiendo por
heterosedasticidad.) La tecnica que se utiliza es la conocida como Huber-
White o sandwich. Este procedimiento permite corregir para heterosedas
ticidad de cualquier tipo sin tener que especificar la forma fucnional de la
misma. Normalmente la varianza estimada de los parametros esta definida ˆ on robust es utilizada la varianza como V ar(β) = σ2/SST 2, cuando la opci´
es reeplazada por la siguiente expresion: �n ˆ2 2u
ˆV ar(β) = i=1 rij ij
SSR2 j
En donde rij son los residuales de la regresion de xi contra el resto de las
variables independientes; uij son los residuales de la ecuacion original y SST 2
es la sumatoria de errores al cuadrado. La flexibilidad de la expresion ante
rior est´ u2a contenida en el termino ˆij el cual, evidentemente, varıa para cada
observacion ajustando ası cualquier cambio en varianza.
6
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
El problema de mutlicolinealidad es mas sutil ya que—a diferencia de la
heterosedasticidad—este es un problema de grado. En otras palabras, siem
pre vamos a observar que dos o mas variables independientes estan correla
cionadas entre si, sin que ello implique, necesariamente, un problema serio.
Hay ciertos sıntomas que nos permiten identificar el problema. Uno de ellos y
el m´ un es que los signos y valores de los par´as com´ ametros estimados cambian
mucho al anadir o eliminar variables al modelo. Como ya lo vimos, otra for
ma de identificar el probelma es utilizando el diagn´ un con esta ostico vif. A´
prueba la decision de si existe un problema o no es, hasta cierto punto, subje
tiva ya que no se utiliza un estadıstico de prueba con un ditribucion conocida
para realizar inferencia estadıstica. Si creemos que hay un problema de mul
ticolinealidad en nuesto modelo tenemos varias alternativas, lo mas sencillo y
obvio es eliminar una (o mas) de la variables que estan correlacionadas. Otra
tecnica un poco mas elegante es utilizar variables instrumentales (ivreg).
Esto lo veremos en la sesion 5 del curso.
Quiz´ as grave de los tres que estamos tocando, sea el de as el problema m´
especificacion o variables relevantes omitidas. La existencia de este proble
ma causa sesgo en nuestros par´ oticasametros y elmina las propiedades asint´
(no es consistente) del modelo OLS. La correccion de este problema hace
uso de la teorıa econ´ on del investigador para omica combinada con la intuici´
seber identificar la forma funcional correcta y/o las variables relevantes que
han sido omitidas. Muchas veces el problema esta relacionado con las re
stricciones que imponemos de manera implıcita al plantear la forma fun
cional del modelo. Por ejemplo, corremos un modelo de salarios como fun
on del nivel de educaci´ci´ on, la experiencia y la experiencia al cuadrado,
y = α + β1edu + β2exp + β3exp2 + �. Suponga que tomamos como muestra
a todos los asalariados entre 15 y 65 anos, estamos imponiendo implıcita-
mente la restricci´ on (β1) son iguales entre on de que los retornos a la educaci´
hombres y mujeres, estratos urbano y rural, sectores economicos, etc. Si la
prueba ovtest nos rechaza la hipotesis nula de no variables omitidas en el
modelo anterior, entoces muy probablemente se deba a que hay diferencias
7
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
importantes en los retornos a la educacion (u otras parametros) entre las
categorıas mencionadas. En la practica siempre hay una disyuntiva entre la
parsimonia y la flexibilidad de un modelo. Lo primero me permite una inter
pretacion clara de cada uno de los parametros y hay un beneficio en grados de
libertad; lo segundo por otro lado, toma en cuenta todas aquellas diferencias
en parametros que se esconderıan detras de un modelo reducido, es aquı en
donde entra la intuicion del investigador para encontrar el modelo que mejor
describa los datos.
Opciones : robust, ivreg
6. Prueba de Hipotesis
Una vez resuelto el problema con los supuestos OLS, el segundo paso de-
spues de realizar el an´ on es el de llevar al cabo pruebas de alisis de regresi´
hip´ ametros. El comando test nos permite probar no otesis acerca de los par´
solo la significancia estadıstica de cada parametro sino tambien la diferencia
con respecto a un valor diferente de cero o cualquier otra expresion numerica
y respecto a una combinacion lineal de otros coeficientes. Por ejemplo de-
spues de estimar el modelo que se presenta en el cuadro 2, pordrıamos estar
interesados en probar que el coeficiente del sector 3 es el doble de la suma
de los coeficientes para los sectores 4 y 5. Esta hipotesis es estimada en Sta
ta de la siguiente manera: justo despues de estimar el modelo de regresion,
escriba:
Comandos : predict, e(sample)
test Isector 3 = 2*( Isector 4 + Isector 5)
Comandos : test
8
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
7. Prediccion
El ultimos de los comandos post-regresi´´ on, es predict. Como su nombre lo
indica, este comando se utiliza para crear una nueva variable, llamemosla y ˆla cual es creada con los valores ajustados βx del modelo y = βx + �. El
comando tmbien permite crear variables con errores estandar de la predic
on lineal utilizando la opci´ci´ on stdp. Siguiendo con nuestro ejemplo, despues
de la regresi´ y con los valon escriba predict yhat para crear la variable ˆ
ores ajustados. La predicc´ a para todas las observaciones cuyas on se realizar´
variables independientes no tengan valores en blanco sin importar que no
hayan sido tomados en cuenta al estimar la regresion. Para aclarar, suponga
que los resultados que se presentan en el cuadro 2 solo toman datos de ar
eas urbanas; el comando predict crear´ y para toda la poblaci´a la variable ˆ on
(siempre y cuando haya informacion sobre las variables independientes.) Para
limitar la prediccion a la muestra de donde provienen los resultados, utilice
la limitante if e(sample) como se muestra a continuacion: predict yhat
if e(sample).
Referencias
[1] Hamilton, L. C. (2004) ‘Statistics with Stata. Updated for version 8’,
Thomson. (Capıtulos 6, 7 y 9)
[2] Wooldrich, J. M. (2003) ‘Introductory econometrics: A modern ap
proach, 2e’, Thomson. (Capıtulos 2, 3, 4 y 8)
9
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Introduccion a Stata
Clase 43: Modelos con Variables Discretas
1. Introduccion
El objetivo de la sesion es el de ilustrar la manera de estimar modelos cuya
variable dependiente toma valores discretos. Este tipo de modelos son muy
utilizados en economıa laboral aplicada para encontrar los determinantes de
la participaci´ on laboral. Los dos tipos de modelos con variables on y ocupaci´
discretas son los binomiales (es decir dos alternativas) y los multinomiales.
Las tecnicas utilizadas para estimar este tipo de modelos difieren del conven
cional OLS ya que la discontinuidad de la variable dependiente implica una
relacion no lineal. El documento hace enfasis en la teorıa que hay detras de
on ası como la mec´la estimaci´ anica de la misma. Se ilustra con un ejemplo
en donde estimamos la participaci´ on laboral usando datos de la on y ocupaci´
ENIGH. *[email protected]
1
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
2. Teorıa
2.1. Problema Binomial
Suponga que esta interesado en encontrar los determinantes de una variable
indicador (dummy), y, la cual toma el valor de 1 si se cumple con determi
nado criterio y 0 de otra forma (por ejemplo, en el mercado laboral en donde
el investigador codifica como 1 a los empleados y 0 a los no-empleados.) Si
se estima el modelo y = Xβ + � usando una regresion OLS, el cual se conoce
con el nombre de modelo probilidad lineal, se presentaran los siguientes prob
lemas:
1. Valores fuera del rango (0,1), lo cual no tiene ninguna logica desde el
unto de vista de la teorıa de probabilidad.
2. Heterosedasticidad
3. Los residuales no se distribuyen de forma normal, por lo tanto no hay
eficiencia, es decir, minimizaci´ noon de varianza a medida que el tama˜
de muestra aumenta.
Para resolver estos problemas se asume que hay una variable latente, no ob∗, que determina el valor de la variable dic´iservable, y otoma que observamos.
Formalmente:
� 1
yi = ⇐⇒ y∗i = X iβ + νi > 0
0 otherwise
De esta manera, la realizacion de la variable que observamos se va a dar si y
s´ on de la muestra. La probabilidad de olo si νi > −X iβ para cada observaci´
que la condicion anterior ocurra:
P rob(yi = 1) = P rob(νi > −X iβ)
2
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Definiendo a F (·) como la funcion de densidad acumulada (FDA) de la dis
tribucio de los residuales νi:
P rob(yi = 1) = 1 − F (−X iβ)
Analogamente, la probabilidad de observar yi = 0
P rob(yi = 0) = F (−X iβ)
La forma de F (·) va a depender del supuesto que utilicemos sobre la dis
tribucion de νi. Si asumimos que νi se distribuye de forma normal, entonces
F (−X iβ) es el area debajo de la curva de la normal hasta el punto −X iβ
y el modelo es conocido con el nombre de probit. Para obtener los paramet
ros del modelo, β, tenemos que utilizar tecnicas de maxima verosimilitud.1 Si
definimos a Φ como la FDA de la normal, entonces la funcion de verosimilitud
es definida de la siguiente forma:
L =n�
1 − Φ(−X iβ) n�
yi=0
Φ(−X iβ) yi =1
Los par´ on no son interpretados de manera ametros obtenidos de esta estimaci´
directa, para ver el impacto marginal de un cmabio en xik sobre la probabil
idad de observar yi = 1, se tiene que hacer el siguiente calculo:
∂Φ(X iβ) = φ(X iβ)βk (1)
∂xik
En donde φ(·) est´ on de densidad de la probabilidad. a definido como la funci´
Como podemos ver, el impacto marginal varıa dependiendo del punto en la
distribucion normal en donde se encuentre el umbral X iβ; puntos cercanos
1Lo que este procedimiento hace es maximizar una funcion que se determina por cam
bios en los par´ ametros convergen cuando la funci´ametros, los valores de los par´ on de
verosimilutud es maximizada, para mas detalles ver Hogg and Craig (1994) ‘Introduction
to Mathematical Statistics’, Prentice Hall.
3
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
a la media tienen un impacto mucho mayor comparados con aquellos que se
encuentran en las “colas” de la distribucion.
Otro supuesto de distribuci´ unmente utilizado para estimar la variable on com´
latente, yi∗, es asumir que F (·) = exp(−e−νi ) esta es la FDA de la distribucion
logistic. Esta distribuci´ on es on no difiere mucho de la normal y su estimaci´
mucho mas sencilla ya que su FDA tiene una forma “cerrada” (es decir en su
solucion no intervienen integrales, lo cual es el caso del modelo probit.) En
este caso, la probabilidad est´ on:a dada por la siguiente expresi´
exp(X iβ)P rob(yi = 1) = P rob(1 − X iβ) = (2)
1 + exp(X iβ)
La forma de estimar el modelo logit es la misma que para el modelo probit,
es decir, utilizando maxima verosimilitud introduciendo las probabilidades
definidas por la ecuaci´ ametros estimados por logit van a diferir on (2). Los par´
un poco de los encontrados por el modelo probit, ya que las distribuciones—
aun y que son muy similares—no son identicas. Al igual que con el modelo
probit, el impacto marginal de cada variable va a depender del punto en la
distribucion en el que lo estamos evaluando:
∂ �L(X iβ) exp(X iβ) = βk (3)
∂xik [1 + exp(X iβ)]2
Los parametros encontrados por los modelos probit y logit se ajustan de tal
manera que la proporcion de 1s observada es igual a la probabilidad predicha
por el modelo latente:
n�ni=1 yi
= �
pi n
i=1
Esta propiedad nos sirve de referencia para revizar la bondad de ajuste del
modelo. Sin embargo, el estadıstico mas utilizado para evaluar el ajuste del
4
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
�
modelo es el pseudo-R2 que es el quivalente al R2 en una regresion OLS. Este
estadıstico esta definido de la siguiente manera:
LΩ ωpseudo − R2 =
2/n − L2/n
1 − L2/n ω
En donde LΩ y Lω son los valores de la funci´ axima verosimilitud on de m´
con el modelo completo y con un modelo de solo una constante, respecti
vamente. El estadıstico pseudo-R2 reporta el incremento en la verosimilitud
que esta explicado por las variables incluidas en el modelo.
Como ya lo explicamos, los modelos probit y logit arrojan estimaciones sobre
el modelo para la variable latente. Para comparar estos resultados con los
observados tenemos que pasar de los resultados de una variable continua a
una discreta, esto se logra de manera sencilla toda vez que la probabilidad
ha sido estimada. Aquellos valores cuya P rob(yi = 1) > 0,5 se les asigna un
valor de 1 y 0 de lo contrario. Este es, probablemente, la evaluacion de ajuste
m´ on de casos en los cuales la predicci´as estricta ya que nos da la proporci´ on
es la correcta.
2.2. Problema Multinomial
Hasta ahora hemos discutido la estimacion de variables dependientes discre
tas que toman s´ on se puede generalizar olo dos valores (0 o 1). Esta discusi´
de forma sencilla al problema mulitnomial. Para hacerlo, tenemos que pen
sar en el problema multinomial como una serie de problemas binomiales, es
decir, evaluar la probabilidad de la alternativa j en contra de la alternativa
i, ∀ j = i. Defina esta probabilidad de la siguiente manera:
Pj = F (Xβj )Pj + Pi
Entonces:
Pj = F (·)(Pj + Pi)
5
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
�
���
�
�
Pj F (·) =
1 − F (·) = G(Xβj )Pi
1� Pj =
1 − Pi =
Pi − 1
Pi Pij=i
1 =
� G(Xβj ) + 1
Pi j=i �−1
Pi = G(Xβj ) + 1 j=i
G(Xβj ) (4)↔ Pj =
1 + �
i=j G(Xβi)
En principio la ecuaci´ onon (4) puede ser estimada bajo cualquier especificaci´
de la funcion G(·). Sin embargo si asumimos que los residuales del modelo
Xβj +νi se distribuyen logistic, entonces la estimacion se vuelve muy sencilla.
Para encontrar las probabilidades Pj solo tenemos que substituir el termino
exp(Xβj ) en lugar de la funcion G(·) y llegamos al modelo multinomial logit.
La estimaci´ aximaon de un modelo multinomial logit se realiza en base a m´
verosimilitud en donde la ecuacion a maximizar es la siguiente:
n
L = �
Pi1Pi2 . . . Pim
i=1
Es facil de ver porque el supuesto de distribucion logistic simplifica mucho
la estimacio. Por ejemplo, si hubieramos asumido que los residuales νi se
distribuyen de forma normal, hubiera sido necesario encontrar soluciones de
integrales multiples para resolver la ecuacion de verosimilitud, esto en un
marco de 4 o mas alternativas se vuelve casi imposible.2
2En la actualidad hay muchas otras tecnicas para estimar modelos mucho mas
complejos y apegados a la realidad que el multinomial logit sin embargo su
on quedan fuera del alcance del curso. Para modelos m´discusi´ as recientes vea:
http://www.econ.cam.ac.uk/faculty/weeks/index.htm
6
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
3. Participacion Laboral
En esta secci´ omo podemos utilizar los modelos discretos que exon veremos c´
plicamos en la seccion anterior utilizando Stata. El planteamiento del proble
ma es el siguiente. Estamos interesados en saber cuales son los determinantes
on laboral en Mexico. Para la estimaci´de la participaci´ on contamos con datos
micro a nivel individual dentro de los hogares (ENIGH).
La variable yi toma el valor de 1 si el individuo i es activo en el mercado
laboral y 0 de los contrario. Observamos al individuo i participar activamente
en el mercado laboral si y solo si y∗ = X iβ + νi > 0. Tradicionalmente, en i
un modelo m´ on a esta variable as estructurado, se le ha dado la interpretaci´
latente como un salario de reserva, en donde el individuo participa siempre
y cuando el salario de mercado sea mayor al mınimo que el esta dispuesto a
aceptar. Estimamos la siguiente ecuacion:
Activoi = α + β1Esci + β2Expi + β3Exp 2 + γZi + νii
El comando para estimar modelos probit y logit en Stata es probit y logit,
respectivamente. Estos comandos son utilizados de la misma forma que us
amos regression. A continuacion presentamos los resultados, primero esti
mando un modelo probit seguido por el logit :
probit active yschooling experience sqexperience north
south hhsize ohhminc
7
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Cuadro 1: Modelo probit
Variable Coefficient (Std. Err.)
yschooling 0.069 (0.002)
experience 0.099 (0.001)
sqexperience -0.002 (0.000)
north 0.039 (0.019)
south 0.004 (0.019)
hhsize -0.005 (0.003)
ohhminc 0.000 (0.000)
Intercept -0.969 (0.036)
N 39655
Log-likelihood -21852.957
χ2 (7) 6270.502
En el siguiente cuadro presentamos los efectos marginales (ecuacion 1 en la
on anterior). Escribimos mfx justo despues de la estimaci´secci´ on (prchange
es una buena alternativa a mfx).
Cuadro 2: Efectos Marginales Modelo probit
Variable dy/dx (Std. Err.) z
yschooling .0242725 .0008 30.51
experience .0347209 .00051 68.06
sqexperience -.0005441 .00001 -53.96
north .0136996 .00666 2.06
south .0014767 .00658 0.22
hhsize -.0016648 .0011 -1.51
ohhminc -2.41e-07 .00000 -2.51
Ahora comparemos con el modelo logit :
8
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
logit active yschooling experience sqexperience north
south hhsize ohhminc
Cuadro 3: Modelo logit
Variable Coefficient (Std. Err.)
yschooling 0.120 (0.004)
experience 0.166 (0.002)
sqexperience -0.003 (0.000)
north 0.068 (0.032)
south 0.009 (0.032)
hhsize -0.006 (0.005)
ohhminc 0.000 (0.000)
Intercept -1.663 (0.061)
N 39655
Log-likelihood -21817.324
χ2 (7) 6341.767
Y los efectos marginales (ecuaci´ on anterior): on 3, secci´
Cuadro 4: Efectos Marginales Modelo logit
Variable dy/dx (Std. Err.) z
yschooling .0249627 .00082 30.60
experience .0346084 .00051 68.11
sqexperience -.0005384 .00001 -53.75
north .0140927 .0067 2.10
south .0019385 .00662 0.29
hhsize -.0013281 .0011 -1.21
ohhminc -2.26e-07 .00000 -2.29
Los resultados muestran que las estimaciones son practicamente las mismas,
9
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
con mismos signos y significancia estadıstica.
Comandos : probit, logit, mfx, prchange
3.1. Ajuste y Prediccion
Para revizar la bondad de ajuste del modelo, el comando post-estimaciones
mas completo es fitstat, el cual presenta una tabla con varios estadısticos
on de verosimilud y el pseudo-R2 los cuales eval´como la funci´ uan el ajuste
del modelo.3
Al igual que con la mayoria de las estimaciones en Stata, el comando predict
genera una variable con los valores ajustados del modelo recien estimado. En
el caso de los modelos discreteos, los valores predichos con la opcion xb,
nos producen el estimado para X iβ de la ecuacion para la variable latente.
Si la opci´ on nos dar´on p es utilizada, entonces la predicci´ a la probabilidad
de exito. Para pasar de este tipo de predicciones de la funcion continua a
una prediccion discreta, es necesario especificar un umbral que divida las
estimaciones de la probabilidad de exito en valores discretos 0 y 1. Lo mas
comun es fijar este umbral en 0.5. Por ejemplo, despues de estimar un modelo
probit, generamos la variable phat con las probabilidades de exito para
cada observaci´ on,on: predict phat, p. Una vez que tenemos esta predicci´
escribimos:
gen ahat = (phat >0.5)
La variable ahat es una variable dicotoma la cual toma el valor de 1 si la
prediccion de la probabilidad de exito es mayor a 0.5 y 0 de otra forma. Una
ves que tenemos esto es facil comaprar los valores predichos y observados
utilizando una tabla con tabulaciones bivariadas: 3Si el comando fitstat no ha sido instalado, escriba net from
http://www.indiana.edu/ jslsoc/stata en la barra de comandos, despues siga
las instrucciones.
10
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
tab ahat active
Cuadro 5: Predicciones Modelo probit
active
ahat 0 1 Total
0 5,647 2,881 8,528
1 7,217 23,910 31,127
Total 12,864 26,791 39,655
Los valores en la diagonal de la tabla son los valores predichos correctamente.
El modelo probit predice 7,217 empleados que en realidad estan inactivos. La
proporcion de observaciones predichas correctamente es de 74 %, lo cual no
est´ on de la variable latente (un pseudoa nada mal dado el ajuste en la ecuaci´
R2 de 0.13).
Comandos : fitstat, predict
4. Ocupacion Laboral
Ahora veremos como podemos utilizar el modelo multinomial para encontrar
los determinantes de la ocupacion laboral. Suponga que estamos dentro del
marco de un modelo estructural, en donde las decisiones de los agentes son
el resultado de un proceso de maximizacion de utilidad. Defina la utilidad—
indirecta—que derivada el individuo i de la alternativa j de la siguiente
manera:
Vij = V (X i, Z�i), ∀ j (5)
En donde X i y Z�i son caracterısticas personales y del hogar del individuo i,
respectivamente. Asumiendo linealidad en la forma reducida de la ecuacion
(5) y definiendo la matriz Z como la matriz conjunta de X y Z�:
11
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
�
Vij = Ziγj + νij , ∀ j (6)
Si existen j = 1 . . . J ocupaciones, entonces observaremos al individuo i elegir
la alternativa j si y solo si:
Vij > max{Vik }, = j (7)∀ k
Es decir el individuo va a elegir la alternativa que maximice su utilidad indi
recta, que en este caso es la variable latente. Si asumimos que los residuales en
on (6) tienen una distribuci´la ecuaci´ on identica e independiente con valores
extremos (distribucion logistic) entonces llegamos al modelo multinomial log
it (ecuacion 4). Como ya lo vimos, en este modelo la probabilidad de observar
al individuo i elegir la alternativa j est´ on:a dada por la siguiente ecuaci´
exp(Ziγj )P rob(i = j) = �
jJ =1 exp(Ziγj )
Definamos el universo de alternativas que tiene el trabajador. La variable occ
va a ser igual a 0 cuando el individuo este inactivo, 1 cuando sea empleado
y 2 cuando sea auto-empleado. Estimamos el siguiente modelo:
mlogit occ yschooling experience sqexperience north
south hhsize ohhminc, b(0)
Los resultados se presentan en el siguiente cuadro:
12
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Cuadro 6: Modelo mlogit
Variable Coefficient (Std. Err.)
Equation 1 : Empleado
yschooling 0.172
experience 0.130
sqexperience -0.002
north 0.160
south -0.056
hhsize -0.020
ohhminc 0.000
Intercept -2.152
(0.004)
(0.002)
(0.000)
(0.034)
(0.034)
(0.006)
(0.000)
(0.065)
Equation 2 : Auto-empleado
yschooling 0.071
experience 0.161
sqexperience -0.002
north -0.164
south -0.007
hhsize -0.002
ohhminc 0.000
Intercept -3.498
(0.006)
(0.003)
(0.000)
(0.047)
(0.045)
(0.008)
(0.000)
(0.095)
N 37938
Log-likelihood -32775.682
χ2 (14) 11507.34
Los resultados que se presentan en el cuadro 6 nos muestran la probabilidad
relativa de que un individuo con determinandas caracterısticas elija se em
pleado o auto-empleado con respecto a estar inactivo. El modelo no puede
estimar las ecuaciones para las tres alternativas, ya que una de ellas debe
de servir como la base, en este caso siendo la categorıa inactivo (notese co
13
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
mo esto ha sido elegido al momento de estimar mlogit e incluir la opcion
b(0).)
Para evaluar el ajuste y obtener otros diagnosticos del modelo utilizamos
el comando mlogtest. Este comando reporta estadısticos de significancia
del modelo y pone a prueba los supuestos acerca de la distribucion de los
residuales νij .
Al igual que en el caso binomial, para obtener valores estimados en forma
discreta tenemos que establecer un criterio. En este caso, como lo indica la
ecuaci´ on es que la opci´on (7), el criterio de evaluaci´ on a elegir es aquella que
maximiza la utilidad del individuo. Por lo tanto una vez que el modelo ha sido
estimado, generamos la variable zhat la cual contiene los valores ajustados del
modelo descrito por la ecuacion (6), esto lo hacemos escribiendo el siguiente
codigo:
predict zhat0-zhat2 if e(sample), p
gen occhat=.
replace occhat = 0 if zhat0 == max(zhat0,zhat1,zhat2) &
e(sample)
replace occhat = 1 if zhat1 == max(zhat0,zhat1,zhat2) &
e(sample)
replace occhat = 2 if zhat2 == max(zhat0,zhat1,zhat2) &
e(sample)
tab occhat occ
Los resultados se presentan en el siguiente cuadro.
14
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Cuadro 7: Predicciones Modelo mlogit
occ
occhat Inactivo Empleado Auto-empleado Total
0 6,122 2,839 410 9,371
1 5,415 14,470 3,657 23,542
3 1,327 1,374 2,324 5,025
Total 12,864 18,683 6,391 37,938
De nueva cuenta las predicciones correctas se encuentran en la diagonal del
cuadro 7. El modelo logra predecir el 60 % de las observaciones correcta
mente.
Comandos : mlogit, mlogtest
Referencias
[1] Hamilton, L. C. (2004) ‘Statistics with Stata. Updated for version 8’,
Thomson (Capıtulo 10)
[2] Hogg and Craig (1994) ‘Introduction to Mathematical Statistics’, Pren
tice Hall
[3] Maddala, G. S. (1983) ‘Limited dependent and qualitative variables in
econometrics’, Cambridge University Press (Capıtulos 1, 2 y 3)
15
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Introduccion a Stata
Clase 5: Analisis de Datos Panel
1. Introduccion
Muchas veces estamos interesados en estimar un modelo que capte no solo las
variaciones entre unidades de observacion (corte transversal) sino tambien la
variaci´ a formada por una serie de cortes on temporal. Si una base de datos est´
transversales en donde estos incluyen las mismas unidades de observacion,
entonces decimos que tenemos una estructura de datos panel. En esta sesion
veremos el tipo de analisis que podemos realizar en Stata para aprovechar
la estructura de datos panel. A lo largo de la sesion cubriremos los sigu
ientes topicos: mınimos cuadrados generales, efectos fijos, efectos aleatorios
y la prueba de Hausman para escoger uno de los modelos. En la aplicacion
pr´ on entre la apertura comercial y la actica trataremos de encontrar la relaci´
desigualdad del ingreso con datos panel para varios paises en el periodo 1970
a 1995. *[email protected]
1
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
2. Estructura de los Datos
Para tener una base de datos con estructura panel es necesario que la misma
unidad de observacion sea monitoreada a traves del tiempo. Por ejemplo si
tenemos informacion sobre un mismo individuo en diferentes puntos en el
tiempo. Cuando se sigue a la misma unidad de observacion en el tiempo,
on que se nos proporciona es m´la informaci´ as rica que aquella en donde
tenemos una serie de cortes transversales. El analisis de panel aprovecha la
informacion extra para tratar de resolver problemas de variables omitidas y
especificacion. Para informar a Stata que nuestros datos tienen una estructura
de panel, podemos utilizar el comando tsset.
Las propiedades asintoticas de este tipo de bases de datos viene dada por el
numero de unidades de observacion (N ), en donde se asume que N → ∞ y
T es pequena.
Comandos: tsset
3. Mınimos Cuadrados Generales
El objetivo del analisis de panel es explotar la estructura de la base de datos
para resolver la siguiente problematica:
yit = X itβ + (error complicado) (1)
El problema es como modelar este residual; diferentes supuestos hacerca de
la estructura y distribucion de los terminos no observados, van a derivar
en diferentes modelos. Si definos los residuales como ui y asumimos que
se distribuyen de forma aleatoria con media µ y varianza σ2, entonces los
par´ on maametros del modelo van a estar definidos por la siguiente expresi´
tricial:
2
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
�
βOLS = (X �X)−1(X �Y ) (2)
Defina la siguiente matriz: Ω = E(uiui�). La matriz Ω permite cualquier
tipo de estrucutra en los residuales sin asumir forma funcional (distribucion)
alguna. El resultado de la minimizacion de estos residuales se conoce con el
nombre de mınimos cuadrados generales, cuyos par´ an definidos ametros est´
de la siguiente manera:
βGLS = (X �ΩX)−1(X �ΩY ) (3)
Mientras la ecuaci´ olo una generalizaci´ on con un on 3 es s´ on de una estimaci´
error que puede ser complicado, el problema estriba en definir Ω. Una vez
que Ω ha sido definido, podemos estimar lo que se conoce con el nombre de
mınimos cuadrados generales factibles (FGLS, por sus siglas en ingles), el
cual puede ser estimado en Stata utilizando el comando xtgls. Una primera
on de Ω puede ser: ˆ ui � oticamente (Nestimaci´ Ω = (ˆ ui), la cual tiende asint´ →
∞) ˆa Ω. Por lo tanto Ω requiere de informacion a priori. Por ejemplo si
asumimos que Ω ∼ i.i.d Ω = I OLS = GLS. ⇒ ⇒
Comandos: xtgls
4. Modelo de Efectos Fijos
Considere el siguiente modelo:
yit = X itβ + c + νit (4)
En donde c es una variables aleatoria no-observada. El problema consiste
en determinar si Cov(xj , c) = 0 ya que si este es el caso, los estimadores
del vector de parametros β estarıan sesgados y serıan inconsistentes. Por el
3
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
�
contrario si Cov(xj , c) = 0 entonces podemos utilizar lo que se conoce como
un “pooled” OLS para encontrar parametros insesgados y consistentes. Por
el hecho que c no es observable, es complicado determinar empıricamente si
existe tal correlacion entre esta y las variables independientes. En el contexto
de corte transversal, tenemos las siguientes opciones:
1. Encontrar un “proxy” para c
2. Instrumentar c
Dentro del marco de panel data, c pudiera ser constante a traves del tiempo y
variando entre cada unidades de observacion, capturando efectos inherentes a
estas (pais, familia, individuo, etc.). Esto es lo que se conoce como un efecto
fijo. El modelo esta definido de la siguiente manera:
yit = X itβ + ci + νit (5)
En donde ci es conocido como el efecto fijo ya que no tiene variacion tempo
ral.
4.1. Estimando los Efectos Fijos
El objetivo del modelo de efectos fijos es lidear con Cov(xj , c) = 0 dado que la
estrucutura del error es uit = ci + νit. Para hecer esto existen varias tecnicas.
Una de las mas comunes es la de variables indicador, la cual consisten en
estimar la ecuacion 5 introduciendo una variable dummy para cada unidad
de observaci´ on es obtener la diferencia con respecto a on. Una segunda opci´
la media:
1. Obtenga la media de los datos (variables independientes y la dependi
ente) a traves del tiempo, X, Y , en donde ¯ xit. ¯ ¯ x = �
tT
¯yi = X iβ + ci + νi (6)
4
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
2. Obtenga la diferencia entre la expresi´ on 5. on para medias y la ecuaci´
¯(yit − yi) = (X it − X i)β + (νit − νi) (7)
Notese que el efecto fijo, ci desaparece al obtener las diferencias.
3. Estime la ecuacion 7 sin constante (ya que esta no varıa en el tiempo,
es eliminada al hacer la diferencia con respecto a la media.)
Una tercera forma de estimar el modelo de efectos fijos es utilizando las
primeras diferencias. Los pasos a seguir son muy similares a los pasos anteri
ores, sin embarago en lugar de estimar 7, estimamos el modelo en primeras
diferencias:
(yit − yi(t−1)) = (X it − X i(t−1))β + (νit − νi(t−1)) (8)
La logica es la misma, eliminar el efecto fijo no observable, ci.
Comandos: xtreg, fe
4.2. Interpretando los Efectos Fijos
Los parametros del modelo de efectos fijos son interpretados como efectos
temporales. Como ya lo vimos, los modelos con datos panel tienen dos fuentes
de variaci´ on entre unidades de observaci´ on temon: la variaci´ on y la variaci´
poral para cada unidad de observaci´ atico cion. Al eliminar el efecto idiosincr´
estamos excluyendo la variaci´ on qued´on entre unidades de observaci´ andonos
solo con variaciones temporales.
Suponga que tenemos un panel de individuos, y estimamos el modelo yit =
βxit + �, lo que nos arrojarıa el modelo de efectos fijos es el cambio en y dado
por un cambio temporal en x para cualquier individuo.
5
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
5. Modelo “Between Effects”
El modelo an´ on total alogo al modelo de efectos fijos es el modelo cuya variaci´
proviene s´ on, elminando olo de las diferencias entre unidades de observaci´
la variacion temporal. El modelo “between effects” (BE) es definido de la
siguiente manera:
¯yi = X iβ + ¯ νi (9)ci + ¯
En otras palabras, el modelo BE no es otra cosa que un OLS el cual toma
s´ on.olo las medias en el tiempo para cada unidad de observaci´
La forma de interpretar los parametros arrojados por el modelo BE es uti
lizando la misma l´ ametrosogica que con el modelo de efectos fijos. Los par´
de BE nos dan el efecto sobre y de un cambio en x entre unidades de obser
vacion. En otras palabras es el efecto de sustituir las caracteristicas observ
ables para un individuo xi, por las de otro individuo xj .
Comandos: xtreg, be
6. Modelo de Efectos Aleatorios
Considere el siguiente modelo:
yit = X itβ + υit (10)
Asuma: E(υit X i) = 0 ∀ t en donde υit = ci + uit, entonces: |
E(ci X i) = E(ci) = 0 ⇔ Cov(ci, X i) = 0 |
Por lo tanto el modelo de efectos aleatorios (RE) asume que el error tiene
una estructura del tipo υit = ci + uit sin embargo supone que el termino
6
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
ci no esta correlacionado con los regresores. La otogonalidad entre ci y las
aX i est´ basada en el supuesto de que la variable ci se distribuye de for
ma aleatoria. Sin embargo el modelo de efectos aleatorios asume que hay
autocorrelacion de la forma:
υit = ci + uit
υi(t+1) = ci + ui(t+1)
El modelo RE se puede interpretar como una combinacion entre el modelo de
efectos fijos (FE) y el BE. RE asume una estructura del error como en el mod
elo de efectos fijos sin embargo asume ortogonalidad entre el termino ci y los
regresores. De hecho podemos probar que βRA = P romedio(βF E , βBE ). De la
misma forma, se puede demostrar que el supuesto que hace RE (Cov(ci, X i) =
0) es equivalente a βRE = βBE .
Comandos: xtreg, re
7. Prueba de Efectos Aleatorios
La prueba para el modelo RE, es equivalente a probar su supuesto implıcito,
esto es: Cov(ci, X i) = 0. Esto lo podemos hacer utilizando la prueba de
Breusch-Pagan (multiplicador de Lagrange), en donde Ho: V ar(υit) = 0.
Esta prueba es implementada en Stata con el comando xttest0.
Una alternativa a la prueba LM es una prueba de Hausman. En donde se
estiman dos modelos: (1) El modelo consistente bajo Ho y Ha, esto es, el
modelo FE; (1) El modelo consistente bajo Ho e inconsistente bajo Ha, el
modelo RE. Una vez estimados ambos modelos, comparamos los valores de
los parametros y si son estadısticamente diferentes, entonce conluimos que el
modelo inconsistente bajo Ha no es el correcto.
Comandos: xttest0, hausman
7
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
Referencias
Wooldridge, J.M. (2002), ‘The econometric analysis of cross section and
panel data’, The MIT Press, Capıtulos: 7 y 10.
8
MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales
Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos
==================================================================================
1
PERFIL PROFESIONAL:Economista, (PhD.) Doctor en Economía, Maestría en Economía Publica, Maestría en Crecimiento y
Desarrollo Económico, Maestría en Econometría, Ingeniero de Sistemas, Maestría en Sistemas.
Sólida experiencia en el área Econométrica- Estadística –Comercio Internacional, Política
Económica, Desarrollo Económico , Política Monetaria, Política Fiscal, Preparación y Evaluación de
Proyectos, Economía Política; experiencia relevante en diseño de metodologías de investigación y
capacitación en aula tanto en el área de Económica como en Sistemas, Estrategia de Recursos
Humanos. Capacitador ESCABO II Júnior Chamber International – Gerente propietario de
Consultora DC CONSULTING especializada Multidisciplinaria en elaboración de tesis de grado a
nivel Licenciatura – Maestrías – Doctorados.
FORMACIÓN ACADÉMICA:
University of
London
(PhD. Eco.) DOCTORADO EN ECONOMIA:
Mención:
ANALISIS ECONOMETRICO PARA EL CRECIMIENTO Y DESARROLLO
ECONOMICO
Análisys Econométric for the Growth and Economic Development
University of London England
Londres – Inglaterra Febrero 2006 a octubre 2007 (Duración 1 año 10 meses
característica semi presencial trimestralmente)
TESIS DE DOCTORADO:
ANALYSIS MULTIVARIANT OF THE BOLIVIAN ECONOMY
Análisis Multivariante de la Economía Boliviana
University of
London
(MSc.Eco.) MAESTRIA EN ECONOMIA:Mención:
ECONOMIA PUBLICAEconomy Public
University of London EnglandLondres – Inglaterra Febrero 2006 a octubre 2007 (Duración 6 meses Primeramención del curso de Doctorado…………………...…………………Titulo N° 029883TESIS DE MAESTRIA:
INTEGRAL TRANSFORMATIONS OF WATSON IN SPACES OF FUNCTIONSAND OF DISTRIBUTIONS
Transformaciones integrales de Watson en espacios de funciones y de
distribuciones
JJoorrggee EEddwwiinngg DDeell CCaarrppiioo GGoonnzzaalleessCCII:: 33447766331111 LLPP 2233//FFeebbrreerroo//11997711
Dirección: C.Almirante Grau N’ 786 zona central San PedroEmail: [email protected] - [email protected]
Celular: 73078849
2
University of
London
(MSc.Eco.) MAESTRIA EN ECONOMIA:
Mención:
CRECIMIENTO Y DESARROLLO ECONOMICO
Growth and Economic Development University of London England
Londres – Inglaterra Febrero 2006 a octubre 2007 (Duración 6 meses Segunda
mención del curso de doctorado …………………………………...…Titulo N° 026720
TESIS DE MAESTRIA:
STRUCTURAL MODELS AND ESTACIONALITY IN HIGH-FREQUENCY
ECONOMIC TEMPORARY SERIES
Modelos estructurales y estacionalidad en series temporales económicas de
alta frecuencia
Richmond
University
(MSc.Eco.) MAESTRIA EN ECONOMETRÍA :
Mención:
ANÁLISIS ECONOMÉTRICO FINANCIERO Y PRONÓSTICO MULTIVARIANTE
DE NEGOCIOS
Analysis Financial Econométric presage of Business Multivariants
Richmond University - London England
Londres – Inglaterra 2005 (4 Meses presencial 4 meses
virtual………………………………………….……………………Titulo N° 3354268
TESIS DE MAESTRIA:
METHODS FOR THE PROCEDURE AND ANALYSIS ECONOMÉTRIC
MULTIVARIANT IN THE BOLIVIAN ECONOMY
Métodos para el procedimiento y análisis Econométrico Multivariante
En la economía boliviana
ITESM
(MSc. Sist) MAESTRIA EN SISTEMAS:
Mención:
SISTEMAS INTELIGENTES, ANÁLISIS Y CAPACITACIÓN EN AULA
Instituto Tecnológico de Estudios Superiores de Monterrey
México DF 1998(julio)-2000......................................... Titulo Nº ITESM356984-IMSC
TESIS DE MAESTRIA:
IMPLEMENTATION OF VIRTUAL SYSTEMS OF TRAINING AND - LEARNING
Implementación de Sistemas Virtuales de Capacitación E- Learning
3
DIPLOMADO EN EDUCACION SUPERIOR
Mención de Maestría :
FORMACION DOCENTE Y DISEÑO CURRICULAR
Universidad de Aquino Bolivia
La Paz – Bolivia 2004 (Abril-Julio) ...........................................Titulo Nº 00069735TESIS DE DIPLOMADO:
EDUCACIÓN Y GLOBALIZACIÓN LOS DESAFIOS PARA EL SISTEMAUNIVERSITARIO
U.M.S.A
Licenciado en Economía:
Carrera de Economía:1990-1995Facultad de Ciencias Económicas y Financieras
Universidad Mayor de San Andrés.La Paz – Bolivia 2003
Titulo Académico Nº 0004520 ------------Titulo Prov. Nal. Nº 0004276TESIS DE LICENCIATURA:
BOLIVIA IN THE PROCESS OF GLOBALIZATIONBolivia en el Proceso de Globalización
ITESM
Ingeniero en Sistemas:
Carrera Ingeniería de Sistemas Computacionales (ISC)
Instituto Tecnológico de Estudios Superiores de Monterrey
México DF 1995– 1997............................................ Titulo Nº ITESM225812-ISC
TESIS DE LICENCIATURA:
METHODOLOGY IN THE IMPLEMENTATION SOFTWARE FOR THE CREATION
OF VIRTUAL TUTORSHIPS FOR LEARNING
Metodología en la implementación de software para la creación de tutorías
virtuales para aprendizaje
CURSO Y SEMINARIO INTERNACIONAL DE FORMACION PEDAGOGICA:
PERFIL DOCENTE DEL SIGLO XXIUniversidad Mayor Real Pontificia San Francisco Xavier de Chuquisaca
(U.M.R.P.S.X.)
Sucre – Bolivia 2005
SEMINARIO INTERNACIONAL DE FORMACION PEDAGOGICA:
COMUNICACIÓN NO VERBALUniversidad Publica y Autónoma del Alto
(U.P.E.A.)
La Paz – Bolivia 2004
IDIOMAS:Español (lengua Madre) – Ingles – Francés - Portugués -
4
TRABAJOS ESCRITOS - PRODUCCIÓN INTELECTUAL: Manual de Time Series Processor Ver 7.03 (TSP) (autoría propia) Manual de Econometrics Views Vers. 1.0b (EVIEWS) 1ª – 2ª Edición- 1998 (autoría propia) Manual de Econometrics Views Vers. 1.0B – 2.0 – 3.01 – 4.0B (EVIEWS) 3ª Edición – 2001
(autoría propia) Manual de Econometrics Views Vers 4ª edición – 2003 (autoría propia) Manual de SPSS ver 10 1ª edición – 2004 (autoría propia) Solucionario de los problemas del Texto de Introducción a la Econometría del autor Ernesto
Rivero(autoría propia) Bolivia en el Proceso de Globalización Periodo 1987-2002 Traducción de manual de Econometric Views versión 4.0 Micro Software Quantitative para el
Centro de Tecnologías Aplicadas a Economía (CTAE)(2003) Como elaborar el Proyecto de Tesis en Economía 1ª edición 2004 (autoría Propia) Guía de Elaboración de Tesis 1ª edición 2004 (autoría Propia) Gestión de Proyectos (Identificación – Formulación – Preparación y Evaluación) Financiera –
Económica –social -ambiental Texto como elaborar indicadores estadísticos (autoría propia
Elaboración del tutorial de Eviews vers 3 y 4 (CD contiene video-manual Eviews-Lecturas yotros)2004
Elaboración del tutorial de Análisis Econométrico con Eviews vers 5 Y 5.1 (CD contienevideo-manual EVIEWS-Lecturas y otros)2006
Elaboración del tutorial de Análisis Estadistico con SPSS vers 12 (CD contiene video-manualSPSS-Lecturas y otros)2006
Elaboración del tutorial de Análisis Econométrico con STATA vers 9.1 (CD contiene video-manual STATA-Lecturas y otros)2006
Elaboración del tutorial de Análisis Econométrico con JMULTI vers 4 (CD contiene video-manual JMULTI-Lecturas y otros)2006
Elaboración del tutorial de Análisis Econométrico con GRETL vers 12 (CD contiene video-manual GRETL-Lecturas y otros)2006
Elaboración del tutorial de Análisis de Proyectos y Riesgos con CRYSTAL BALL vers 7.2(CD contiene video-manual CRYSTAL BALL –Lecturas y otros)2006
Elaboración del tutorial de Análisis Econométrico con DEMETRA vers 1.0 (CD contienevideo-manual –Lecturas y otros)2006
Elaboración del tutorial de Análisis Econométrico con EASY REG INTERNATIONAL (CDcontiene video-manual –Lecturas y otros)2006
Elaboración del tutorial de Análisis Econométrico con LIMDEP (CD contiene video-manual–Lecturas y otros)2006
Elaboración del tutorial de Análisis de Proyectos con MSPROJECT (CD contiene video-manual–Lecturas y otros)2006
Elaboración del tutorial de Análisis de Proyectos con PLANTILLAS PARAMETRIZADAS(CD contiene video-manual–Lecturas y otros)2006
Elaboración del tutorial de Análisis de Proyectos con CRYSTAL BALL 7.22 (CD contienevideo-manual–Lecturas y otros)2006
Elaboración del tutorial de Análisis contable con MONICA 8.0 (CD contiene video-manual–Lecturas y otros)2007
Elaboración del tutorial de Análisis Econométrico con Eviews vers 6.0 Y 5.1 (CD contienevideo-manual EVIEWS-Lecturas y otros)2007
CURSOS DE COMPUTACIÓN:1990 Curso de Auxiliar en Contabilidad Computarizada –Instituto “Arrieta”1991 Curso de Auxiliar en Contabilidad Computarizada –Instituto Educacional Británico1994 Curso de Sistemas Computarizados de Oficina- Escuela Industrial “Pedro Domingo
Murillo”Carrera De Electrónica
5
1994 Curso de Sistema Operativo Dos- Word Perfect – Qpro Windows (Universidad SantoTomas” –CENACO-CEIN)
1994 Curso de Programador en Sistemas de Computación Instituto C.I.P.E.C. SRL1994 Curso de Sistema Operativo Ms-Dos, Ms-Windows, Ms-Word, Ms-Excel; ECCOM SRL1998 Curso de Time Series Processor – Instituto MILENIO SRL1998 Curso Estrategia de Recursos Humanos – Escuela Superior de Estudios Especializados1999 Curso de Marketing por teléfono- American Bussines Group1999 Curso de servicio al cliente- American Bussines Group
CONOCIMIENTO Y MANEJO DE PAQUETES DE COMPUTACIÓN:PLATAFORMA D.O.S.
Sistema Operativo D.O.S Vers. 6.0 – 6.21 –6.22 Sistema Operativo PC-D.O.S Versión 6.3-7.0 procesador de texto Word Perfect para entorno D.O.S Vers. 5.1 – 6.0 hoja electrónica Quattro Pro para entorno D.O.S Vers. 4.0 –5.0 Programación en Turbo C Ver 2.0 –Turbo Pascal (ENTORNO DOS) Time Series Processor Vers. 6.54 -7.03 (ECONOMETRIA) DIGITIME (software de control de asistencia de RELOJ CDM-30) ATR6000 (software de control de asistencia de reloj BADGER II)
PLATAFORMA WINDOWS procesador de texto Word Perfect para entorno Windows Vers. 6.0 – 6.1 –7.0 –8.0 Microsoft Windows Vers. 3.1 –3.11 –95 –98- 2000 Profesional – Milenniun Edition – XP
Profesional- Windows XP Home Edition-Lite Edition-Long Horn-lite edition –Vista Edition Microsoft Windows NT Vers. 4.0 – 2000 (Profesional) 2003 Server Enterprise Microsoft office (Word-Excel-Access-Power Point-Outlook) Vers. 93 –94 –95 – 97 – 2000-
XP(Profesional) -2003 Profesional – 2007 profesional Microsoft Publisher – Project – Visio Vers. 95 –97 –98 –2000-XP Profesional 2003
Profesional – Profesional 2007 Microsoft Corel Perfect Office (Word Perfect –Qpro – Presentations ) Microsoft Abc Floor Chart (diagramas de flujo) Econometrics View Vers. 1.0b –2.0b –3.01-3.1 –4.0 -5.0(Econometría) Gretl Econometría – Lindep –Econometría –Simprocess –Stata ver 7.0 -8.0 SPSS Vers. 6.0 – 7.0- 8.0 –9.0 – 10.0 –11.0 -12 – 13(Estadística) Microsoft quicken (contabilidad) Microsoft Visual Studio nterprise (Visual Basic-Visual Fox)
EMSAMBLAJE DE COMPUTADORAS Ensamblaje de Computadoras – Configuración de Computadoras – Formateo y Particionado
de Discos Duros(HDD) – Instalación de Software
CONFIGURACIÓN DE REDES Manejo y Configuración de Redes L.A.N. – W.A.N. - configuración de protocolos IPX / IPS –TCP /IP –NETBEUI –DNS/ HOST configuración de líneas ZET- CIRCUNVALEM – BLANCA- DEDICADA –ADSL
CURSILLOS DICTADOS:1998 Mayo Curso del Paquete Econometric Views Vers 10B Carrera De Economía – CIME
(Centro de Investigación Matemática y Estadística para Economía)-UMSA2000 Como Debe Ser Un Líder Ideal – Cámara Júnior Internacional2001 Curso del Paquete Econometric Views Vers 3.01 Consultora CEPIIB2001 Curso del Paquete SPSS ver 10.0 Consultora CEPIIB2003 Curso Taller del Paquete Econometrics Views Ver 4.0 Colegio de Economistas
6
de la Paz – Centro de Tecnologías Aplicadas a Economía2004 Curso Virtual de Análisis Econométrico con Eviews Diplomado Economía
Informática2005 Curso Análisis Econométrico con Eviews 4 carrera de Economía- UMSA2006 Curso de Análisis Econométrico con Eviews vers 5 Y 5.1 Consultora CADES2006 Curso de Análisis Econométrico con STATA vers 9 Y 9.1 Consultora CADES2006 Curso de Análisis Econométrico con J-MULTI Consultora CADES2006 Curso de Análisis Econométrico con DEMETRA Consultora CADES2006 Curso de Análisis Econométrico con GRETL Consultora CADES2006 Curso de Análisis Econométrico con LIMDEP Consultora CADES2006 Curso de Análisis Econométrico con EASY REG INTERNATIONAL Consultora
CADES2006 Curso de Análisis Estadístico con SPSS vers. 12 Consultora CADES2006 Curso de Análisis de Proyectos y Riesgos con CRYSTAL BALL vers 7.12
Consultora CADES2006 Curso Análisis de Proyectos con MSPROJECT ver 2003 Consultora CADES2007 Curso de Preparacion y Evaluacion de Proyectos con PLANTILLAS PARAMETRIZADAS
Consultora NUEVO MUNDO2007 Curso de Análisis Econométrico con Eviews vers 5 Y 5.1 Consultora NUEVO MUNDO2007 Curso de PAQUETE CONTABLE MONICA 8 Consultora NUEVO MUNDO2007 Curso de Paquete Contable ORION 4.5 Consultora NUEVO MUNDO2007 Curso de OPERADORES DE COMERCIO EXTERIOR SIDUNEA++ Consultora NUEVO
MUNDO2007 Curso de GESTION DE ALMACENES Consultora NUEVO MUNDO2007 Curso de ANALISIS ESTADISTICO CON SPSS13 Consultora NUEVO MUNDO2007 Curso de ADMINISTRACION DE RECURSOS HUMANOS (DIRECCION
EMPRESARIAL) Consultora NUEVO MUNDO2007 Curso de Análisis Econométrico con STATA vers 9 Y 9.1 Consultora NUEVO
MUNDO2007 Curso de Análisis Econométrico con J-MULTI Consultora NUEVO MUNDO2007 Curso de Análisis Econométrico con DEMETRA Consultora NUEVO MUNDO2007 Curso de Análisis Econométrico con GRETL Consultora NUEVO MUNDO2007 Curso de Análisis Econométrico con LIMDEP Consultora NUEVO MUNDO2007 Curso de Análisis Econométrico con EASY REG INTERNATIONAL Consultora
NUEVO MUNDO
EXPERIENCIA DE TRABAJO:1998 enero 00 CARRERA DE ECONOMIA- UMSA: Fac. Ciencias Económicas y
Financieras auxiliar de docencia materia de Informática auxiliar de docencia materia de Econometría en calidad de invitado –
AD HONOREN) CIME –UMSA instalación de la red del laboratorio de informática
1998 agosto2000 enero
INSTITUTO TECNOLOGICO DE ESTUDIOS SUPERIORES DEMONTERREY (ITESM) –CARRERA: ECONOMIA –CARRERA COMERCIOINTERNACIONAL - MEXICODocente de las materias:
Econometría I Econometría II Estadística I Estadística II Comercio internacional Miembro del departamento de Economía Cuantitativa Miembro del Departamento de Economía Aplicada
7
1999 Enero2000 Enero
INSTITUTO TECNOLOGICO DE ESTUDIOS SUPERIORES DEMONTERREY (ITESM) –CARRERA: INGENIERIA DE SISTEMAS – MEXICODocente de las materias :
Programación I Redes Neuronales Inteligencia Artificial lógica difusa Estructuración de redes LAN- WAN Miembro del Departamento Capacitación en sistemas
2000 CURSO PREFACULTATIVO: Fac. Ciencias Económicas y Financieras Jefe de sistemas Elaboración del software Elaboración y codificación de alumnos Mantenimiento y configuración de la red Trabajos Varios
2001 – 2002 INSTITUTO (Bussines Integral Tecnology) BIT- ORURODocente de las materias: Programación I Análisis de sistemas computacionales Estadística
2003 INSTITUTO DE INVESTIGACIONES ECONOMICAS: -U.M.S.A Docente de Diplomado Econometría Avanzada (Materia: Econometría
Básica) Docente de Diplomado Economía Informática (Materia: Redes
Neuronales inteligencia artificial y Lógica Difusa Materia: EconometríaBásica)
2004 INSTITUTO DE INVESTIGACIONES ECONOMICAS: -U.M.S.A Docente de Diplomado Econometría (Materia: Econometría dinámica ) Docente de Diplomado Economía Informática (Materia: Redes
Neuronales inteligencia artificial y Lógica Difusa Materia: EconometríaBásica)
2004 octubre –diciembre
MINISTERIO DE EDUCACION: Profesional En Procesos y Gestión de Almacenes Coordinador de Sistemas para Congreso Nacional de Educación
juntamente Lic. Marcelo Rocabado Sistematización Congresos Departamentales La Paz Marco Lógico
Oruro Marco Filosófico – Santa Cruz Formación Docente – Santa Cruz
2007 Julio –Noviembre
CURSO PREFACULTATIVO: Fac. Ciencias Económicas y Financieras Docente de la materia: Introducción a la Economía
2007 AgostoActual
SOCIEDAD DE ALTOS ESTUDIOS JURIDICOS EMPRESARIALESEUROAMERICANO
Docente TITULAR de la materia: ECONOMETRIA Docente TITULAR de la materia: GESTION Y VALORACION
EMPRESARIAL Docente TITULAR de la materia: LOGISTICA DE EXPORTACIONES
8
EXPERIENCIA EN CAMARA JUNIOR INTERNACIONAL:
Julio 2000 Curso de administración del capitulo –Preparación y Evaluación deProyectos
Agosto 2000 Curso de ESCABO II (Escuela de Capacitadores de Bolivia)Septiembre 2000 Curso de Procedimientos Parlamentarios
ASOCIADO A INSTITUCIONES:Asociación de Scouts de BoliviaJunior Chamber InternationalFundación Economía Informática