stata

18
Informática para Economi 2011 - 1 INFORMÁTICA PARA INFORMÁTICA PARA ECONOMISTAS ECONOMISTAS

Upload: maricarmen-flores

Post on 03-Nov-2015

13 views

Category:

Documents


0 download

DESCRIPTION

ppt stata guia

TRANSCRIPT

  • Informtica para Economistas2011 - 1INFORMTICA PARA ECONOMISTAS

  • *EJERCICIOSEn la ENAHOEl archivo sumaria.dta es el mdulo de la Encuesta Nacional de Hogares de 2010. En dicho mdulo, encontrar una amplia diversidad de variables de inters. Para ahorrar memoria, se le pide que se quede solo con las variables mes, conglome, vivienda, hogar, dominio, estrato, totmieho y aquellas que empiecen con ingh, gash, lin, pob y fac.Se le pide crear un programa que haga lo siguiente:Cree una tabla que muestre el gasto per capita promedio por dominioCree una tabla cruzada que muestre el ingreso neto per cpita promedio para nivel de pobreza y dominio

  • *EJERCICIOSMuestre tablas cruzadas tal que se observe el ingreso per cpita promedio segn pobreza y estrato para cada dominio precisado en la ENAHO (regin geogrfica).Muestre cuntas personas en el pas son pobres, pobres extremos y no pobres por dominio geogrficoNota: Debe usar el factor de expansin correspondiente.

  • ANEXANDO BASES DE DATOSSintaxis: append using nombasePermite anexar bases de datos agregando observaciones. As, las bases se juntan de forma vertical.Si existen variables con el mismo nombre entre las bases de datos, las observaciones se agregan a la misma variable. De lo contrario, se crean nuevas variables en las bases anexadas.Generalmente, se utiliza cuando se desea ampliar el tamao de muestra de la base de datos.Ejemplo: use empleo2004.dtaappend using empleo2003.dta*

  • *ANEXANDO BASES DE DATOSFusionando bases de datosSintaxis: merge [varlist] using filenameEste comando sirve para unir las series que se encuentran en la base de datos abierta (data source) con las que se encuentran en otra base de datos (using dataset).Al unir las bases de datos, se crea una variable llamada _merge que se define de la siguiente forma:_merge = 1 si las observaciones contienen valores solo para las series de la base de datos principal (master)._merge==2 si las observaciones contienen valores solo para las series de la base de datos secundaria (using)._merge==3 si las observaciones contienen valores para las series de ambas bases de datos

  • *ANEXANDO BASES DE DATOSFusionando bases de datosAsimismo, el comando merge contiene las siguientes opciones:keep(varlist): especifica las variables de la base de datos secundaria que se van a unir a la base de datos principal.update: toma los valores de la variable en la base de datos secundaria si la variable en la base de datos principal contiene observaciones en blanco.replace: similar a update, pero toma los valores de toda la variable que se encuentra en la base de datos secundaria.nokeep: elimina todas las observaciones que tienen _merge=2, es decir, elimina las observaciones de las variables de la base de datos secundaria si no existe informacin en la base de datos principal.

  • *ANEXANDO BASES DE DATOSEjemplo aplicacin MERGEclearuse base2.dtasort paissave base2.dta, replaceuse base1.dtasort paismerge pais using base2.dta, keep(inflacion desempleo)

  • *COLLAPSEComprimiendo o colapsando bases de datosSintaxis: collapse clist [, by(varlist)]Este comando sirve para convertir a una base de datos que contiene variables en una base que contiene estadsticos de dichas variables (medias, medianas etc.). Permite obtener estadsticos para unidades ms grandes, como, pasar de datos por individuo a datos por hogar, de datos por individuo a datos por regin geogrfica etc.En el comando se especifican aquellas variables que se colapsan y las condiciones que se imponen para dicha transformacin con respecto a condicionales, a categoras de alguna variable, etc. Aquellas variables que no se especifican desaparecen automticamente (!).

  • *COLLAPSEComprimiendo o colapsando bases de datosSintaxis: collapse clist [, by(varlist)]En clist se pone la lista de variables con los estadsticos por calcular para cada una de ellas. Por defecto, calcula las medias. Algunos de estos estadsticos son:mean mediasd desviacin estndarsum sumarawsum suma sin tomar en cuenta las ponderacionescount nmero de observacionesmax mximomin mnimo

  • *PERCENTILESCreacin de percentilespctile / xtile: Crea una variable que contiene los percentiles de la expresin que se evala, mientras que xtile crea una variable que categoriza segn el percentil en el que se encuentra cada observacin.pctile nuevavar=exp [if] [in] [,opciones]xtile nuevavar=exp [if] [in] [,opciones]Entre las opciones estn: nquantiles(#): especifica el nmero de quantiles.genp(nombre2): especifica la nueva variable por generar que contiene los porcentajes de los percentiles.

  • *PERCENTILESEjemplosxtile gastox= gashog2d, nq(10)Construyendo deciles segn ingresotable gastox, c(mean gashog2d max gashog2d min gashog2d)Muestra la tabla de indicadores por cada decil

  • USANDO EL STATA TRANSFERStata Transfer es un aplicativo que nos permite transformar casi cualquier tipo de archivo de base de datos al formato *.dta, que es el de bases de datos en Stata.Su uso es muy sencillo y de amplia utilidad sobre todo cuando se cuenta con archivos en SPSS o formato de texto.

  • OPERATIVIDAD BSICASeleccione el tipo de archivo que desea convertirIndique la ubicacin del archivoSeleccione el tipo de archivo de salida que desea (lo usaremos para convertir a Stata, pero tiene ms opciones)Indique la ubicacin de destino del archivoUna vez selecionado todo de click en Transfer y listo!

  • ENCUESTA NACIONAL DE HOGARES (ENAHO)Tiene una cobertura nacional y es ejecutada por el INEI.Se desarrolla tanto en el mbito urbano como el rural. Cada ao se muestrean cerca de 20,000 hogares (que se distribuyen en 4 trimestres).Se evalan aspectos importantes como caractersticas de la vivienda, educacin, salud, empleo, programas sociales, participacin ciudadana, gasto de las familias, entre otros.Los resultados se publican para cada trimestre y tienen representatividad rural/urbana, por dominios geogrficos...Su representatividad estadstica llega inclusive a nivel departamental si se considera el total de informacin muestreada en 4 trimestres.

  • EJERCICIOS (FINAL 2011-0)Las bases empleo2005.dta corresponde a la versin resumida del mdulo de empleo para ese ao. Recuerde que esta base est a nivel de hogares. Con ello, se le pide:Realice la configuracin previa antes de trabajar (1 punto) Elabore una vista de los principales estadsticos (observaciones incluidas, media, varianza, mximo y mnimo) para las variables numricas incluidas. (2 Puntos)Desarrolle tablas de doble entrada que sea capaz de mostrar el estado civil de las personas por edad, para cada dominio geogrfico (expanda la muestra a nivel poblacin). (2 Puntos)*

  • EJERCICIOS (FINAL 2011-0)Las bases empleo2005.dta corresponde a la versin resumida del mdulo de empleo para ese ao. Recuerde que esta base est a nivel de hogares. Con ello, se le pide:Realice la configuracin previa antes de trabajar (1 punto) Elabore una vista de los principales estadsticos (observaciones incluidas, media, varianza, mximo y mnimo) para las variables numricas incluidas. (2 Puntos)Desarrolle tablas de doble entrada que sea capaz de mostrar el estado civil de las personas por edad, para cada dominio geogrfico (expanda la muestra a nivel poblacin). (2 Puntos)*

  • EJERCICIOS (FINAL 2011-0)Sabiendo que en la base de datos sumaria2005.dta, existen datos de ingreso y gasto, le interesa incluir en su base de datos las siguientes variables: total miembros del hogar (mieperho), ingreso total neto (inghog2d); gasto total (gashog2d), mbito geogrfico (urbano) y tipociudad. (2 puntos) Con los datos obtenidos, muestre una tabla que permita observar el ingreso per cpita (que ser el ingreso familiar entre el nmero de personas en la familia) promedio, segn el tipo de ciudad y el gnero de las personas (3 Puntos)Finalmente, usted quiere comparar el tamao promedio de las familias para los diferentes deciles de ingresos. (2 Puntos)*

  • Informtica para Economistas2011 - 1INFORMTICA PARA ECONOMISTAS