rodrigo lovatón dávila , dorothy gondwe , aine seitz mccarthy,

Post on 24-Feb-2016

37 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

El índice de activos para datos censales: Una aplicación para predecir indicadores educativos en países en desarrollo. Rodrigo Lovatón Dávila , Dorothy Gondwe , Aine Seitz McCarthy, Phatta Kirdruang , and Uttam Sharma. Integrated Public Use Microdata Series- International (IPUMS-I). - PowerPoint PPT Presentation

TRANSCRIPT

El índice de activos para datos censales: Una aplicación para

predecir indicadores educativos en países en desarrollo

Rodrigo Lovatón Dávila, Dorothy Gondwe, Aine Seitz McCarthy,Phatta Kirdruang, and Uttam Sharma

Integrated Public Use Microdata Series- International (IPUMS-I)

IndiceMotivaciónPreguntas de investigaciónRevisión de literaturaDatosMetodologíaResultadosTrabajo en curso

MotivaciónNecesidad de una medida de nivel socioeconómico (NSE)

para investigación económica y demográfica: Estimación de pobreza e inequidad. Como variable de control en análisis de regresión.

Problemas con ingresos y gastos en encuestas de hogares: Datos costosos de recolectar. Dificultad para su medición / menor disponibilidad.

Uso de información censal para crear una medida de NSE: Microdatos censales tienen gran cobertura y son accesibles. Datos disponibles a través de IPUMS-International. Aplicación del enfoque basado en activos para crear una medida

de NSE.

Preguntas de investigación

1) ¿Es el índice de activos internamente

consistente cuando es aplicado a

microdatos censales?

2) ¿Es el índice de activos una medida válida

de nivel socioeconómico (NSE)?

Revisión de literatura El índice de activos es una buena proxy de ingresos

y gasto de consumo (McKenzie, 2005; Sahn y Steifel, 2000).

El índice de activos es confiable en la predicción de indicadores educativos, cuando es comparado con gastos (Filmer y Pritchett, 2001).

Validación del índice examinando indicadores de salud a través de estratos de NSE (Bollen et al., 2002; Filmer y Scott, 2008; Sahn y Stiefel, 2003).

La Encuesta Demográfica y de Salud Familiar (ENDES) usa un índice basado en activos.

DatosMicrodatos censales de IPUMS-International.

Mayor archivo de información gratuita y públicamente accesible de muestras censales: 211 muestras de 68 países, de 1960 a 2010

Actualmente, no incluye ninguna medida estándar de nivel socioeconómico para el hogar.

Encuesta Demográfica y de Salud Familiar (ENDES)País IPUMS-I ENDES

Brasil 2000 1996

Colombia 2005 2005

Perú 1993 1992

Senegal 2002 2005

Sudáfica 1996 1996

Categoría Ejemplos

ActivosTeléfono, radio, televisión, refrigerador, computadora, bicicleta, equipo de sonido, lavadora

Acceso a servicios Electricidad, agua, saneamiento

Características de la vivienda

Material predominante en paredes, pisos, techos

Metodología: ACP Supuesto: nivel socioeconómico no observado está reflejado en

características de la vivienda, acceso a servicios, y activos. Recodificación de variables categóricas en binarias y cálculo del

índice con Análisis de Componentes Principales (ACP).C1 = b11(X1) + b12(X2) + ... b1p(Xp)

Técnica de reducción de datos que forma un índice a partir de una combinación lineal de todas las variables.

Cada variable recibe un peso asignado en función de su contribución a la variabilidad total de los datos.

Se asigna a cada hogar un índice de acuerdo con la tenencia de dichas variables.

Definición de quintiles basados en el índice de activos.

Metodología: ACPWealth quintile (% owns asset)

Poorest 2nd 3rd 4th Richest TotalHas telephone 1.45 19.23 57.53 86.70 97.54 52.46 0.2278Has television 29.33 70.86 91.78 98.06 99.14 77.52 0.2127Has refrigerator 14.76 50.67 76.27 95.23 99.48 66.98 0.2211Uses water from aqueduct, inside the dwelling 9.88 55.64 88.03 94.88 97.09 68.56 0.2334Uses water from aqueduct, outside the dwelling 21.75 20.53 7.26 3.62 2.22 11.19 -0.0669Uses water from a public standpipe 1.45 1.32 0.32 0.08 0.02 0.64 -0.0143Uses water from well with pump 22.10 9.21 1.83 0.51 0.22 6.84 -0.0937Uses water from river, stream, or spring 34.51 5.07 0.46 0.14 0.06 8.29 -0.1556Uses water from tanker truck 2.25 2.94 0.63 0.15 0.04 1.21 -0.0165Uses toilet connected to sewer 3.77 49.09 87.66 96.35 98.81 64.96 0.2508Uses shared toielet connected to sewer 0.35 5.85 4.86 1.56 0.26 4.47 0.0115Uses own toilet connected to septic system 38.26 34.40 6.46 1.84 0.89 16.09 -0.1072Uses shared toilet connected to septic system 1.44 1.12 0.15 0.02 0.00 0.78 -0.0222Uses own unconnected flush toilet 11.64 5.16 0.60 0.12 0.02 3.48 -0.0665Uses shared unconnected flush toilet 0.40 0.17 0.01 0.00 0.00 0.17 -0.0137No sanitary service 44.14 4.21 0.25 0.10 0.02 10.05 -0.1809Has parquet or polished wood flooring 0.15 1.15 3.63 6.59 17.82 5.90 0.0786Has tile flooring 1.68 15.06 43.63 75.26 78.48 42.64 0.1963Has wood plank flooring 11.74 4.88 2.05 1.19 1.02 4.45 -0.0612Has cement flooring 37.54 71.01 50.16 16.91 2.67 35.51 -0.0482Has earth, mud, dung, or sand flooring 48.89 7.90 0.52 0.05 0.01 11.51 -0.1823

Factor scoreColombia 2005 - Resultados ACP

Metodología1) Consistencia interna

Eliminación de variables por etapas (stepwise), cálculo de correlaciones y el alpha de Cronbach.

Comparación gráfica de distribuciones de riqueza con el índice de la ENDES.

2) Validez Predicción de indicadores educativos (nivel

educativo alcanzado y asistencia a la escuela).

Metodología: Consistencia interna (I)Eliminación de variables por etapas

(stepwise), siguiendo el orden de los pesos del ACP (menor a mayor) y luego el índice es recalculado con las variables restantes.

Cálculo de correlaciones: verificación de consistencia de los rankings luego de la eliminación de cada variable.Comparación del ranking original de hogares al

ranking usando el nuevo grupo de variables.

Alpha de Cronbach: comparación de la consistencia interna entre índices.

21

2

11 X

K

iYi

KK

Resultados: Consistencia interna (I)

0.8

0.85

0.9

0.95

1

59 54 49 44 39 34 29 24 19 14 9Number of Variables Included

Cronbach alpha Spearman rank

0.800

0.850

0.900

0.950

1.000

62 57 52 47 42 37 32 27 22 17 12 7 2Number of Variables Included

Cronbach alpha Spearman rank

El alpha de Cronbach y las correlaciones calculadas durante el proceso de eliminación de variables muestran que el índice tiene una consistencia interna primero estable o creciente y luego decreciente a partir de cierto punto.

Peru 1993 Colombia 2005

Metodología: Consistencia interna (II)Comparación gráfica de funciones de

densidad kernel entre microdatos censales y ENDES.Se espera distribuciones similares de NSE,

dado que se trata de bases de datos de años similares.

Comparación de estadísticos resumen de distribuciones estandarizadas entre microdatos censales y ENDES.Percentiles, sesgo, y curtosis.

Resultados: Consistencia interna (II)

El índice de activos basado en microdatos censales muestra una similar distribución al correspondiente a la ENDES.

Senegal 2002 Brasil 2000

Metodología: Validez Aplicación a indicadores educativos1. Comparación de distribuciones de asistencia a

la escuela y nivel educativo según quintiles del índice para microdatos censales y ENDES.

2. Estimación de un modelo probit para asistencia a la escuela, controlando por el índice de activos y otras variables individuales y del hogar:

Pr(y=1|X) = Φ(X’β) Donde Pr(y=1|X) es la probabilidad de asistir a la escuela.

78.0

88.6

73.4

34.7

77.8

87.4

93.0

84.5

43.2

84.3

90.994.6

88.9

48.1

88.2

93.295.8

90.6

55.7

91.295.4 95.7

86.8

68.8

94.0

0

10

20

30

40

50

60

70

80

90

100

Brazil South Africa Peru Senegal Colombia

School enrollment according to DHS wealth quintiles

Poorest quintile Second quintile Third quintile Fourth quintile Richest quintile

80.6 79.2

70.5

27.1

70.9

87.683.8

77.2

35.2

82.4

90.586.2 84.8

44.8

88.0

93.989.8

86.4

55.0

91.5

97.093.0

87.4

68.8

94.8

0

10

20

30

40

50

60

70

80

90

100

Brazil South Africa Peru Senegal Colombia

School enrollment according to census asset index

Poorest quintile Second quintile Third quintile Fourth quintile Richest quintile

63.168.1

75.9

40.3

9.1

80.5 78.4

87.5

63.1

15.1

86.9 85.1

93.6

75.9

28.8

92.7 93.297.1

82.9

47.5

95.898.3 98.9

92.7

65.8

0

10

20

30

40

50

60

70

80

90

100

Brazil South Africa Peru Colombia Senegal

Adult primary school completion according to DHS wealth index

Poorest quintile Second quintile Third quintile Fourth quintile Richest quintile

70.2

46.6

23.1

35.6

5.2

84.0

56.0

40.4

61.2

8.2

89.7

64.1 62.9

76.2

15.7

95.0

81.9

75.3

84.8

32.5

98.193.3

85.2

92.9

54.7

0

10

20

30

40

50

60

70

80

90

100

Brazil South Africa Peru Colombia Senegal

Adult primary school completion according to census asset index

Poorest quintile Second quintile Third quintile Fourth quintile Richest quintile

Resultados: ValidezModelo probit para asistencia a la escuela usando

microdatos censales

Variables de control: Sexo, edad y edad al cuadrado para el niño; sexo, edad y edad al cuadrado para el jefe del hogar; nivel educativo del jefe del hogar; residencia en área urbana o rural.

Muestra Coeficiente Z-stat P-valueEfecto

marginal0.3169 125.61 < 0.01 0.0325

(0.0025) (0.0003)0.1225 113.41 < 0.01 0.0190

(0.0010) (0.0002) 0.1674 36.73 < 0.01 0.0344(0.0038) (0.0008) 0.2405 70.9 < 0.01 0.0461(0.0033) (0.0006)

Perú 1993

Sudáfrica 1996

Brasil 2000

Colombia 2005

Resultados: ValidezColombia 2005Perú 1993

Resultados del modelo probit para asistencia educativa durante el proceso de eliminación de variables.

El efecto marginal del índice de activos y el R2 son estables inicialmente y luego decrecientes.

0.100

0.105

0.110

0.115

0.120

0.125

0.130

0.135

0.010

0.013

0.016

0.019

0.022

0.025

0.028

62 57 52 47 42 37 32 27 22 17 12 7 2Marginal effect R-squared

0.050

0.052

0.054

0.056

0.058

0.060

0.000

0.002

0.004

0.006

0.008

0.010

0.012

59 54 49 44 39 34 29 24 19 14 9

Marginal effect R-squared

Discusión de resultados Procedimiento de eliminación de variables y las

distribuciones de densidad de kernel muestran que se trata de una medida consistente de nivel socioeconómico.

El modelo probit indica que el índice de activos tiene un efecto positivo y significativo en la asistencia a la escuela.

La metodología permite determinar estándares para el requerimiento de datos para obtener un índice válido. El análisis de más muestras de microdatos censales

permitirá obtener resultados más concluyentes respecto al grupo de variables esenciales para el índice.

Cuál es el “mejor” método para ACP?El ACP presentado previamente está basado en variables

categóricas recodificadas como binarias (“ACP binario”).Kolenikov y Angeles (2009) sugieren el uso de variables

ordinales, las cuales aportan información adicional a través del orden de las categorías.

Métodos alternativos aplicados a variables ordinales:“ACP policórico”: ACP basado en correlaciones policóricas.“ACP ordinal”: ACP basado en la forma “tradicional” para

calcular correlaciones pero aplicado a variables ordinales.

Trabajo en curso (1) Preguntas de investigación:

1. ¿Son los rankings de hogares basados en métodos alternativos muy diferentes?

2. ¿Cuál de los métodos para ACP tiene un mejor desempeño para examinar indicadores educativos? (usando quintiles o análisis de regresión)

Trabajo en curso (2)Metodología:

Tres métodos para ACP: binario, policórico, ordinal.Cálculo de índices basados en métodos alternativos

para 7 muestras de IPUMS-I (incluyendo Cambodia 1998 y Tailandia 2000).

Comparación de los índices usando:1. Clasificación de hogares según quintiles.

2. Comparación gráfica de densidades kernel.

3. Análisis de regresión para asistencia a la escuela.

Resultados preliminares (1)

La clasificación de hogares por quintiles es más similar entre los métodos aplicados a variables ordinales (ACP policórico y ACP ordinal), respecto del ACP binario.

Clasificación de hogares por quintiles (Colombia 2005)

9.92 9.69 1.99

80.53 80.76 96.27

9.55 9.56 1.74

0

20

40

60

80

100

Binario vs Policórico Binario vs Ordinal Ordinal vs Policórico

Menor quintil Mismo quintil Mayor quintil

Resultados preliminares (2)

Las distribuciones kernel para los métodos alternativos muestran similitudes, las cuales son mayores entre los índices aplicados a variables ordinales (forma de la distribución y la concentración de su masa.)

Colombia 2005Brasil 2000

Resultados preliminares (3) Muestra ACP binario ACP

policóricoACP

ordinalBrasil 2000 1.28 1.48 1.32

Colombia 2005 1.24 1.48 1.30

Perú 1993 1.10 1.20 1.12

Senegal 2002 1.12 1.24 1.16

Sudáfrica 1996 1.18 1.26 1.23

Cambodia 1998 1.20 1.58 1.34

Tailandia 2000 1.43 1.67 1.54

Variables de control: Sexo, edad y edad al cuadrado para el niño; sexo, edad y edad al cuadrado para el jefe del hogar; nivel educativo del jefe del hogar; residencia en área urbana o rural.

Modelo logit para asistencia a la escuela (odd-ratios)

Discusión de resultados preliminares ACP policórico y ordinal tienen mayor concordancia en

clasificación de hogares por quintiles que el ACP binario. Los odds-ratios del modelo logit para asistencia a la escuela

muestran un patrón en todas las muestras analizadas:ACP policórico > ACP ordinal > ACP binario

Los resultados preliminares sugieren que el ACP policórico y ordinal tienen un mejor desempeño que el ACP binario como control por nivel socioeconómico.

Siguientes pasos: inclusión de muestras adicionales y desarrollar un procedimiento de eliminación de variables por etapas.

Gracias.

top related