rodrigo lovatón dávila , dorothy gondwe , aine seitz mccarthy,

29
El índice de activos para datos censales: Una aplicación para predecir indicadores educativos en países en desarrollo Rodrigo Lovatón Dávila, Dorothy Gondwe, Aine Seitz McCarthy, Phatta Kirdruang, and Uttam Sharma Integrated Public Use Microdata Series- International (IPUMS-I)

Upload: pearly

Post on 24-Feb-2016

37 views

Category:

Documents


0 download

DESCRIPTION

El índice de activos para datos censales: Una aplicación para predecir indicadores educativos en países en desarrollo. Rodrigo Lovatón Dávila , Dorothy Gondwe , Aine Seitz McCarthy, Phatta Kirdruang , and Uttam Sharma. Integrated Public Use Microdata Series- International (IPUMS-I). - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

El índice de activos para datos censales: Una aplicación para

predecir indicadores educativos en países en desarrollo

Rodrigo Lovatón Dávila, Dorothy Gondwe, Aine Seitz McCarthy,Phatta Kirdruang, and Uttam Sharma

Integrated Public Use Microdata Series- International (IPUMS-I)

Page 2: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

IndiceMotivaciónPreguntas de investigaciónRevisión de literaturaDatosMetodologíaResultadosTrabajo en curso

Page 3: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

MotivaciónNecesidad de una medida de nivel socioeconómico (NSE)

para investigación económica y demográfica: Estimación de pobreza e inequidad. Como variable de control en análisis de regresión.

Problemas con ingresos y gastos en encuestas de hogares: Datos costosos de recolectar. Dificultad para su medición / menor disponibilidad.

Uso de información censal para crear una medida de NSE: Microdatos censales tienen gran cobertura y son accesibles. Datos disponibles a través de IPUMS-International. Aplicación del enfoque basado en activos para crear una medida

de NSE.

Page 4: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Preguntas de investigación

1) ¿Es el índice de activos internamente

consistente cuando es aplicado a

microdatos censales?

2) ¿Es el índice de activos una medida válida

de nivel socioeconómico (NSE)?

Page 5: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Revisión de literatura El índice de activos es una buena proxy de ingresos

y gasto de consumo (McKenzie, 2005; Sahn y Steifel, 2000).

El índice de activos es confiable en la predicción de indicadores educativos, cuando es comparado con gastos (Filmer y Pritchett, 2001).

Validación del índice examinando indicadores de salud a través de estratos de NSE (Bollen et al., 2002; Filmer y Scott, 2008; Sahn y Stiefel, 2003).

La Encuesta Demográfica y de Salud Familiar (ENDES) usa un índice basado en activos.

Page 6: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

DatosMicrodatos censales de IPUMS-International.

Mayor archivo de información gratuita y públicamente accesible de muestras censales: 211 muestras de 68 países, de 1960 a 2010

Actualmente, no incluye ninguna medida estándar de nivel socioeconómico para el hogar.

Encuesta Demográfica y de Salud Familiar (ENDES)País IPUMS-I ENDES

Brasil 2000 1996

Colombia 2005 2005

Perú 1993 1992

Senegal 2002 2005

Sudáfica 1996 1996

Categoría Ejemplos

ActivosTeléfono, radio, televisión, refrigerador, computadora, bicicleta, equipo de sonido, lavadora

Acceso a servicios Electricidad, agua, saneamiento

Características de la vivienda

Material predominante en paredes, pisos, techos

Page 7: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Metodología: ACP Supuesto: nivel socioeconómico no observado está reflejado en

características de la vivienda, acceso a servicios, y activos. Recodificación de variables categóricas en binarias y cálculo del

índice con Análisis de Componentes Principales (ACP).C1 = b11(X1) + b12(X2) + ... b1p(Xp)

Técnica de reducción de datos que forma un índice a partir de una combinación lineal de todas las variables.

Cada variable recibe un peso asignado en función de su contribución a la variabilidad total de los datos.

Se asigna a cada hogar un índice de acuerdo con la tenencia de dichas variables.

Definición de quintiles basados en el índice de activos.

Page 8: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Metodología: ACPWealth quintile (% owns asset)

Poorest 2nd 3rd 4th Richest TotalHas telephone 1.45 19.23 57.53 86.70 97.54 52.46 0.2278Has television 29.33 70.86 91.78 98.06 99.14 77.52 0.2127Has refrigerator 14.76 50.67 76.27 95.23 99.48 66.98 0.2211Uses water from aqueduct, inside the dwelling 9.88 55.64 88.03 94.88 97.09 68.56 0.2334Uses water from aqueduct, outside the dwelling 21.75 20.53 7.26 3.62 2.22 11.19 -0.0669Uses water from a public standpipe 1.45 1.32 0.32 0.08 0.02 0.64 -0.0143Uses water from well with pump 22.10 9.21 1.83 0.51 0.22 6.84 -0.0937Uses water from river, stream, or spring 34.51 5.07 0.46 0.14 0.06 8.29 -0.1556Uses water from tanker truck 2.25 2.94 0.63 0.15 0.04 1.21 -0.0165Uses toilet connected to sewer 3.77 49.09 87.66 96.35 98.81 64.96 0.2508Uses shared toielet connected to sewer 0.35 5.85 4.86 1.56 0.26 4.47 0.0115Uses own toilet connected to septic system 38.26 34.40 6.46 1.84 0.89 16.09 -0.1072Uses shared toilet connected to septic system 1.44 1.12 0.15 0.02 0.00 0.78 -0.0222Uses own unconnected flush toilet 11.64 5.16 0.60 0.12 0.02 3.48 -0.0665Uses shared unconnected flush toilet 0.40 0.17 0.01 0.00 0.00 0.17 -0.0137No sanitary service 44.14 4.21 0.25 0.10 0.02 10.05 -0.1809Has parquet or polished wood flooring 0.15 1.15 3.63 6.59 17.82 5.90 0.0786Has tile flooring 1.68 15.06 43.63 75.26 78.48 42.64 0.1963Has wood plank flooring 11.74 4.88 2.05 1.19 1.02 4.45 -0.0612Has cement flooring 37.54 71.01 50.16 16.91 2.67 35.51 -0.0482Has earth, mud, dung, or sand flooring 48.89 7.90 0.52 0.05 0.01 11.51 -0.1823

Factor scoreColombia 2005 - Resultados ACP

Page 9: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Metodología1) Consistencia interna

Eliminación de variables por etapas (stepwise), cálculo de correlaciones y el alpha de Cronbach.

Comparación gráfica de distribuciones de riqueza con el índice de la ENDES.

2) Validez Predicción de indicadores educativos (nivel

educativo alcanzado y asistencia a la escuela).

Page 10: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Metodología: Consistencia interna (I)Eliminación de variables por etapas

(stepwise), siguiendo el orden de los pesos del ACP (menor a mayor) y luego el índice es recalculado con las variables restantes.

Cálculo de correlaciones: verificación de consistencia de los rankings luego de la eliminación de cada variable.Comparación del ranking original de hogares al

ranking usando el nuevo grupo de variables.

Alpha de Cronbach: comparación de la consistencia interna entre índices.

21

2

11 X

K

iYi

KK

Page 11: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Resultados: Consistencia interna (I)

0.8

0.85

0.9

0.95

1

59 54 49 44 39 34 29 24 19 14 9Number of Variables Included

Cronbach alpha Spearman rank

0.800

0.850

0.900

0.950

1.000

62 57 52 47 42 37 32 27 22 17 12 7 2Number of Variables Included

Cronbach alpha Spearman rank

El alpha de Cronbach y las correlaciones calculadas durante el proceso de eliminación de variables muestran que el índice tiene una consistencia interna primero estable o creciente y luego decreciente a partir de cierto punto.

Peru 1993 Colombia 2005

Page 12: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Metodología: Consistencia interna (II)Comparación gráfica de funciones de

densidad kernel entre microdatos censales y ENDES.Se espera distribuciones similares de NSE,

dado que se trata de bases de datos de años similares.

Comparación de estadísticos resumen de distribuciones estandarizadas entre microdatos censales y ENDES.Percentiles, sesgo, y curtosis.

Page 13: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Resultados: Consistencia interna (II)

El índice de activos basado en microdatos censales muestra una similar distribución al correspondiente a la ENDES.

Senegal 2002 Brasil 2000

Page 14: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Metodología: Validez Aplicación a indicadores educativos1. Comparación de distribuciones de asistencia a

la escuela y nivel educativo según quintiles del índice para microdatos censales y ENDES.

2. Estimación de un modelo probit para asistencia a la escuela, controlando por el índice de activos y otras variables individuales y del hogar:

Pr(y=1|X) = Φ(X’β) Donde Pr(y=1|X) es la probabilidad de asistir a la escuela.

Page 15: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

78.0

88.6

73.4

34.7

77.8

87.4

93.0

84.5

43.2

84.3

90.994.6

88.9

48.1

88.2

93.295.8

90.6

55.7

91.295.4 95.7

86.8

68.8

94.0

0

10

20

30

40

50

60

70

80

90

100

Brazil South Africa Peru Senegal Colombia

School enrollment according to DHS wealth quintiles

Poorest quintile Second quintile Third quintile Fourth quintile Richest quintile

Page 16: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

80.6 79.2

70.5

27.1

70.9

87.683.8

77.2

35.2

82.4

90.586.2 84.8

44.8

88.0

93.989.8

86.4

55.0

91.5

97.093.0

87.4

68.8

94.8

0

10

20

30

40

50

60

70

80

90

100

Brazil South Africa Peru Senegal Colombia

School enrollment according to census asset index

Poorest quintile Second quintile Third quintile Fourth quintile Richest quintile

Page 17: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

63.168.1

75.9

40.3

9.1

80.5 78.4

87.5

63.1

15.1

86.9 85.1

93.6

75.9

28.8

92.7 93.297.1

82.9

47.5

95.898.3 98.9

92.7

65.8

0

10

20

30

40

50

60

70

80

90

100

Brazil South Africa Peru Colombia Senegal

Adult primary school completion according to DHS wealth index

Poorest quintile Second quintile Third quintile Fourth quintile Richest quintile

Page 18: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

70.2

46.6

23.1

35.6

5.2

84.0

56.0

40.4

61.2

8.2

89.7

64.1 62.9

76.2

15.7

95.0

81.9

75.3

84.8

32.5

98.193.3

85.2

92.9

54.7

0

10

20

30

40

50

60

70

80

90

100

Brazil South Africa Peru Colombia Senegal

Adult primary school completion according to census asset index

Poorest quintile Second quintile Third quintile Fourth quintile Richest quintile

Page 19: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Resultados: ValidezModelo probit para asistencia a la escuela usando

microdatos censales

Variables de control: Sexo, edad y edad al cuadrado para el niño; sexo, edad y edad al cuadrado para el jefe del hogar; nivel educativo del jefe del hogar; residencia en área urbana o rural.

Muestra Coeficiente Z-stat P-valueEfecto

marginal0.3169 125.61 < 0.01 0.0325

(0.0025) (0.0003)0.1225 113.41 < 0.01 0.0190

(0.0010) (0.0002) 0.1674 36.73 < 0.01 0.0344(0.0038) (0.0008) 0.2405 70.9 < 0.01 0.0461(0.0033) (0.0006)

Perú 1993

Sudáfrica 1996

Brasil 2000

Colombia 2005

Page 20: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Resultados: ValidezColombia 2005Perú 1993

Resultados del modelo probit para asistencia educativa durante el proceso de eliminación de variables.

El efecto marginal del índice de activos y el R2 son estables inicialmente y luego decrecientes.

0.100

0.105

0.110

0.115

0.120

0.125

0.130

0.135

0.010

0.013

0.016

0.019

0.022

0.025

0.028

62 57 52 47 42 37 32 27 22 17 12 7 2Marginal effect R-squared

0.050

0.052

0.054

0.056

0.058

0.060

0.000

0.002

0.004

0.006

0.008

0.010

0.012

59 54 49 44 39 34 29 24 19 14 9

Marginal effect R-squared

Page 21: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Discusión de resultados Procedimiento de eliminación de variables y las

distribuciones de densidad de kernel muestran que se trata de una medida consistente de nivel socioeconómico.

El modelo probit indica que el índice de activos tiene un efecto positivo y significativo en la asistencia a la escuela.

La metodología permite determinar estándares para el requerimiento de datos para obtener un índice válido. El análisis de más muestras de microdatos censales

permitirá obtener resultados más concluyentes respecto al grupo de variables esenciales para el índice.

Page 22: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Cuál es el “mejor” método para ACP?El ACP presentado previamente está basado en variables

categóricas recodificadas como binarias (“ACP binario”).Kolenikov y Angeles (2009) sugieren el uso de variables

ordinales, las cuales aportan información adicional a través del orden de las categorías.

Métodos alternativos aplicados a variables ordinales:“ACP policórico”: ACP basado en correlaciones policóricas.“ACP ordinal”: ACP basado en la forma “tradicional” para

calcular correlaciones pero aplicado a variables ordinales.

Page 23: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Trabajo en curso (1) Preguntas de investigación:

1. ¿Son los rankings de hogares basados en métodos alternativos muy diferentes?

2. ¿Cuál de los métodos para ACP tiene un mejor desempeño para examinar indicadores educativos? (usando quintiles o análisis de regresión)

Page 24: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Trabajo en curso (2)Metodología:

Tres métodos para ACP: binario, policórico, ordinal.Cálculo de índices basados en métodos alternativos

para 7 muestras de IPUMS-I (incluyendo Cambodia 1998 y Tailandia 2000).

Comparación de los índices usando:1. Clasificación de hogares según quintiles.

2. Comparación gráfica de densidades kernel.

3. Análisis de regresión para asistencia a la escuela.

Page 25: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Resultados preliminares (1)

La clasificación de hogares por quintiles es más similar entre los métodos aplicados a variables ordinales (ACP policórico y ACP ordinal), respecto del ACP binario.

Clasificación de hogares por quintiles (Colombia 2005)

9.92 9.69 1.99

80.53 80.76 96.27

9.55 9.56 1.74

0

20

40

60

80

100

Binario vs Policórico Binario vs Ordinal Ordinal vs Policórico

Menor quintil Mismo quintil Mayor quintil

Page 26: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Resultados preliminares (2)

Las distribuciones kernel para los métodos alternativos muestran similitudes, las cuales son mayores entre los índices aplicados a variables ordinales (forma de la distribución y la concentración de su masa.)

Colombia 2005Brasil 2000

Page 27: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Resultados preliminares (3) Muestra ACP binario ACP

policóricoACP

ordinalBrasil 2000 1.28 1.48 1.32

Colombia 2005 1.24 1.48 1.30

Perú 1993 1.10 1.20 1.12

Senegal 2002 1.12 1.24 1.16

Sudáfrica 1996 1.18 1.26 1.23

Cambodia 1998 1.20 1.58 1.34

Tailandia 2000 1.43 1.67 1.54

Variables de control: Sexo, edad y edad al cuadrado para el niño; sexo, edad y edad al cuadrado para el jefe del hogar; nivel educativo del jefe del hogar; residencia en área urbana o rural.

Modelo logit para asistencia a la escuela (odd-ratios)

Page 28: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Discusión de resultados preliminares ACP policórico y ordinal tienen mayor concordancia en

clasificación de hogares por quintiles que el ACP binario. Los odds-ratios del modelo logit para asistencia a la escuela

muestran un patrón en todas las muestras analizadas:ACP policórico > ACP ordinal > ACP binario

Los resultados preliminares sugieren que el ACP policórico y ordinal tienen un mejor desempeño que el ACP binario como control por nivel socioeconómico.

Siguientes pasos: inclusión de muestras adicionales y desarrollar un procedimiento de eliminación de variables por etapas.

Page 29: Rodrigo  Lovatón Dávila , Dorothy  Gondwe ,  Aine  Seitz McCarthy,

Gracias.