taller de procesamiento de datos censales...
TRANSCRIPT
Profesor: Gerardo Correa
Instituto de Investigaciones Económicas y Sociales
TALLER DE PROCESAMIENTO DE DATOS CENSALES CON
REDATAM
Junio 2014
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Objetivos.
El objetivo principal del Taller de REDATAM, es capacitar a los
participantes para producir información poblacional a partir de las
bases de datos censales, utilizando el REDATAM.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Descripción.
1. Conceptos básicos.
2. Contenido del Sistema Process.
3.Procesamiento de datos utilizando el procesador
estadístico.
4.Procesamiento de datos a través de programas hechos por
el usuario.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
1.1 Introducción al REDATAM
1.2 Módulos del REDATAM.
1.3 Definiciones generales.
1. Conceptos básicos.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio ¿Qué es el REDATAM?
El REDATAM (Recuperación de Datos para Aéreas pequeñas por
Microcomputador), es una familia de Software desarrollado por el Centro
Latinoamericano y Caribeño de Demografía (CELADE), que permiten
procesar en forma amigable y rápida datos censales y de otras fuentes.
1.1 Introducción
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
¿Cuáles son los requerimientos mínimos para poder instalar REDATAM?
REDATAM puede ser usado en cualquier computador corriendo bajo
Microsoft Windows 9x, NT4, 2000 y superiores.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
¿ Cuáles son sus principales Características de REDATAM?
El REDATAM tiene algunas bondades que lo hacen atractivo para el
procesamiento de grandes volúmenes de datos, entre las cuales podemos
destacar las siguientes:
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio 1. Comprime los datos originales
en archivos binarios a un 30%
aproximadamente del volumen de
los datos originales.
4. El procesamiento de los datos
puede realizarse muy
rápidamente. El uso de filtros y
selecciones geográficas acelera
aún más la velocidad de
procesamiento.
2. Una vez que la base de datos
original ha sido transformada en la
estructura del REDATAM, no se
necesita la asistencia de un
programador experimentado para
el procesamiento de los datos.
5. Es un SOFTWARE de libre
distribución, es decir no se
necesita comprar alguna licencia
para su uso.
3. Permite desplegar gráficos y
mapas temáticos.
6. Desde el REDATAM es posible
implementar bases de datos
multisectoriales.
Principales características de REDATAM.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio 1. Requiere un trabajo previo de
conversión de la base de datos
original al formato REDATAM.
3. Hasta el presente, no ha
existido en Venezuela, programas
de formación de manera
sistemática en REDATAM. Las
personas que querían formarse en
la herramienta debían viajar a
Chile.
2. El REDATAM no permite editar
los datos, si hay modificaciones
en la base de datos , ésta deberá
corregirse en algún otro
manejador de bases de datos y
posteriormente transformarla al
formato de REDATAM.
4. No incluye entre sus módulos
opciones avanzadas de análisis
estadístico.
Principales limitaciones.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Estructura de base de datos que utiliza el REDATAM.
La estructura de datos del REDATAM corresponde al modelo jerárquico, en
el cual los registros se enlazan en forma de estructura de árbol, donde el
nodo padre de información puede tener varios hijos. Por ejemplo:
Estado
Municipio
Parroquia
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Mientras que en el modelo relacional se vinculan distintas tablas mediante
el uso de claves, el modelo jerárquico organiza la información en una sola
tabla y establece las distinciones a través de la identificación de tipos de
registros. Por ejemplo, una base de datos en Access que almacene
información de estados y municipios, su modelo relacional correspondiente
sería el siguiente:
Estados
Código Estado
Nombre Estado
CE1
CE2
.
Municipios
Código Estado
Código Municip.
Nombre Muni.
CM1
CM2
.
En este caso la información correspondiente en ambas tablas es vinculada a
través del campo Código Estado.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
En el modelo jerárquico, la estructura sería la siguiente:
1 Código Estado Nombre E CE1 CE2
2 Código Municipio Nombre Mun CM1 CM2
Identifica el tipo de registro, el uno corresponde a
estado y el 2 a municipios
1 01 Distrito Capital CE1 CE2…
2 01 Libertador CM1 CM2…
1 02 Amazonas CE1 CE2…
2 01 Pedernales CM1 CM2
2 02 Puerto Ayacucho CM1 CM2
.
1 24 Zulia CE1 CE2…
2 01 Municipio 1 CM1 CM2
Toda los datos son dispuestos en
un archivo, la primera columna
identifica el tipo de registro. El
contenido de las siguientes
columnas depende del tipo de
registro asociado.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
1.2 Módulos de REDATAM
El REDATAM está conformado por cinco módulos:
Process: Tiene como función procesar datos de áreas
seleccionadas por el usuario, con comandos escritos en el lenguaje de
REDATAM o usando los Asistentes. También permite que el usuario
maneje las bases de datos REDATAM para expandir, anexar, o
desagregar y empalmar bases de datos.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Create: sirve para convertir una base de datos a formato REDATAM,
desde archivos en formato XBASE, ASCII, IMPS, ISSA, SPSS, CSPRO, o CHILLAN (Formato interno del R+SP).
XPlan, hace posible crear aplicaciones para el usuario final con
indicadores calculados para una base de datos Redatam determinada. Los usuarios de estas aplicaciones no necesitan conocer el lenguaje REDATAM +SP.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
WebServer, módulo que permite procesar bases de datos REDATAM a
través de Internet, requiere aparte de un Servidor Web de Windows
instalado.
VisualDDF, módulo que facilita la creación de diccionarios en formato
chillán (ddf) para la creación de bases de datos REDATAM.
Este curso abarca solamente el
módulo Procces.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
1.3 Definiciones generales.
Entidad
Se define una entidad (o instancia) como una unidad de una base de datos
que contiene información. Esta unidad es una representación dentro de la
base de datos de un objeto, persona, empresa… etc, del mundo real, y como
tal posee ciertos atributos que la diferencian del resto de entidades.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Algunos ejemplos de entidades
La entidad oficina puede tener
como atributos el número de
empleados y la cantidad de
computadoras
Para la entidad
vivienda los atributos
pueden ser el tipo y los
materiales de construcción
Para la entidad factura los atributos pueden
ser el monto y la fecha de facturación
Un concepto abstracto como el de Calidad puede ser visto como una Entidad y en este ejemplo sus
atributos son costos, precios, cliente, trazabilidad, y productividad.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
El concepto de Entidad en REDATAM
Son conjuntos de objetos lógicos organizados en forma jerárquica en la base
de datos. Una entidad dada puede ser el conjunto de estados, o el conjunto
de municipios, o viviendas o personas, etc., en un país. Todas las variables
que pertenecen a una entidad poseen ciertos atributos en común, como el
número de elementos y el mismo nivel de jerarquía. La entidad de más alta
jerarquía de una base es llamada entidad "raíz".
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Rama
Es el "paso" desde la "raíz" a una determinada entidad. Por definición (vea
Entidades Superiores), una entidad (y por ende sus variables) pertenece a
una única rama. Si se compara la estructura de una base multidisciplinaria
con un árbol, las "ramas" de la estructura son exactamente lo mismo que las
ramas del árbol, y las entidades corresponden a las hojas del árbol.
Nivel
Es el grado de profundidad de una entidad dentro de su rama. Por
construcción, la entidad "raíz" tiene nivel cero, la(s) entidad(es)
inmediatamente inferiores tienen nivel 1, y así consecutivamente.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Variables
Las propiedades o características de los elementos individuales de una entidad
están almacenados en variables, es decir, es asunto común a todos los
individuos de una población: edad, estado civil, cantidad de lluvia, etc. La
característica puede ser cualitativa (atributo) o cuantitativa (variable).
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Ejemplo de Entidad en REDATAM.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Ejemplo de Entidad en REDATAM.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Elementos de una entidad
Los miembros individuales de una entidad son denominados elementos de
una entidad. Por ejemplo, las municipios pertenecientes a la entidad
“municipio" son los elementos o casos de esa entidad.
Entidades superiores
Son todas las entidades que se encuentran en el "paso" desde la entidad
"raíz" hasta la entidad determinada.
Entidades inferiores
Son todas las entidades que se encuentran "dependientes" o "colgadas" de la
entidad determinada.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Entidad seleccionable y no seleccionables
Una condición que se debe mantener en las operaciones estadísticas es la del
secreto estadístico, que consiste en no evidenciar datos en los tabulados que
puedan utilizar ciertas unidades de observación tales como personas,
viviendas, empresas, unidades agropecuarias, entre otras.
El REDATAM permite gestionar cuales entidades pueden ser identificadas y
cuales no, estableciendo dos tipos de entidad: seleccionables y no
seleccionables.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Entidad seleccionable
Las entidades seleccionables tienen la propiedad de distinguir (identificar)
sus elementos por sus códigos y, por lo tanto, pueden participar en el proceso
de selección jerárquica. Es decir, para ser seleccionable una entidad necesita
poseer una variable que permita almacenar este código identificador. Por
ejemplo, si en la base de datos la entidad Municipio es seleccionable, esto
quiere decir que puede hacerse un procesamiento que arroje los datos de un
municipio en particular, digamos Libertador.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Entidad no seleccionable
Las entidades no poseen ninguna variable que permita almacenar este código
identificador. Por ejemplo, si en la base de datos la entidad persona no es
seleccionable, quiere decir que no podemos procesar información para una
persona en particular.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Diccionario
Un diccionario de datos es un documento que contiene la lista de las variables de
una base de datos, con la descripción de cada una de éstas.
En REDATAM el diccionario de datos tiene como extensión .dic, siendo los
archivos de este tipo los que se deben abrir para procesar alguna base de datos.
El diccionario contiene una lista de todas las variables de una base de datos para
cada nivel de la jerarquía (entidad), así como los códigos (valores) para cada
variable, con una descripción del significado de cada código.
Por ejemplo, los códigos para la variable sexo perteneciente al nivel persona son
1 y 2, en donde 1 = hombre y 2 = mujer.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Base de datos en REDATAM
Las bases de datos en REDATAM están constituidas por una serie de archivos
tipo puntero de extensión RBF y PTR. Estos archivos contienen en forma
sintetizada la información de la base de datos.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
http://www.eclac.cl/redatam/default.asp
Página web del REDATAM
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio 1. Ventana Inicial. Selección de preferencias. Abrir una base de
datos.
2. Ventana de Archivo: Abrir diccionario, abrir o crear programa,
exportar diccionario.
3. Ventana de diccionario: Informe de la consistencia, Localizar
archivo, Directorio de trabajo.
4. Procesador estadístico.
5. Herramientas: Descargar. Extraer. Concatenar, Crear archivo
puntero, Carga vectorial.
6. Ayuda.
2. Contenido del módulo REDATAM PROCESS
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Cuando se ejecuta el módulo REDATAM se activa la ventana inicial
contentiva del menú conformado por las siguientes opciones:
•Archivo.
•Diccionario.
•Procesador .
•Estadístico .
•y Ayuda.
2.1 Ventana inicial
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Para activar el menú de
preferencias, primero se hace clip
en el ícono de REDATAM
Desde esta venta se
selecciona la opción
de preferencias.
Desde esta ventana también se puede configurar algunas opciones de
presentación y funcionamiento del REDATAM, mediante el menú de
PREFERENCIAS.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Este menú consta de cinco
opciones que permiten establecer
los valores iniciales de
funcionamiento del programa. Por
ejemplo, en la pestaña General,
puede establecerse el directorio de
trabajo por defecto, en el cual se
grabarán las aplicaciones,
selecciones y salidas generadas.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Desde la pestaña de “Proceso”,
puede establecer el número de
decimales utilizados en las salidas
numéricas.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Desde la ventana inicial también se puede abrir la base de datos que va ser
procesada.
Puede abrir directamente la última
base de datos activada o abrir una
diferente desde el ícono Abrir.
.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Desde la ventana de archivo, se puede abrir el diccionario de datos, crear
un archivo nuevo (sintaxis , selección o composición de mapas) o abrir un
archivo existente (sintaxis, selección o composición de mapas).
2.2 Ventana Archivo.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Esta ventana pone a disposición del usuario una serie de herramientas que
permiten verificar y manejar el diccionario de datos.
2.3 Ventana Diccionario.
Para que las distintas opciones sean activadas debe abrir previamente un
diccionario de datos.
Hace un
reporte de la
integridad de
la base de
datos
Permite
localizar
variables de
la base de
datos
Permite
establecer la
forma en que
se
presentará el
diccionario
Muestra las
propiedades
de las
variables y
entidades
Permite
establecer el
directorio de
trabajo
Permite
establecer
las variables
de muestreo
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Salida del informe de consistencias
Bloque de entidades
Bloque de variables
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Opción Entidad.
Muestra información sobre las propiedades entidad resaltada. Para activarla
debe resaltar la Entidad para la cual quiere ver la información y hacer Clip
en Entidad.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Posteriormente se activaran las ventanas de propiedad de la Entidad.
Aquí la entidad seleccionada es Entidad
Federal, a la cual se le asignó el
nombre de ENTIDAD. Recuerde que
cuando hablemos de entidad lo
hacemos en términos
COMPUTACIONALES. En la base de
datos del Censo las entidades son:
PAIS, ENTIDAD, MUNICIPI,
PARROQUI,
CENTROPO,SEGMENTO, SECTOR,
MANZANA, EDIFICA,VIVIENDA,
HOGAR Y PERSONA.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Opción Variable.
Muestra información sobre la variable seleccionada. Para activarla debe
resaltar la variable para la cual quiere ver la información y hacer Clip en
Entidad.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Posteriormente se abre la ventana de Propiedades. Consta de tres pestañas:
General, Especificaciones Técnicas y Documentación. Desde estas ventanas se
puede modificar las propiedades de las variables.
No es conveniente que el usuario, si no es el administrador de la base de datos,
cambie las propiedades de las variables, aún cuando el sistema lo permita.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
La ventana de procesador estadístico permite elaborar tabulados en
forma rápida y sencilla, y dispone de las siguientes opciones.
Universo: Permite establecer filtros para las salidas. Por ejemplo, si
deseamos hacer un procesamiento solamente para personas mayores
de 15 años.
Selección: Permite abrir y activar una Selección Geográfica construida
previamente. Por ejemplo, una selección para procesar el Área
Metropolitana de Caracas.
2.3 Ventana Procesador Estadístico.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Estadísticas: Activa una ventana para calcular estadísticos básicos de
variabilidad y tendencia central de un conjunto de variables.
Frecuencias: Activa una ventana para realizar una frecuencia simple.
Cruce de variables: Activa una ventana para realizar un cruce de
variables.
Promedios: Activa una ventana para realizar un promedio.
Mediana: Activa una ventana para calcular la mediana de una
variable.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Conteo: Activa una ventana para realizar un conteo de elementos de
una entidad dada agregada a un nivel geográfico determinado.
Lista por Áreas: Activa una ventana para realizar la distribución de una
variable según un nivel geográfico determinado.
Ver tablas de salida: Permite abrir tabulados realizados previamente.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Ponen a disposición del usuario una serie de herramientas para manipular
las bases de datos de REDATAM: Descargar bases de datos (extraer una
base de datos a partir de la original),Extender base de datos (incorpora una
rama de entidades de otra base de datos), Concatenar (permite unir varias
bases de datos), Carga Vectorial (permite agregar variables) .
2.5 Herramientas.
El debido tratamiento de las opciones de Herramienta, esta fuera del
alcance de este taller.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio REDATAM dispone de un ayudante con el que podrá consultar acerca de
todas las opciones del sistema.
2.6 Ayuda.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Utilizando las opciones del menú de Procesos pueden obtenerse una
variedad de tabulados en forma sencilla, sin necesidad de programar.
Sin embargo, tiene como limitación que en esta forma de trabajo no pueden
generarse nuevas variables, lo cual si es posible desde el modo de
programación.
3. Procesamiento rápido
utilizando las opciones del menú del REDATAM
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
1.Realizar filtros mediante la Opción Universo.
2.Realizar selecciones geográficas.
3.Opción Estadísticas.
4.Opción Frecuencias.
5.Cruce de variables.
6.Promedio.
7.Mediana
8.Conteo.
9.Lista de áreas.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Lo primero que debe hacer para procesar una base de datos es abrir el
diccionario de datos correspondiente. Como fue señalado anteriormente,
esto lo puede hacer desde la ventana de inicio, indicando el diccionario
que debemos abrir.
1. Una vez abierto el diccionario, aparecerá en pantalla la información de
cada una de las entidades que conforman la base de datos y las
variables de cada una de estas entidades.
Abriendo la base de datos
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
2 Para visualizar las variables de una entidad en particular, debe hacer
“clip” una vez donde aparece el nombre de la entidad e
inmediatamente aparecerá en la ventana derecha o inferior
(dependiendo como está configurado el diccionario) la información de
todas las variables que conforman la entidad.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Variables de la entidad Hogar.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Por otra parte, para realizar satisfactoriamente los procesos en REDATAM,
es necesario disponer de información básica de las variables utilizadas.
Haciendo doble “clip” en una variable en particular, obtenemos
información respecto al rango de la variable (valor máximo y valor mínimo),
el tipo de variable (real, entera o cadena), valores fuera de rango y valores
no aplica.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
En este caso, la variable
nacionalidad es de tipo entero,
toma tres valores válidos, los
casos ignorados corresponden al
código 9 y los valores no aplica al
código 0.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio La opción Universe permite establecer filtros en los datos van a ser
procesados. Por ejemplo, si queremos realizar un conjunto de tablas
solamente para la población femenina, podemos establecer nuestro
universo para personas de sexo femenino.
3.1 Realizar filtros con la opción Universo.
Note que para referirnos a una variable en particular, el formato es
ENTIDAD.VARIABLE, en este ejemplo es PERSONA.SEXO
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Para realizar un filtro con la opción Universo, primero debemos
seleccionar la pestaña correspondiente del menú de Procesos, luego de lo
cuál se abrirá la siguiente ventana:
Guardar
expresión
Eliminar
expresión y
salir
Asistente para
construir
expresiones Limpiar la
pizarra.
Eliminar
expresiones
rotuladas
Pizarra para
construir
expresiones
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Podemos establecer el filtro de dos formas: la primera, escribiendo
directamente la expresión en la pizarra (PERSONA.SEXO=1), y la
segunda, utilizando el Constructor de expresiones . Para utilizar esta
herramienta, debemos hacer clip, en el ícono correspondiente y se abrirá
la siguiente ventana:
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Para subir
una variable
a la pizarra,
debemos
hacer doble
clip en la
variable
Operadores
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Es recomendable utilizar el generador de expresiones porque facilita la
construcción de expresiones complejas, por ejemplo si queremos hacer un
conjunto de procesamientos para la población masculina de menores de 15
años o mayores de 64:
PERSONA.SEXO=1 AND ( PERSONA.EDADN < 15 OR
PERSONA.EDADN >64 )
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Las selecciones constituyen colecciones de elementos de entidades
seleccionables. Cuando una selección es activada, los procesamiento
que se realicen sobre la base de datos estarán restringidos a los registros
de la selección. Por ejemplo, si creamos una selección que contenga
solamente al Municipio Libertador, cuando se hagan los procesamiento,
los datos arrojados corresponderán al Municipio Libertador. Si por
ejemplo, la entidad Vivienda de una base de datos censales es
seleccionable, podemos crear una selección que contenga incluso, sólo
una vivienda, y el procesamiento que se realice sobre los datos estará
restringido a la vivienda seleccionada.
3.2 Realizar selecciones.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Si la entidad es del tipo geográfica, podemos decir que son selecciones
geográficas que tienen una gran importancia para el aprovechamiento de
las bases de datos censales. Pueden construirse composiciones de áreas
geográficas para realizar procesamientos especiales. Por ejemplo,
podemos dividir el país en regiones geográficas, realizar una selección
para cada región geográfica definida, para obtener las características de
cada región construida.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Por ejemplo, podemos dividir el país en regiones geográficas, realizar una
selección para cada región geográfica definida, para obtener las
características de cada región construida. Una división geográfica utilizada
en Venezuela es la siguiente:
Región Capital, Región Central, Región de los Llanos, Región Centro-
Occidental, Región Zuliana, Región de los Andes, Región Nor-Oriental
Región Guayana, Región Insular.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Para crear una selección, se accede desde el Menú Principal, con la
opción Archivo->Nuevo->Selección.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
AL abrir o crear una selección,
aparece esta ventana, en la cual
puede modificar la selección que
esté realizando. El ícono en forma
de flecha le permite desplegar
los elementos de la entidad
seleccionada. El ícono cuadrado,
permite seleccionar el área
específica. Los elementos en
amarillo corresponden a entidades
seleccionadas. Para quitar la
selección en un elemento, haga
clip en el icono cuadrado de la
derecha. Para salvar la selección,
haga clip sobre el icono en forma
de diskette.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Para grabar la selección
deberá darle un nombre. La
extensión de las selecciones
es .sel
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
La opción estadística sirve para elaborar una tabla con las estadísticas
básicas (Suma, Mínimo, Máximo, Amplitud, Media, Mediana, Varianza,
Desviación Estándar) de las variables seleccionadas.
Para ejecutar esta opción deberá hacer clips en la pestaña
correspondiente, tras lo cual se abrirá la ventana de Estadísticas, que
consta de las opciones: Especificación de tabla, Especificación de
Ejecución y Avanzado.
3.3 Estadísticas.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Pestaña para la opción de Estadísticas
Especificaciones
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
La caja de Especificación de la
Tabla, permitirá incluir las
variables seleccionadas, para lo
cual deberá “arrastrar” desde el
diccionario de datos las
variables correspondientes.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio En el siguiente ejemplo se procesan las estadísticas de la variable edad.
Conteo 11402869
Suma 299508068
Mínimo 0
Máximo 110
Amplitud 110
Media 26,2660
Mediana 22
Varianza 362,3714
Desviación Estándar 19,03605
Coeficiente de Variación 72,4740
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Especificación de ejecución y Avanzado.
Las ventanas Especificación de ejecución y Avanzado, son comunes en las
siguientes opciones del Procesador Estadístico: Estadísticas, Frecuencia, Cruce
de Variable, Promedio, Mediana, Conteo y Lista de Área. Por lo tanto, será
explicado únicamente en este apartado.
Especificación de ejecución.
Especificación de ejecución permite asignar un Nombre y Título a la salida,
activar que las variables muestren los Códigos y Rótulos (etiquetas) y activar un
archivo de selección.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
En la caja de Especificación de Ejecución podrá
asignar el Nombre de la salida, Códigos y Rótulos
o etiquetas, Título de la salida y Selección de Área.
Puede activar una Selección creada por usted, o
hacer uso de la opción Inline Selection, que le
permitirá filtrar los datos mediante el código de
cualquier entidad seleccionable.
En este caso se hizo la sección
del Municipio Libertador,
utilizando un archivo de
selección creado previamente
En este caso, se seleccionó la
misma entidad geográfica, pero
utilizando el código del
municipio Libertador.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Avanzado
Esta opción, muestra una caja en la que se puede crear un Filtro Universal,
seleccionar un Quiebre de Área y asignar un Peso a los casos.
Filtro Universal: son restricciones que se establecen a los datos, por ejemplo si
establecemos que la salida a realizar incluirá solamente personas menores de
15 años.
Quiebre de Área: Corresponde al nivel de desagregación geográfica de los
datos. Por ejemplo, si establecemos como Quiebre de Área el nivel de Municipio,
se producirán tantos cuadros de salidas como municipios estén codificados en la
base de datos.
Peso: Permite establecer una variable como peso o ponderador de los casos.
Por ejemplo para expandir las encuestas por muestreo se establece como Peso
el factor de expansión.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Mediante el filtro universal se establecen
condiciones a los datos para que puedan
formar parte del procesamiento. En la caja
de arriba se ha establecido que el sexo de
las personas sea masculino, lo que quiere
decir que las salidas obtenidas incluirán
solamente a las personas de sexo
masculino.
Para construir expresiones más complejas
se dispone del constructor de expresiones,
que se activa haciendo clip al ícono
correspondiente.
Generador de expresiones
Filtro Universal
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Caja de
expresiones
Para construir una expresión deberá proceder de la
siguiente manera:
Caja de
entidades
Caja de
variables
Caja de
valores
1. Desde la primera columna seleccione el nivel o entidad
que almacena la variable o característica que va a usar
en la condición, con un solo clic.
2. Luego, desde la segunda columna seleccione la variable
propiamente tal y haga doble clic para que el nombre de
ésta pase a la ventana superior, en donde se escribe la
expresión.
3. Luego del nombre de la variable se debe seleccionar el
operador que se desea usar: >, <, <>, =, >=, <=.
4. Desde la tercera columna se selecciona el valor de la
categoría que corresponde a la expresión o simplemente
se escribe el valor al lado del operador.
5. Si la expresión utiliza más de una variable se debe unir
la expresión ya escrita con un AND u OR.
6. Para completar la segunda condición, se repiten los
pasos anteriores con la segunda variable.
Constructor de expresiones.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Ejemplo de construcción de una expresión compleja.
Se desea filtrar los datos seleccionando solamente la población femenina
menores de 15 años o mayores de 64 años que vive en zonas rurales.
1. El primer paso a seguir es escribir la condición en términos sencillos
antes de crear la expresión en REDATAM, de modo tal que podamos
tener claridad respecto a lo que vamos a hacer en el programa. En
este caso pudiera ser lo siguiente:
ZONA =RURAL Y SEXO=FEMENINO Y EDAD <15 O ZONA=RURAL
Y SEXO =FEMENINO Y EDAD MAYOR QUE 64.
Para que el programa ejecute el filtro que hemos definido, es
conveniente utilizar paréntesis para organizar las expresiones.
(zona=rural ) y (sexo=femenino) y (edad<15 o Edad>64)
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio 2. Lo siguiente, es ir creando la expresión variable
por variable. A la izquierda se introduce la
condición de ruralidad de las mujeres, siendo a
la variable URBRUL de la entidad CENTROPO, la
que almacena la condición urbano – rural de los
centros poblados donde fueron empadronadas
las personas.
3. A continuación, se agrega el conector AND (Y), y
se establece la condición de que el sexo sea
femenino.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio 4. Lo siguiente es agregar las condiciones respecto a
la edad de las mujeres.
5. A la izquierda, se agregan los paréntesis
correspondientes .
6. Finalmente, para grabar la expresión se debe
hacer clip en el ícono de grabar.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
La opción Quiebre de Área permite
establecer el nivel de desagregación
geográfico al cual se desplegaran los
resultados. Para seleccionar una opción
de quiebre de área simplemente utilice el
combo box para desplegar y seleccionar
el área correspondiente.
Por ejemplo si seleccionamos municipios,
se creará un cuadro de salida para cada
municipio, dependiendo de las
condiciones establecidas.
Quiebre de Área
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio La opción ponderar casos permite establecer
una variable (o combinación de variables) como
peso o ponderador de los casos de la base de
datos activa. Se usa especialmente para aplicar
factores de expansión en muestras, pero
también cuando se desea atribuir valores de
una variable a casos dados en una distribución.
Por ejemplo si queremos obtener el total de
hijos por grupos de edad de las madres,
tendríamos que establecer como peso la
variables total de hijos a una frecuencia de
grupo de edad.
Pesos
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Esta opción permite obtener la distribución de frecuencia de un
conjunto de variables seleccionadas por el usuario.
Para ejecutar esta opción deberá hacer clips en la pestaña
correspondiente, tras lo cual se abrirá la ventana de Frecuencia, que
consta de las opciones: Especificación de tabla, Especificación de
Ejecución y Avanzado.
3.4 Frecuencias.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio La caja de
Especificación de la
Tabla, permitirá incluir
las variables
seleccionadas, para lo
cual deberá “arrastrar”
desde el diccionario
de datos las variables
correspondientes.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Esta opción permite realizar un cruce de variables. Al seleccionar la opción de
cruce de variables se desplegará la ventana de Ejecución de Tablas, la cual
contiene cajas, una con el titulo de Variable y la otra con el titulo Cruzada por.
Los valores de las variables que se coloquen en la primera caja aparecerán en
las salidas como filas, mientras que las variables que se coloquen en la caja
Cruzada por, aparecerán como columnas . Para ejecutar esta opción deberá
“arrastrar” desde el diccionario las variables seleccionadas e incluirlas en las
cajas correspondiente.
3.5 Cruce de variables.
Variables que entraran como filas
Variables que entraran como columnas
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio En este caso,
la variable
GRPEDAD es
desplegada
como fila,
mientras que
los valores de
sexo, son
desplegados
como
columnas.
Una recomendación general para este tipo de cuadros, es que las variables con
mayor número de categorías sean ingresadas como columnas, es decir en la
caja Variable.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio El promedio de una variable en un conjunto de datos, se obtiene sumando los
valores de la variable y dividiendo los resultados, entre el número de casos.
La ventana “Promedio” calcular el promedio de una variable cuantitativa.
Al seleccionarse esta opción aparecerá una ventana con tres cajas. En la
primera caja (“Promedio de”) se debe colocar la variable para la cual se
realizará el promedio. La segunda y tercera caja son optativas. Si se coloca una
variable en la segunda caja (“Variable”), se obtendrá el promedio para cada
valor de ésta. Si se coloca otra variable en la caja ”Cruzada por”, se obtendrá el
promedio para cada categoría cruzada de ambas variables.
Para ejecutar esta opción deberá “arrastrar” desde el diccionario, las variables
seleccionadas e incluirlas en las cajas correspondiente.
3.6 Promedio.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Variables que entraran
como filas
Variables que entraran
como columnas
Variables a promediar
Ventana Promedio
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
En este caso, se
obtiene el
promedio de la
edad, cruzada
por sexo e idioma
de las personas
en el estado
Amazonas
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
En un conjunto de datos ordenados, la mediana de una variable, representa el
valor central. La ventana “Mediana”, permite calcular la mediana de una variable
cuantitativa. Al seleccionarse esta opción aparecerá una ventana con tres cajas.
En la primera caja se debe colocar la variable para la cual se realizará la
mediana. La segunda y tercera caja son optativas. Si se coloca un variable en la
caja de “Variable”, se obtendrá la mediana para cada valor de ésta. Si se coloca
otra variable en la caja “Cruzada por”, se obtendrá la mediana para cada
categoría cruzada de ambas variables.
3.7 Mediana.
Variable que se
realizará la mediana.
Variables que entraran
como filas.
Variables que entraran
como columnas.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
En este caso, se
obtiene la edad
mediana, cruzada
por sexo e idioma
de las personas
en el estado
Amazonas.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
Permite realizar el conteo de elementos de una entidad dada, agregada a un
nivel geográfico determinado. La entidad agregada debe ser una entidad
seleccionable.
Para ejecutar esta opción, deberá seleccionar primero la entidad agregada
“Nivel de Salida” y posteriormente la entidad a la que se le contaran los
elementos.
3.8 Conteo.
Entidad agregada,
Nivel de salida
Entidad a la que se contaran
sus elementos
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
En este caso, se
hace un conteo
de municipios a
nivel de entidad.
El resultado
arrojado son los
municipios que
tiene cada estado
del país.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Permite realizar la distribución de una variable según Entidad seleccionada. La
salida es una tabla, cuyas filas son los elementos de la entidad seleccionada y
su columna los valores de la (s) variable (s) seleccionada (s). Cada casilla
contiene el total de elementos que tiene un valor de la variable en cada área de
la entidad seleccionada.
3.9 Lista de área.
Entidad para la que se
obtendrá la Lista de área
Variables incluidas en la
Lista de área
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio
En este caso, se
realizo una Lista
de Áreas de la
variable sexo a
nivel de estado.
Para cada
entidad se
obtiene el total de
hombres mujeres
y total de
personas.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Subsidio Al seleccionar esta opción se desplegaran las tablas de salidas realizadas
previamente.
3.10 Ver tablas de salida.
Al hacer clip al botón derecho
del mouse, sobre el ícono de
identificación del tabulado, se
desplegará un menú.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Menú de salidas
Permite elaborar gráficos.
Permite guardar en formato Excel los
tabulados realizados.
Profesor: Gerardo Correa
Taller de procesamiento de datos censales con REDATAM
Para copiar el
gráfico como
imagen deberá
hacer clip aquí.