instituto tecnolÓgico y de estudios superiores de · instituto tecnolÓgico y de estudios...
Post on 19-Sep-2018
227 Views
Preview:
TRANSCRIPT
Determinación de Niveles Socioeconómicos en elárea Metropolitana de Monterrey-Edición Única
Title Determinación de Niveles Socioeconómicos en el áreaMetropolitana de Monterrey-Edición Única
Issue Date 2000-12-01
Publisher Instituto Tecnológico y de Estudios Superiores de Monterrey
Item Type Tesis de maestría
Downloaded 20/09/2018 03:19:37
Link to Item http://hdl.handle.net/11285/568325
INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DEMONTERREY
CAMPUS MONTERREY
DIVISIÓN DE CIENCIAS Y HUMANIDADES
PROGRAMA DE GRADUADOS EN ESTADÍSTICA APLICADA
TESIS
DETERMINACIÓN DE NIVELES SOCIOECONÓMICOS EN EL ÁREAMETROPOLITANA DE MONTERREY
MONTSERRAT JACQUELINE LIMÓN MARTÍNEZ
MONTERREY, N. L. DICIEMBRE DEL 2000
INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DEMONTERREY
CAMPUS MONTERREY
DIVISIÓN DE CIENCIAS Y HUMANIDADES
PROGRAMA DE GRADUADOS EN ESTADÍSTICA APLICADA
Los miembros del comité de tesis recomendamos que el presente trabajo de tesispresentado por Montserrat Jacqueline Limón Martínez sea aceptado como requisitoparcial para obtener el grado académico de Maestro en Ciencias con especialidad en:
ESTADÍSTICA APLICADA
Comité de tesis:
DraTTTfivia Carrillo GamboaAsesora
Dr. JoséJSúadalupe Ríos Alejandro Dra. Rebeca Romero ÁlvarezSinodal Sinodal
APROBADO
Dra. Rebeca Romero ÁlvarezCoordinadora del Programa de la Maestría en Estadística Aplicada
Diciembre del año 2000
Agradezco al Departamento de Matemáticas
el apoyo y patrocinio para la realización
de este trabajo de tesis,
especialmente a la Dra. Olivia Carrillo Gamboa.
VI
ÍNDICE
CAPITULO 1
Introducción
1.1 Antecedentes 1
1.2 Justificación 3
1.3 Objetivos 4
1.3.1 Objetivo General 4
1.3.2 Objetivos Específicos 4
1.4 Alcances y limitaciones 5
1.5 Contenido 5
CAPÍTULO 2
Marco Teórico y Metodología
2.1 Métodos estadísticos utilizados durante el desarrollo de la investigación 7
2.1. lMuestreo por conglomerados en dos etapas 7
2.1.2 Métodos Estadísticos de Clasificación 8
2.1.2.1 Análisis de conglomerados 8
2.1.2.2 k-Means 9
2.1.2.3 Análisis Discriminante 10
2.1.2A Detección Automática de Interacción utilizando Ji-Cuadrada (Chi Squared
Automatic Interaction Detector CHATO) 11
2.2 Construcción del cuestionario 12
2.3 Selección de la muestra 13
2.4 Levantamiento de la encuesta 14
2.5 Definición de variables y códigos 15
2.6 Captura y validación 15
vii
CAPITULO 3
Análisis de la Información
3.1 Análisis descriptivo 17
3.2 Selección de Variables para la clasificación por conglomerados 17
3.3 Clasificación de los elementos de la muestra 20
3.4 Determinación de factores que definen la segmentación 25
3.5 Comparación de resultados con los métodos empleados por la AMAI y
la UNEEST 32
3.6 Características binarias consideradas 37
3.7 Características de los grupos resultantes 38
3.7.1 Características de los grupos resultantes de la segmentación en cuatro grupos 38
3.7.2 Características de los grupos resultantes de la segmentación en cinco grupos 41
CAPÍTULO 4
Aplicación del Método de Detección Automática de Interacción Ji-cuadrada
(CHAID)
4.1 Definición de criterios de ejecución 44
4.1.1 Reglas deparada 45
4.2 Variables para el estudio 46
4.3 Árboles de decisión para la determinación de factores a preguntar en un
cuestionario breve 47
4.4 Cuestionario propuesto 53
viii
CAPITULO 5
Conclusiones
5.1 Observaciones 58
5.2 Conclusiones 59
5.3 Ventajas de utilizar el instrumento propuesto 61
5.4 Recomendaciones 61
ANEXO 1Cuestionario
ANEXO 2Descripción de variables usadas en el estudio
ANEXO 3 KGráficas de barras e histogramas
ANEXO 4 UCentros de grupo
ANEXO 5 AAArboles de decisión
REFERENCIAS CC
IX
TABLAS
Tabla 3.1 Número de casos en cada uno de los niveles por grupos
Tabla 3.2 Distancia entre los centroides de las variables para clasificación en tres grupos
Tabla 3.3 Distancia entre los centroides de las variables para clasificación en cuatro grupos
Tabla 3.4 Distancia entre los centroides de las variables para clasificación en cinco grupos
Tabla 3.5 Varianza explicada por las Funciones Discriminantes para tres grupos
Tabla 3.6 Coeficientes de las Funciones Discriminantes para tres grupos
Tabla 3.7 Distancias entre centroides para cuatro grupos
Tabla 3.8 Coeficientes de las Funciones Discriminantes para cuatro grupos
Tabla 3.9 Porcentaje de varianza explicada para cinco grupos
Tabla 3.10 Coeficientes de las Funciones Discriminantes para cinco grupos
Tabla 3.11 Tabla comparativa tres grupos vs criterio UNEEST
Tabla 3.12 Tabla comparativa cuatro grupos vs criterio AMAI
Tabla 3.13 Razón de discrepancias entre los métodos Tesis-AMAI por número de cuestionario
Tabla 3.14 Tabla comparativa cinco grupos vs UNEEST
Tabla 3.15 Razón de discrepancias ente los métodos Tesis-UNEEST por número de cuestionario (1)
Tabla 3.16 Razón de discrepancias ente los métodos Tesis-UNEEST por número de cuestionario (2)
ILUSTRACIONES
Ilustración 3 1 Mapa de la muestra segmentada en tres grupos
Ilustración 3 2 Mapa de la muestra segmentada en cuatro grupos
Ilustración 3 3 Mapa de la muestra segmentada en cinco grupos
CAPITULO 1
Introducción
El conocimiento de la segmentación de una población por nivel
socioeconómico es claramente factor indispensable para el
direccionamiento de un gran número de las decisiones del Estado y del
sector privado. En esta sección se presentará la motivación para la
realización del presente estudio y las características su contenido.
1.1 Antecedentes
Dentro de los principales objetivos de un procedimiento para la segmentación de una
población se encuentra la necesidad de información clara y precisa sobre el tamaño y las
características que definen a cada uno de los grupos que la forman. El reconocer
similitudes, diferencias, potencialidades y carencias en cada grupo hace más sencilla la
toma de decisiones respecto a las medidas aplicables al tratamiento de dicha población.
Es ésta la razón por la cual, tanto el sector público como el privado, se han visto en la
necesidad de segmentar poblaciones típicamente para definir políticas o mercados
objetivo respectivamente.
El nivel socioeconómico es uno de los criterios más comunes de clasificación de los
habitantes de una zona geográfica. Fragmentar la población bajo este criterio representa
marcar las diferencias no sólo de ingreso, sino de diversos elementos que conformen el
estilo de vida, los servicios de que disponen, las costumbres, el nivel cultural y el
educativo.
El conocer la estructura de una población por características socioeconómicas semejantes
ha representado uno de los fundamentos de las decisiones en la vida política y social de
las Naciones. Importantes esfuerzos de conocimiento de la población en este rubro han
realizado diversos grupos e instituciones tanto públicas como privadas. El INEGI
(Instituto Nacional de Estadística, Geografía e Informática) realizó en el año 1998 un
'Estudio de Niveles de Ingreso en México'. Sin embargo esta institución y algunas otras
gubernamentales, miden principalmente el nivel de pobreza, pues su objetivo, más que
describir la población, es apoyar al Estado a localizar áreas problemáticas y con escasez
de servicios públicos para mejorar el nivel de vida de los habitantes y así fomentar el
desarrollo del país. Esta es la razón por la cual los estudios se dirigen con mayor
intensidad a la sección de la población con pocos recursos, haciendo a un lado los grupos
con mejores condiciones de vída. Por otro lado, el sector privado se interesa en detectar
claramente las necesidades y hábitos de consumo de todos los niveles socioeconómicos
para establecer estrategias de mercado y direccionamiento de productos dadas las
características de población y el poder adquisitivo.
En resumen, es objeto especial y de gran importancia, la estructura social y económica de
las poblaciones, al grado que el Estado y el sector privado han invertido una gran
cantidad de recursos en desarrollar técnicas de segmentación de la población por nivel
socioeconómico.
El Estado busca medir la pobreza con el fin de proveer de una vida digna a la gente que
cuenta con menos recursos; mientras que el sector privado busca la segmentación de la
población confines de mercadeo, es decir, conocer el número y las características de las
personas que integran cada grupo al cual va dirigido su producto. Es claro que aunque los
objetivos de ambos grupos son distintos sin duda alguna tienen siempre presente que esta
información les permitirá lograr mejor sus objetivos.
1.2 Justificación
Ante la importancia del estudio de los grupos de población por nivel socioeconómico y
como apoyo a la orientación de su desarrollo económico y social, es necesario conocer
herramientas y metodologías adecuadas para el estudio de su estructura y tener una clara
definición de cada uno de sus segmentos. Esta necesidad primordial es el motivo de este
trabajo de tesis.
Se requiere de un importante esfuerzo para conocer la segmentación más cercana a la
realidad dentro de un área geográfica, especialmente cuando existen marcadas diferencias
entre los extremos y cierto grado de complejidad en la identificación de las diferencias
entre lo que podría llamarse 'población central'.
Monterrey es una de las ciudades más importantes del país pues genera el 4% del PIB
nacional según lo reporta el Sistema Municipal de Bases de Datos (SIMB AD) del INEGI
en 1998. Es además la que cuenta con mayor ingreso per cepita, situación que representa
una interesante área de oportunidad para el comercio. Sin embargo, el Área
Metropolitana de Monterrey es un mosaico que incluye marcadas diferencias entre
niveles socioeconómicos: desde la pobreza extrema hasta la total opulencia. Surge el
problema entonces de ubicar y conocer a estas poblaciones para facilitar su tratamiento
por parte de entidades gubernamentales al igual que las privadas. Para resolver este
problema y contar con información sobre la población de Monterrey y su Área
Metropolitana, esta investigación estudia el número identificable de grupos de población
por nivel socioeconómico en el Área Metropolitana de Monterrey, sus características y
los factores que los definen.
Una vez identificados los niveles socioeconómicos se presenta el problema de localizar a
un individuo nuevo en la misma población (no incluido en la muestra original) dentro de
alguno de los grupos. Para realizar esta tarea, se requieren instrumentos de calidad por
medio de los cuales se pueda llevar a cabo esta clasificación con un alto grado de
confiabilidad. Es ésta la razón por la que el presente trabajo incluirá también la
construcción y propuesta de un instrumento, específicamente un cuestionario breve y
fácil de contestar por parte de los encuestados en cualquier nivel sociocultural y
económico, y que conlleve naturalmente a la clasificación de un individuo en su
correspondiente nivel socioeconómico. Es necesario, de igual manera, que la asignación
realizada sea altamente confiable. Para dicho efecto, se utilizarán técnicas de
segmentación de mercado, como los árboles de decisión a través de la técnica CHAID
(por sus siglas en inglés: Chi-squared Automatic Interaction Detection) (Assael and
Roscoe, 1976).
1.3 Objetivos
1.3.1 Objetivo General
Este trabajo de tesis tiene como objetivo general conocer el número distinguible de
grupos de población en Monterrey y su Área Metropolitana, con características sociales y
económicas similares, además de identificar los factores que mejor los definen.
1.3.2 Objetivos Específicos
1- Crear un cuestionario a priori como instrumento capaz de detectar los diferentes
niveles socioeconómicos. Este instrumento puede contar con un número considerable de
preguntas claras y fáciles de responder por parte del entrevistado, para obtener la mayor
cantidad de información posible acerca de cada uno de los encuestados.
2.- Obtener el número de niveles socioeconómicos claramente identificables a través de
métodos estadísticos multivariados aplicados a la información obtenida de este primer
instrumento.
3.- Encontrar factores relevantes que definen la segmentación de la población en los
grupos encontrados.
4 - Con base en los factores principales encontrados, proponer un cuestionario, con un
número reducido de preguntas, capaz de clasificar a un individuo en los niveles
socioeconómicos que le correspondan.
1.4 Alcances y limitaciones
Es necesario aclarar que este estudio cubrirá sólo el área correspondiente a Monterrey y
los municipios conurbados. Esto significa que no podrá ser aplicado en otras zonas del
país. Esta consideración es motivada por la existencia de características particulares
propias de cada región del país y cada una con diferente nivel de impacto en el nivel
socioeconómico. No es posible comparar por medio de los mismos criterios a la
población de Monterrey y su Área Metropolitana con, por ejemplo, la Ciudad de México
o cualquier otra del país o del mundo.
Hay que hacer notar de igual manera que la muestra con la que se trabajará en este
estudio es reducida, es decir, el análisis puede ser considerado como 'prueba piloto'. Para
aplicaciones que requieran una clasificación más refinada, o bien, a mayor escala,
deberán hacerse estudios con una muestra de tamaño mayor para poder generar los
niveles de confiabilidad deseados y disminuir el error por muestreo.
1.5 Contenido
El contenido del segundo capítulo incluirá la metodología estadística empleada, además
de la construcción del cuestionario apriori, la descripción del proceso de levantamiento
de información, el manejo de los recursos empleados y los problemas que se enfrentaron
durante estos proceso.
La identificación del número de grupos, la segmentación de la población en los niveles
socioeconómicos, resultado del análisis multivariado de la información arrojada por las
entrevistas realizadas serán parte del tercer capítulo. Este capítulo tratará también la
detección de factores determinantes de la segmentación.
La creación del instrumento corto a través de la aplicación del análisis CHAID a los datos
muéstrales se desarrollará en el capítulo cuarto, para cubrir con esto los objetivos del
estudio.
Las conclusiones y las recomendaciones resultado de la investigación serán presentados
en el quinto capítulo de este trabajo de tesis.
CAPITULO 2
Marco Teórico y Metodología del Estudio
Este estudio fue desarrollado siguiendo un proceso resumido a: revisión
bibliográfica para determinar los métodos estadísticos a utilizar,
construcción del cuestionario fuente, aplicación de la encuesta, validación
de datos, análisis de la información, resultados, construcción del
cuestionario corto y las conclusiones. En este capítulo se desarrollarán
brevemente los métodos que fueron utilizados y la parte correspondiente
al levantamiento de la encuesta.
2.1 Métodos estadísticos utilizados durante el desarrollo de la investigación
Llevar a cabo un estudio como el que se presenta en este documento implica una rigurosa
metodología estadística. Definir el proceso de muestreo mediante la selección y
aplicación de una metodología adecuada es tan importante como decidir el método a
emplear para el análisis de los resultados de la encuesta y la segmentación de la
población. Conocer el método de construcción de cuestionarios breves es principio
fundamental de un buen resultado. En este apartado se revisarán de manera breve todos
los métodos utilizados para lograr los objetivos del trabajo de tesis.
2.1.1 Muestreo por conglomerados en dos etapas
Para el levantamiento de la encuesta fue necesario un proceso de selección de muestra.
El método utilizado en este estudio para seleccionar la muestra objetivo fue el muestreo
por conglomerados en dos etapas, proceso del que se obtiene un único elemento por
conglomerado, esto generó una muestra final equivalente a una muestra aleatoria simple.
Si una población puede subdividirse en unidades más pequeñas y se toman n unidades de
las cuales se submuestrean m subunidades, se llama muestreo por conglomerados en dos
etapas. Se comienza por seleccionar unidades primarias y después se obtienen muestras o
subunidades de cada una de las unidades primarias elegidas. La idea es llevar a cabo un
muestreo simple para elegir las subdivisiones y de esta selección hacer un muestreo
simple dentro de cada división. El muestreo aleatorio simple consiste en seleccionar n
elementos de una población de tamaño N de tal manera que todas las posibles
combinaciones de N en n tengan exactamente la misma probabilidad de ser elegidas. Los
n elementos que se eligen de la población se extraen realizando un proceso de generación
de números aleatorios de tal manera que a cada uno de los N elementos se le asigne un
número y se seleccionen los que coincidan con los obtenidos aleatoriamente.
2.1.2 Métodos Estadísticos de Clasificación
Como resultado de la aplicación del proceso de una encuesta, se obtiene una gran
cantidad de información que será la fuente para hacer inferencia sobre la población. Es
claro entonces que, el objetivo único de la aplicación del cuestionario a priori creado
para este estudio, es recopilar información relevante que llevará a la segmentación de la
población muestreada en grupos internamente homogéneos.
2.1.2.1 Análisis de conglomerados
La técnica de análisis de conglomerados básicamente agrupa a los individuos que tienen
características similares. Este tipo de análisis no hace supuestos sobre el número de
grupos o la estructura de los grupos. Los grupos se hacen con base a las similitudes o
distancias (disimilaridades). La entrada son datos similares o datos de los cuales pueden
ser calculadas las similitudes. El objetivo básico es agrupar de forma natural los
individuos en la muestra. La clasificación se hace midiendo la cercanía dependiendo del
tipo de variable (discreta, ordinal, binaria, nominal). Si son discretas o continuas se hace
mediante la distancia euclidiana d(x,y) = yj(x - y) (x - y) donde x y y son vectores que
epresentan la posición de dos puntos entre los cuales se medirá la distancia (Manly 1995).
2.1.2.2 K Means
Este tipo de agrupamiento de individuos es empleado con el fin de obtener los grupos
identificables en la muestra y las proporciones que cada uno representa con respecto a la
población total. Fue el primer proceso estadístico mediante el cual se trató la información
obtenida de la encuesta para identificar los grupos o niveles socioeconómicos existentes.
Por medio de este proceso se detectaron las características que definieron la formación de
estos grupos, al igual que la cantidad de elementos en cada uno.
El algoritmo de clasificación en conglomerados por 'k-means' está basado en distancias
euclidianas de las observaciones a un centroide (media) que se encuentre más cercano a
ellas. El método consiste en repetir iterativamente tres pasos (Hawkins 1982):
1. Se particiona la muestra en k grupos iniciales arbitrarios.
2. Se toma una observación y se incluye al grupo cuyo centro esté más cerca. Y se
recalculan los centros con esta observación en su nueva posición.
3. Se repite el paso 2 hasta que no se puedan realizar más movimientos de las
observaciones hacia otros grupos.
La elección del número de grupos k es pre-establecida por la experiencia del estadístico o
del especialista que conozca los datos a priori. En caso de no conocerse el número
adecuado de grupos k, se realizan pruebas hasta obtener grupos suficientemente
homogéneos y con la cantidad de elementos adecuados ya sea por conocimiento
anticipado de las proporciones o bien por la regla empírica general de que ninguno de los
grupos debe ser menor a un cuarto del grupo más grande.
2.1.2.3 Análisis Discriminante
El objetivo del análisis discriminante es saber cómo es posible separar dos o más grupos
de individuos a través de medidas expresadas como funciones lineales de las variables
que los describen. Una vez que se tienen listos los grupos identificados, es necesario
saber qué factores hacen posible esta clasificación, es decir, qué variable o variables son
indispensables para obtener dichos grupos.
El proceso de este análisis puede definirse mediante m muestras aleatorias de diferentes
grupos de tamaños ni,...nm, y valores disponibles para las p variables Xh...,Xp de cada
miembro de la muestra. La función discriminante basada en las distancias de
Mahalanobis, toma la media de los vectores para las m muestras como estimación de la
media verdadera. Calcula la distancia de cada individuo al centro del grupo (media) con
V P
la fórmula: Df ={x-x¡)C~l(x-x¡) = ̂ ^(xr-xri)Cr,(x¡-xsl) donde D es la
distancia del elemento seleccionado al centroide del grupo, x es el vector que contiene los
valores de las variables, x es el vector de medias del grupo respecto al que se está
midiendo la distancia y C es una matriz de tamaño pxs (Johnson and Wichern,
1992).Las funciones discriminantes canónicas son funciones de las variables X¡, ...Xp que
como combinación lineal pueden separar los m grupos lo mejor posible:
Los grupos pueden separarse usando z si los valores de las medias varían
considerablemente de grupo a grupo. Una manera de encontrar los coeficientes aj,...,ap,
es maximizar la razón F para un ANOVA de una entrada con hipótesis nula de igualdad
de medias. La idea es que la combinación lineal para una F sea lo más grande posible
(Fisher 1958).
10
2.1.2.4 Detección Automática de Interacción utilizando Ji-Cuadrada (Chi Squared
Automatic Interaction Detector CHAID)
El método CHAID (Chisquared Automatic Interaction Detector) es una técnica que se
utiliza en la segmentación de mercados. Se diseñó para dividir una población en
categorías a través de información obtenida de encuestas donde los datos resultantes son
una combinación de variables ordinales, nominales, discretas y continuas. Esto quiere
decir que este método es capaz de dividir una población en dos o mas segmentos que
tiene diferencias con respecto a un criterio determinado.
Este método se utilizó para establecer las preguntas del instrumento breve de
clasificación en niveles socioeconómicos, es decir, se aplicó este procedimiento a los
datos muéstrales y se obtuvieron los predictores (variables que definen las características
de pertenencia a un grupo). Estos predictores son la base de las preguntas del cuestionario
breve que se busca en los objetivos del estudio.
El problema de describir en forma simple un conjunto de datos relativamente grande
considera muchos vectores, cada uno representando una variable. En cada uno de éstos,
se generan segmentos por tipo de información, cada tipo corresponde a una
categorización de las respuestas a la pregunta asociada a la variable. De estos vectores,
uno es la variable dependiente. Los elementos restantes son predictores y sus categorías
pueden o no ser ordinales. Un conjunto de datos típico en un estudio multivariado tiene
cientos de vectores con varios elementos cada uno.
CHAID particiona los datos exhaustivamente en subgrupos mutuamente excluyentes, los
cuales describen la variable dependiente en la mejor forma. Los subconjuntos se
construyen usando pequeños grupos de predictores. Los predictores seleccionados pueden
ser usados para análisis posteriores, para la predicción de la variable dependiente o en
lugar del conjunto total de datos en subsiguientes recolecciones de datos.
11
En el método CHAID se procede por pasos. Primero se encuentra la mejor partición para
cada predictor individual, luego, se comparan los predictores y se escoge el mejor. Los
datos se subdividen de acuerdo con el criterio predictor escogido. Cada uno de estos
subgrupos son reconsiderados independientemente con el fin de producir divisiones
subsiguientes para el análisis. El tipo de cada predictor determina los agrupamientos
permisibles de sus categorías con el objeto de construir una tabla de contingencia con el
menor nivel de significancia de acuerdo a la prueba Ji cuadrada. (Conover 1971). Esto
implica que existen suficientes observaciones para asegurar la validez de la prueba. Si
este no es el caso, entonces algún otro criterio debe usarse tal como la prueba exacta de
Fisher (Conover 1971).
2.2 Construcción del cuestionario
Una vez concluida la revisión bibliográfica se procedió a la elaboración del cuestionario
para el estudio. Para la creación del instrumento se hizo una revisión de cuestionarios ya
existentes, principalmente de las preguntas realizadas por el INEGI en el Conteo General
de Población y Vivienda de 1995 y el utilizado por la Asociación Mexicana de Agencias
de Investigación (AMAI) en su versión "6x4" (Clasificación en cuatro niveles
socioeconómicos basándose en seis características). Se generaron un número importante
de preguntas de las cuales fueron seleccionadas 117 que constituyeron el cuestionario
definitivo. Éstas fueron cuidadosamente revisadas en su redacción y contexto para
integrar perfectamente el cuestionario.
Cuatro partes son las que forman el instrumento. La primera incluye 32 preguntas
referentes a las características de la vivienda, es decir, el tipo de posesión, el material de
la construcción, el material del piso de la vivienda, el tamaño del terreno, el número de
habitaciones, los servicios con que cuenta la vivienda, etc.. Las siguientes 27 preguntas
tienen como objetivo recolectar información sobre los bienes del hogar, como teléfono,
12
calentador de agua, lavadora, secadora, refrigerador, equipo de sonido, vídeocasetera,
colecciones, obras de arte, etc.
Una de las partes más difíciles de construir fue sin duda la que cubre las características de
la familia. Esta sección consta de 13 preguntas donde se incluye el número de habitantes
de la vivienda, escolaridad del jefe de familia, el número de personas mayores de 18
años, número de personas económicamente activas y rango de ingresos del jefe de familia
y de la familia en conjunto.
La última sección del instrumento consta de 45 preguntas y abarca lo referente a las
características de consumo. Se maneja por separado el consumo familiar y el del
entrevistado. Capta información referente a hábitos de compra de ropa, zapatos,
alimentos, diversiones, deportes, etc.
El cuestionario se realizó en una hoja electrónica, la presentación definitiva consta de 3
hojas. La primera incluye de un lado la portada; donde se registró el municipio donde se
ubica la vivienda encuestada, un número de identificación de manzana, el número de
plano en el que se encuentra la manzana en el mapa del Guía Roji, el encuestador que
aplicó el cuestionario y un nivel socioeconómico aparente asignado por el encuestador de
acuerdo con el criterio de la Unidad de Estudios Estadísticos del Tecnológico de
Monterrey (UNEEST). El cuestionario se encuentra en el Anexo 1.
2.3 Selección de la muestra
Uno de los procesos más importantes en la realización de una encuesta es la selección de
la muestra. Esta selección se realiza bajo diferentes restricciones:
1. Que el número de cuestionarios aplicados en las unidades muéstrales seleccionadas
fueran representativos de la población.
13
2. Que las unidades muéstrales fueran elegidas aleatoriamente, y que existiera
independencia entre ellas.
3. Que los costos de elegir la muestra y realizar el levantamiento estuvieran dentro del
presupuesto establecido.
Por razones de presupuesto, para la obtención de la muestra en est : trabajo de tesis se
trabajó en conjunto con la UNEEST quienes seleccionan mes con mes una muestra para
el proyecto de medición de Niveles de Audiencia de la Radio en el Ai ea Metropolitana de
Monterrey. Esta muestra es elegida a través de un muestreo por conglomerados en dos
etapas en toda el Área Metropolitana de Monterrey. La muestra utilizada en el estudio se
seleccionó paralelamente a la seleccionada para el mes de marzo del 2000.
Así pues, con una lista de todas las manzanas que comprenden los 7 municipios
conurbados de Monterrey y una lista de número aleatorios, se seleccionaron las
manzanas. De cada una de éstas se seleccionó un hogar al que se le aplicaría el
cuestionario. Un total de 320 hogares componen la muestra seleccionada. Este número de
hogares representa sólo el 1% de la población total del Área Metropolitana de Monterrey
por lo que el trabajo realizado es considerado como prueba piloto.
2.4 Levantamiento de la encuesta
La aplicación del cuestionario se realizó a lo largo del mes de marzo del año 2000. Tres
encuestadores realizaron el levantamiento con un promedio de 10 cuestionarios por día.
Se trabajaron los 7 días de la semana. Los siete municipios fueron cubiertos y se
obtuvieron 276 cuestionarios completos. Este número es el número de registros en la base
de datos del análisis. Cada uno de los cuestionarios fueron codificados y revisados en
cuanto a la coherencia de las respuestas y aquéllos que tuvieran preguntas con
aseveraciones dudosas en sus respuestas, fueron anulados. Tres cuestionarios fueron
retirados del estudio por esta razón.
14
2.5 Definición de variables y códigos
Cada una de las preguntas del cuestionario están asociadas con una o más variables que
fueron incluidas en la base de datos con la que se realizó el análisis. A forma de ejemplo,
se tomará la pregunta: ¿Cuántos habitantes hay en la vivienda?. La respuesta asociada a
esta pregunta se empleó en dos variables, en la definida como número de habitantes de la
vivienda y en un cociente definido como número de personas por habitación que es la
razón entre el número de habitantes en la vivienda entre el número de habitaciones. La
lista de definición de las variables se encuentra en el Anexo 2.
Para la codificación de las respuestas que generaban datos ordinales se ocupó una escala
cuyo valor numérico más grande fue asignado a la categoría que correspondía a la
respuesta que implicara mayor gasto, es decir, si resulta más caro comprar un refrigerador
con despachador de hielo que un frigobar, entonces, el primero recibe un número más
grande que el segundo. Para clasificar los automóviles se realizó una escala que involucra
el tipo de auto con el año en base al Libro Azul 1998 que emplean las aseguradoras para
establecer la suma asegurada de los autos. Algo similar se realizó para categorizar las
diversiones y los deportes que realiza la familia, se involucraron los conceptos de costos
y gastos en la realización de las actividades.
En el Anexo 1 se puede observar que el cuestionario tiene asignado un número a lado de
cada respuesta. Este número es el código asignado a la categoría definida por la
respuesta.
2.6 Captura y validación
La captura fue realizada por la UNEEST, generando un total de 5817 campos en 276
registros. Cada uno de estos registros correspondía a la información de un cuestionario y
cada columna a una variable.
59749215
El siguiente paso fue la validación de la información capturada en la base de datos.
Dentro de los errores más comunes se encuentran las omisiones de algunas respuestas por
parte del entrevistado y el recorrido de respuestas en las columnas de la base de datos al
ser capturados. Otro error común fue que en algunas variables se encontraron respuestas
fuera del rango de respuestas establecido previamente, es decir, se presentaron respuestas
fuera de las planeadas como posibles y en algunos casos hubo que hacer modificaciones o
adecuaciones de los criterios del código.
En cuanto a errores en las respuestas obtenidas, algunos cuestionarios presentaron
contradicciones en las respuestas o falta de coherencia en las respuestas, algunas de ellas
fueron fáciles de identificar pero algunos otros implicaron eliminar las respuestas, un
ejemplo claro es que fue encontrado un cuestionario en el que se indicaba que la vivienda
estaba construida de madera pero tenía tina de hidromasaje.
Errores de codificación fueron encontrados en algunos cuestionarios. Se revisaron todos
los cuestionarios y fueron eliminados este tipo de errores.
16
CAPITULO 3
Análisis de la Información
La aplicación de los métodos estadísticos a los datos muéstrales y el
resultado de este proceso son la parte medular del trabajo de tesis. En la
presente sección se desarrollarán la metodología de agrupamiento para
definir el número de niveles socioeconómicos, la proporción de la
población en cada uno de ellos y los factores que determinan dicha
segmentación. Además, se realiza un comparativo de los resultados con la
metodología existente.
3.1 Análisis descriptivo
Para obtener una idea clara de las características de la muestra, se realizó un análisis
descriptivo. El análisis descriptivo de las variables empleadas en este estudio, como
punto de partida del proceso de detección de niveles socioeconómicos, inició con la
realización de gráficos de barras e histogramas que se muestran en el Anexo 3.
De este análisis apriori se detectaron aquellas variables que no presentaban importantes
cambios en su comportamiento y que pudieran dar indicio de no ser de ayuda en la
segmentación de la población. Esto fue posible al analizar los gráficos, las tablas de
contingencia y la incidencia de respuestas.
3.2 Selección de variables para la clasificación por conglomerados
En el proceso de selección de variables se incluyeron las correspondientes a las preguntas
dirigidas a conocer las características del hogar y cuyo tipo de respuesta es ordinal. Las
17
binarias y las respuestas a preguntas personales fueron excluidas en esta etapa del análisis
por no adecuarse en mucho a los supuestos de las técnicas empleadas. Para el análisis
discriminante y para análisis de conglomerados, la mezcla de variables continuas y
categóricas representa una limitante en la aplicación de los métodos. Este problema
puede resolverse en cierto modo al considerar las variables categóricas ordinales siempre
y cuando se les categorice y se les escale, es decir se les dé un peso de mayor a menor a
las respuestas (Krzanowsky, 1980).
La siguiente lista muestra las variables definidas con base en preguntas del cuestionario
(Anexo 1) incluidas en estas pruebas:
1. Tipo de posesión de la vivienda
2. Tamaño del terreno
3. Material del piso
4. Acabados
5. Número de pisos en la casa
6. Número de baños
7. Número de regaderas
8. Número de tinas
9. Número de habitaciones
10. Número de personas por habitación*
11. Número de patios
12. Numero de terrazas
13. Número de espacios para auto de cochera cubierta
14. Número de inmuebles en posesión además de la vivienda
15. Número de personas que habitan en el hogar
16. Lugar de compra de ropa
17. Lugar de compra de zapatos
18. Escolaridad del jefe de familia
18
19. Escolaridad de la madre de familia
20. Rango de ingresos del padre de familia
21. Ingresos mensuales de la familia
22. Número de autos
23. Porcentaje de autos asegurados*
24. Porcentaje aproximado del ingreso dirigido a alimentos
25. Porcentaje de habitantes de la vivienda que tiene localizador*
26. Porcentaje de habitantes de la vivienda que tiene celular*
27. Número de focos
28. Número de abanicos, número de aparatos de aire lavado, aire acondicionado
individual, aire acondicionado central y número de minisplits**
29. Pago por recibo de luz en verano
30. Pago por recibo de luz en invierno
31. Pago por recibo de agua
32. Pago por recibo de gas en invierno
33. Pago por recibo de gas en verano
34. Líneas telefónicas
35. Número de aparatos telefónicos conectados y funcionando en la vivienda
36. Número de teléfonos inalámbricos
37. Calentador de agua
38. Tipo de refrigerador
39. Videocasetera
40. Juegos de video
41. Televisión por cable
42. Empleados domésticos***
43. Porcentaje de autos asegurados*
44. Porcentaje de autos con seguro de daños*
45. Porcentaje de autos con cobertura amplia*
46. Porcentaje de pólizas de autos pagados por la familia*
19
47. Porcentaje de pólizas de autos pagados por la empresa*
48. Porcentaje de personas aseguradas en la familia*
49. Total de pólizas en el hogar
50. Porcentaje de pólizas pagadas por la familia*
51. Porcentaje de pólizas pagadas por la empresa*
* Razones que se formaron como resultado de dos o más respuestas a preguntas del cuestionario.•* Se dieron pesos a cada uno de los aparatos de la siguiente manera: abanicos=l, aire lavado=3, aire acondicionadoindividual=6, minisplit=12, aire acondicionado central=18 estos valores fueron multiplicados por el número de aparatosde cada tipo y se sumaron estos resultados.*** Sólo se tomaron en cuenta a las personas contratadas para labores domésticas.
Todas las variables definidas como 'porcentajes son resultado del cociente de la variable
correspondiente entre el número de personas que habitan el hogar, por ejemplo, el
porcentaje de pólizas de personas aseguradas en la familia es igual a el número de
personas aseguradas en el hogar entre el número de personas que habitan en el hogar.
En cuanto a la variable número de abanicos, número de aparatos de aire lavado, aire
acondicionado individual, aire acondicionado central y número de minisplits, el número
resultante de este proceso surge de la multiplicación del peso asignado al aparato entre el
número de ellos que existen en el hogar y después la suma de todos. Como ejemplo, si en
un hogar hay 3 abanicos, una aire lavado y un minisplit, el número que tomará la variable
es 3*1+1*3+1*12-18.
3.3 Clasificación de los elementos de la muestra
Para la detección del número de grupos de población resultado del levantamiento, se
realizaron una serie de pruebas considerando diferentes números totales de grupos. Todas
ellas se realizaron en el paquete estadístico SPSS. Se determinó un total de 25 iteraciones
o la convergencia a cero como regla de parada. Cada una de estas pruebas se realizó
suponiendo diferente número de conglomerados y al analizar los resultados se obtuvo el
número de grupos factibles.
20
Para un total de 276 registros con la información de un igual número de cuestionarios se
realizó el análisis considerando de 3 a 8 posibles grupos y después de analizarlos, se
concluyó que sólo se requerían de dos a tres funciones para discriminarlos. Este resultado
dio la pauta para considerar la segmentación en 3, 4 y 5 grupos.
Dada esta estructura de grupos, la nomenclatura asignada a cada uno de los niveles por
número de conglomerados es la que se muestra a continuación:
3 Grupos 3G+ 4 Grupos: 4G++ 5 Grupos: 5G++
3G 4G+ 5G+
3G- 4G- 5G
4G- - 5G-
5G--
La sintaxis es la siguiente: el primer dígito hace referencia al número de grupos que se
formaron, la letra G representa la palabra Grupo. Si el número de grupos es impar, el
grupo que se encuentra a la mitad representa el nivel medio y conforme las características
de los demás grupos se van alejando de él, se les agrega uno o dos o tres signos '+' o ' - '
dependiendo de si tienden a la clase alta o baja respectivamente. Si es un número par de
grupos, los dos elementos centrales son clasificados con - el inferior y con + el superior y
nuevamente entre más alejados se les agregan más signos
Los resultados de la ejecución de los procedimientos puede resumirse en la siguientes
tabla. En ella se encuentra por número de grupos posible, el número de elementos
clasificados. Se muestra además la etiqueta del nivel socioeconómico asignado ordenado
de menor a mayor poder adquisitivo.
21
3 G
rupo
s
NSE
3G-
3G
3G+
Casos1
811illitiliiiilil ó
241 O
NSE
G -
G-
G+
G++
Casos
80
77
tos14
5 rup
os
I O
NSE
G -
G-
G
G+
G++
Casos
79
• 93
73
23
8
Tabla 3.1 Número de casos en cada uno de los niveles por grupos
Cada criterio de segmentación sigue una estructura semejante en los niveles comparables,
es decir, en los tres casos el grupo de personas del más bajo nivel está formado por cerca
de 80 casos y el más alto cerca de 20. Los grupos centrales aún cuando su conformación
es diferente, puede considerarse que tienen un número muy semejante de elementos.
Para poder jerarquizar y etiquetar los niveles socioeconómicos mostrados en la tabla
anterior, se tomaron en cuenta las distancias entre grupos que genera el análisis, el nivel
de referencia es el localizado según sus características como el más alto y se detectan las
distancias entre ellos para jerarquizarlos. Las siguientes matrices muestran en la celda
i,J, la distancia entre el grupo i y el grupo j . Entre mayor el número en la casilla, mayor la
distancia entre grupos.
3 Grupos
CLUSTER
3G-
3G
3G+
3G-
32.63
56.55
Tabla 3 .2 Distancia entre los centroides de
3G
32.63
36.26
as variabl*
3G+
56.55
36.26
;s Dará c > grupos
22
4 Grupos
CLUSTER
4G~
4G-
4G+
4G++
4 G -
24.67
46.02
59.27
4G-
24.67
21.45
46.02
4G+
46.02
21.45
42.23
4G++
59.27
46.02
42.23
Tabla 3.3 Distancia entre los centroides de las variables para clasificación en 4 grupos
5 Grupos
CLUSTER
5G-
5G-
5G
5G+
5G++
Tabla3.4 Distancia entre
5G-
24.49
24.49
46.11
37.22
71.74
5G-
21.94
24.47
59.78
5G
46.11
21.94
26.42
52.33
5G+
37.22
24.47
26.42
39.56
5G++
71.74
59.78
52.33
39.56
os centroides de las variables para clasificación en 5 grupos
Una vez que se obtienen el número de grupos y su jerarquización, el siguiente paso es la
determinación de las características de grupos resultantes del análisis. Para esto se hizo
uso de las tablas de centroides arrojadas por el paquete. Las tablas referidas se encuentran
en el Anexo 4.
En forma de ejemplo para la interpretación de estas tablas, cuando la población del Área
Metropolitana de Monterrey sea dividida en tres grupos, (TABLA A4.1, Anexo 4) el
nivel más bajo tendrá, a grandes rasgos, una sola planta, un baño con una regadera y sin
tina, un promedio de 8 focos, solo el 60% de estos hogares contará con línea telefónica,
aproximadamente el 50% no cuenta con calentador de agua, el 33% aproximadamente
contarán con automóvil y generalmente no pagarán o pagarán menos de $100 por
servicios públicos. El nivel medio incluirá hogares de una planta en su mayoría con uno o
23
dos baños pero una sola regadera y sin tinas, en su mayoría contarán con un automóvil,
en promedio tendrán 10 focos en su vivienda, y el grupo cuyo nivel sea el más alto, se
tendrán viviendas con dos o más plantas, tres o más baños y al menos uno con tina o tina
de hidromasaje, contarán con aire acondicionado ya sea central o individual, calentador
de agua, tendrán un automóvil por adulto que habite la vivienda, contarán con un gran
número de focos, más de dos aparatos telefónicos.
Para cuatro grupos la interpretación es de la misma manera, como ejemplo, el grupo 4G-
- tiene en promedio un baño con regadera, no cuentan con automóvil y en promedio las
viviendas tienen cuatro habitaciones; el 4G- cuenta con uno y medio baños, con cinco
habitaciones en la vivienda y poseen un auto; el grupo 4G+ tiene 2 baños en promedio,
cuentan con dos autos y tienen 6 habitaciones en promedio en la vivienda; mientras que
tener 4 baños, contar con un promedio de ocho habitaciones y de dos a tres autos son, en
promedio, la característica del grupo 4G++ (TABLA A4.2, Anexo 4).
Las características del grupo 5G- - son que la vivienda tiene en promedio 8 focos, cuenta
un baño con regadera y un promedio de 4 habitaciones; las viviendas en el nivel
correspondiente a 5G- cuentan con nueve focos en promedio, uno y medio baños, 5
habitaciones y la mitad de los hogares integrantes de este grupo no poseen automóvil; el
nivel 5G incluye a las viviendas que cuentan con 6 habitaciones, doce focos en promedio,
los habitantes del hogar poseen un auto; los integrantes del grupo 5G+ en promedio
poseen 20 focos, 7 habitaciones y 3 baños en su vivienda, cuentan además con 2 autos,
mientras que el grupo 5G++ es poseedor de viviendas con un promedio de 10
habitaciones, cuatro baños y con 54 focos en promedio, poseen tres autos (TABLA A4.3,
Anexo 4).
Para validar estos resultados, se compararon las características de algunos cuestionarios
elegidos aleatoriamente, contra las características del grupo al que fueron asignados,
además, se comparó con las referencias y los estudios previos de la UNEEST y la AMAI.
24
Se realizó una comparación con el nivel socioeconómico asignado a cada cuestionario
con el criterio de asignación de niveles socioeconómicos que emplea la UNEEST el cual
aporta un nivel socioeconómico aparente, es decir, los encuestadores están capacitados
para asignar uno de cinco niveles a cualquier vivienda según su apariencia y sus
alrededores. Aquellos cuestionarios que presentaron una diferencia muy marcada, entre
ambos métodos fueron marcadas y se prosiguió el análisis con ellos a fin de conocer las
razones de las diferencias.
3.4 Determinación de factores que definen la segmentación
Una vez obtenidas las etiquetas para cada uno de los 276 cuestionarios correspondientes a
la segmentación con 3, 4 y 5 grupos, se realizó un análisis discriminante. Además de
validar la clasificación por grupos, este análisis ayuda a determinar las funciones que
originan esta separación. Este análisis se aplicó a todas las diferentes categorizaciones
por grupos y se detectaron las funciones canónicas discriminantes, y los factores que
originaron dicha segmentación.
Se utilizó el paquete estadístico SPSS dentro de la opción statistics, se seleccionó la
opción clustering y aquí se seleccionó discriminant junction. Para la caja de diálogo se
seleccionaron las variables ordinales y continuas arriba mencionadas y como etiqueta se
empleó el nivel socioeconómico asignado según el número de grupos 3,4 o 5.
Para 3 grupos basta una función para alcanzar el 99% de la varianza explicada como
muestra la siguiente tabla:
FUNCIÓN
1
2
EIGENVALORES
423.9987
3.792774
% DE VARIANZA
EXPLICADA
99.11341
0.886594
VARIANZA
ACUMULADA
99.11341
100
CORRELACIÓN
CANÓNICA
0.998823
0.88958
Tabla 3.5 Vananza explicada por las Funciones Discriminantes para 3 Grupos
25
Para probar la hipótesis:
Ht>: la media en todos los grupos es la misma
Ha: al menos un grupo tiene media diferente
se realizó una tabla ANO VA (Tabla A4.4, Anexo 4). Con los valores arrojados de ésta, se
obtuvieron las variables que fueron significativas para la discriminación de los grupos.
Las variables que intervienen en las funciones discriminantes son las que se incluyen en
la siguiente tabla cada una con sus coeficientes correspondientes:
Variable Fundón 1 Función 2
-4.99798
7.112523
-1.65266
-4.27021
5.580165
2.752744
3.185299
1.396153
0.273871
0.524405
-0.47307
-0.45185
-0.67275
0.385604
0.577915
0.595262
Número de autos cubiertos en la cochera
Porcentaje del ingreso dirigido a alimentos
Número de Focos
Abanicos y Aires
Número de aparatos telefónicos conectados y funcionando
Número de teléfonos inalámbricos
Tipo de Refrigerador
Porcentaje de pólizas de auto pagadas por la empresa
Tabla 3.6 Coeficientes de las Funciones Discriminantes para tres Grupos
De esta tabla puede observarse que la variable que discrimina con mayor peso en la
primera función es el porcentaje del ingreso dirigido a alimentos seguidos por el número
de aparatos telefónicos conectados y funcionando, los abanicos y aires, el tipo de
refrigerador y el número de autos cubiertos en la cochera. Incluye también el número de
teléfonos inalámbricos, el número de focos. La segunda función explica ya muy poco de
la variabilidad. El gráfico siguiente muestra la localización de los grupos con respecto a
las dos funciones discriminantes, el grupo 3G+ representado por el color azul, el verde
está asociado al grupo 3G y el rojo al 3G.
26
Funciones Canónicas Discriminantes
Función
2
2 ,
0 ,
- 2 ,
-4 ,
- 6 ,
- 8 ,
-10
-i
a
a
aa
0
0 -20
Función
oa
D 1n ]
a•
°a§G+
BD
•
1
a
kes
0D
5
yn
a oD D
?D D
•a nc Q
aa
0
a
20 46
D
3G-
1
6l) 80
3 Grupos
f j Centroides de Grupo
a 3G-
• 3G
c 3G+
100
Ilustración 3.1 Mapa de la muestra segmentada en tres grupos
Se puede ver en este gráfico que los tres grupos son identificables. Los hogares incluidos
en el grupo 3G- tienden a estar en la parte inferior izquierda de la gráfica, mientras que
los que se encuentran en el nivel bajo 3G+ se colocan en la parte superior y tienden a
moverse hacia la derecha.
El grupo con mayor dispersión resultó ser el grupo al que se le asignó el nivel 3G-, y las
características del grupo 3G+ son sumamente peculiares.
Para 4 grupos la varianza queda cubierta al 99% con dos funciones discriminantes:
27
FUNCIÓN
1
2
3
4
EIGENVALORES
91.39746
16.16892
1.360104
0.070509
%DEVARIANZA
EXPLICADA
83.85319
14.83428
1.247836
0.064689
VARIANZA
ACUMULADA
83.85319
98.68747
99.93531
100
CORRELACIÓN
CANÓNICA
0.994574
0.970441
0.759138
0.256642
Tabla 3 7 Distancias entre centroides para cuatro grupos
Para identificar las diferencias entre grupos por variable, se realizó un análisis ANO VA
(Tabla A4.5, Anexo 4) y se obtuvo que para probar la hipótesis:
Ho: la media es igual en todos los grupos
Ha: al menos un grupo tiene media diferente
Los coeficientes de las funciones canónicas para 4 grupos son los que se muestran a
continuación.
Variable Función 1 Función 2 Función 3
La casa que habita es
Tamaño terreno
Material del piso
Acabados
Número de pisos en la vivienda
Número de Baños
Número de regaderas
Número de tinas
Número de habitaciones
Número de personas por habitación
Número de patios
Número de terrazas
Número de autos cubiertos
Pintura del exterior
Parque más cercano
8.634489 -1.15175 0.649977
7.894246 -1.60741 -0.55561
-0.50626 2.152637 0.789272
14.32473 -1.31539 -0.09791
0.616263 0.42751
10.39555 1.722916
-0.45987 -1.79136 0.763851
3.524576 3.035969 -0.17601
-7.20748 -0.03388
0.128873 1.876126
3.008047
9.197317
0.863133
-0.16993
-1.96404
-1.11957
-0.13612 0.640031
-0.72706 0.464996
-10.0857 0.993849 0.742169
-9.95248 -0.51736 -0.24313
-14.3211 3.884299 -0.07043
Tabla 3 8 Coeficientes de las Funciones Discriminantes para cuatro grupos
28
Para la primera función, el mayor peso en la combinación lineal corresponde a la variable
que representa la distancia de la vivienda al parque más cercano, le sigue en importancia
la variable que describe los acabados, el número de baños y al número de autos cubiertos
en la cochera. En la segunda función canónica discriminante, el número de tinas, el
material del piso y nuevamente el parque más cercano. El siguiente gráfico muestra los
grupos resultantes, el color rosa corresponde al nivel 4G++, el verde al nivel 4G+, el azul
al 4G- y el rojo al grupo 4G~.
Funciones Canónicas Discriminantes30 i
u Centroides de Grupo
-100 100 200
Fundón 1
Ilustración 3.2 Mapa de la muestra segmentada en cuatro grupos
Para 5 grupos la varianza queda cubierta en un 99% con tres funciones discriminantes
canónicas.
29
FUNCIÓN
1
2
3
4
EIGENVALORES
91.39746
16.16892
1.360104
0.070509
%DEVARIANZA
EXPLICADA
83.85319
14.83428
1.247836
0.064689
VARIANZA
ACUMULADA
83.85319
98.68747
99.93531
100
CORRELACIÓN
CANÓNICA
0.994574
0.970441
0.759138
0.256642
Tabla 3 9 Porcentaje de varianza explicada para cinco grupos
Las variables que resultaron significativas para cinco grupos como resultado del análisis
por medio de la tabla ANOVA (TABLA A4.6, Anexo 4).
Variable Función 1 Función 2 Función 3 Función 4
Número de personas por habitación
Porcentaje del ingreso dirigido a alimentos
Número de Focos
Abanicos y Aires
Número de aparatos telefónicos conectados y
funcionando
Televisión por cable
2.55813 0.943513 0.584769 -0.14139
1.993662 -0.76015 -0.50058 0.222932
2.863918 1.617711 0.104113 0.152118
3.637333 1.321852 -0.58342 -0.66969
1.829669 -1.114 0.451034 -0.33444
-2.11592 0.232233 0.245245 1.202701
Tabla 3 10 Coeficientes de las Funciones Discriminantes para cinco grupos
Para la primera función discriminante la variable con más peso es la referida a los
abanicos y aires, le sigue el número de focos y la posesión de contrato para televisión por
cable. En la segunda función sobresalen nuevamente el número de focos y los abanicos y
aires además del número de aparatos telefónicos conectados y funcionando. Para la
tercera función, el porcentaje de ingreso dirigido a la compra de alimentos y los abanicos
y aires son la pieza fundamental. En la cuarta y última función, la posesión de un contrato
de televisión por cable explica el restante de la varianza.
En la ilustración 3.3 se muestra con el color rosa está asociado a los elementos del grupo
5G++, el azul claro representa a los individuos del grupo 5G+, el nivel 5G se presenta en
verde, el rojo es el color asociado al grupo 5G- y el tono obscuro del azul es el asociado
30
al nivel más bajo 5G- -. Al igual que en la segmentación de población en tres grupos,
éstos se definen claramente en el gráfico. Los hogares que pertenecen al grupo 5G++ se
encuentran en la parte superior derecha de la gráfica y están un tanto alejados unos de
otros, sin embargo sus características son similares. Los hogares que corresponden al
nivel 5G—se encuentran en la parte inferior de la gráfica mostrando así que la distancia
con respecto a los primeros es importante.
Una vez obtenidos el número de grupos y sus características según la distancia de las
medias en cada una de las variables, es posible realizar comparaciones con otros métodos
para verificar la validez del propuesto.
Funciones Canónicas Discriminantes20 *
80
Función 1
Ilustración 3.3 Mapa de la muestra segmentada en cinco grupos
31
3.5 Comparación de resultados con los métodos empleados por la AMAI y la
UNEEST
Para contrastar los resultados obtenidos con otros métodos ya empleados, se realizaron
una serie de comparaciones a través de tablas de contingencia. Estas tablas se
construyeron con los resultados obtenidos de este estudio contra los resultados que se han
obtenido a través de otra metodología, ya sea bajo el criterio AMAI o UNEEST según el
número de grupos.
Como se mencionó anteriormente el método de clasifícación por niveles
socioeconómicos empleado por la UNEEST es por nivel socioeconómico aparente. Se
utilizan cinco grupos de clasifícación que por orden ascendente son: bajo, medio bajo,
medio, medio alto y alto. Esta clasifícación ha sido utilizada en gran número de estudios
realizados en el Área Metropolitana de Monterrey.
La AMAI cuenta con un algoritmo (http://www.amai.org/niveles.shtnil, consultado en febrero
del año 2000). que con seis variables asigna uno de cuatro niveles socioeconómicos Las
variables que mide son: número de baños en la vivienda, número de habitaciones, el
número de focos, la posesión de auto, escolaridad del jefe de familia y la posesión de
calentador de agua, y los niveles son, en orden ascendente, D/E, D+, C, ABC+.
3 Grupos
UNEEST
Bajo
Medio bajo
Medio
Medio alto
Alto
3G-
26
34
19
2
81
3G
17
67
67
19
1
171
3G+
2
14
8
24
Total
43
101
88
35
9
276
Tabla 3 11 Tabla comparativa tres grupos vs criterio UNEEST
32
En esta tabla se comparan los resultados obtenidos de segmentar la población en tres
grupos (columnas) con la clasificación de la UNEEST (renglones). Para tener buenos
resultados se espera que los hogares clasificados como 3G- se concentren sobre todo en
los niveles bajo y medio bajo de la UNEEST, quizá algunos puedan estar en nivel medio
por alguna razón, pero sería extraño que se encontraran en el nivel medio alto o alto.
Algo similar debe ocurrir con los clasificados como 3G+, deben coincidir con los niveles
más altos según la UNEEST y los hogares partícipes del grupo 3G pueden estar en los
niveles medio bajo, medio y medio alto según el criterio UNEEST.
Los resultados son satisfactorios, el nivel 3G+ incluye hogares que la UNEEST consideró
de nivel medio alto y alto en su mayoría y dos casos de medio. El nivel 3G- incluye
hogares clasificados como bajo medio bajo y medio por la UNEEST y dos hogares
(cuestionarios) de nivel medio alto. Estos dos cuestionarios han sido revisados con
detenimiento y se obtuvo las siguientes características que podrían ser la razón por la cual
fueron clasificados en el 3G-: en la variable porcentaje de ingreso dirigido a la compra de
alimentos ambos presentan valores mayores del 50% que son característicos de los
niveles más bajos.
Este fenómeno surge del hecho de que entre mayor sea el porcentaje del ingreso familiar
dirigido a alimentos, el sobrante es más pequeño para otro tipo de gastos y por lo tanto el
nivel de vida y las características de consumo son las de los niveles bajos. Así, el método
subestima a aquéllos que presentan un porcentaje alto del ingreso invertido en alimentos,
pues hay que recordar que esta variable es la que tiene mayor peso en la primera función
discriminante. Aún cuando pudieran tener características de consumo de un grupo mayor,
el hecho de invertir un alto porcentaje del ingreso en alimentos hace que el proceso los
clasifique como nivel bajo (3G-).
La tabla siguiente muestra el comparativo ente la clasificación en 4 grupos y la resultante
de la clasificación de la AMAI:
33
4 Grupos
M
D/E
D+
C
A/B/C+
4 G -
37
23
13
6
79
4G-
25
30
24
26
105
4G+
6
21
15
35
77
4G++
15
15
TOTAL
69
74
52
81
276
Tabla 3.12 Tabla comparativa cuatro grupos vs criterio AMAI
Como se puede observar en la tabla 3.12, 37 de 79 de los casos que fueron clasificados
como 4G- - por el método utilizado en esta tesis y además, fueron clasificados por el
AMAI como nivel D/E, el más bajo en su escala. Los 42 restantes fueron clasificados por
la AMAI de la siguiente manera: 23 cuestionarios fueron clasificados como D+, 13 como
C y 6 como A/B/C+.
Las casillas remarcadas son los casos que podrían presentar inconsistencias extremas de
un método con respecto al otro, se explicaran las probables razones de tales
discordancias. Los 6 casos clasificados como 4G- - en este trabajo y como A/B/C+ por la
AMAI fueron revisados cuidadosamente corresponden a los cuestionarios siguientes:
CUESTIONARIO
19
67
68
RAZÓN DE DISCORDANCIA
80% del ingreso es dirigido a la compra de alimentos, esto lo ubica como nivel bajo en el
método seguido en esta tesis. Sin embargo, sus características son de un hogar de nivel medio.
La metodología de esta tesis lo clasifica en un nivel inferior al suyo y AMAI en uno superior.
60% del ingreso es dirigido a la compra de alimentos, esto lo lleva a nivel medio bajo en el
método utilizado en esta tesis. El número de focos es reducido y hace que la metodología de esta
tesis lo ubique en nivel bajo; sin embargo, es congruente con el número de habitaciones. Sus
características son congruentes con el nivel medio alto. AMAI lo clasifica adecuadamente.
60% del ingreso es dirigido a la compra de alimentos y el número de focos es reducido para el
nivel alto pero es congruente con el número de habitaciones.
34
CUESTIONARIO
161
176
294
RAZÓN DE DISCORDANCIA
La manzana en la que se aplicó el cuestionario (plano 61 del Guía Roji) corresponde al nivel
medio bajo - bajo, sin embargo el AMAI sobre estima por la escolaridad del jefe de familia. La
metodología de esta tesis lo clasifica correctamente.
AMAI sobre estima por el nivel educativo del padre de familia, porque aún con éste, el nivel de
ingresos corresponde a un nivel medio bajo. El método presentado en este trabajo subestima poi
el número reducido de focos aunque éste es congruente con el número de habitaciones
60% del ingreso es dirigido a la compra de alimentos. Es subestimado en el análisis de esta
tesis.
Tabla 3.13 Razón de discrepancias entre los métodos Tesis-AMAI por número de cuestionario
Para verificar si son en realidad estas las causas, es necesario volver a clasificar
omitiendo los cuestionarios y después, repetir la comparación.
En el caso de cinco grupos, la comparación se realizó con el nivel establecido bajo el
criterio de la UNEEST y la tabla resultó de la siguiente manera:
5 Grupos
UNEEST
Tabla 3.14 Tabla comparativa cinco grupos vs UNEEST
Los cuatro casos que fueron clasificados como nivel medio (5G) en el análisis y como
bajos por la UNEEST, presentaron las siguientes características:
Bajo
Medio bajo
Medio
Medio alto
Alto
5G-
26
34
17
2
79
5G-
13
49
28
3
93
5G
4
18
36
11
4
73
5G+
7
14
2
23
5G++
5
3
8
TOTAL
43
101
88
35
9
276
35
CUESTIONARIO
7
20
83
284
RAZÓN DE DISIMILITUD ENTRE LOS MÉTODOS
El encuestado declaró que el 30% del ingreso es dingido a la compra de alimentos, porcentaje qu
corresponde a los niveles más altos, pero la zona en la que se encuentra el hogar y las condición*
que concuerdan al resto de las preguntas son las características asociadas al nivel bajo. UNEES'
lo clasifica adecuadamente.
El encuestado declaró que el 20% del ingreso es dirigido a la compra de alimentos, porcentaje qi
corresponde a los niveles más altos, pero la zona en la que se encuentra el hogar y las condicione
que concuerdan al resto de las preguntas son las características asociadas al nivel bajo. L
metodología de esta tesis lo sobreestima.
El encuestado declaró que el 30% del mgreso es dingido a la compra de alimentos, porcentaje qi
corresponde a los niveles más altos, pero la zona en la que se encuentra el hogar y la
condiciones que concuerdan al resto de las preguntes son las características asociadas al niv<
bajo.
El encuestado declaró que el 30% del ingreso es dingido a la compra de alimentos, porcentaje qi
corresponde a los niveles medio hacia arriba, pero la zona en la que se encuentra el hogar y l¿
condiciones que concuerdan al resto de las preguntas son las características asociadas al niví
bajo
Tabla 3.15 Razón de discrepancias ente los métodos Tesis-UNEEST por numero de cuestionario
Los dos casos que fueron clasificados como 5G- - y por la UNEEST como medio alto
presentaron las siguientes características:
CUESTIONARIO
199
294
RAZONES DE DISIMBLARIDAD
El encuestado declaró que el 80% del ingreso es dirigido a la compra de alimentos, est
porcentaje según el estudio corresponde al nivel más bajo, sin embargo el resto de las pregunte
indican que corresponde al nivel medio a medio alto.
60% del ingreso es dirigido a la compra de alimentos
Tabla 3.16 Razón de discrepancias ente los métodos Tesis-UNEEST por numero de cuestionara
Todo esto nos lleva a dos conclusiones:
36
1. Las discordancias con los métodos existentes y el método utilizado en este trabajo de
tesis surgen esencialmente por los resultados en las variables 'porcentaje del ingreso
dirigido a alimentos' y 'Número de focos'
2. La respuesta a la pregunta sobre el porcentaje de ingresos empleado para la compra
de alimentos es hasta cierto punto no muy confiable pues algunas veces las personas
entrevistadas no ven el gasto en alimentos como un porcentaje del ingreso y no lo
estiman con exactitud, sin embargo, en la mayor parte de los casos ha coincidido en
que a menor nivel socioeconómico, mayor porcentaje dirigido a la compra de
alimentos y viceversa.
3. En número de focos es una variable importante y hay que poner especial atención
porque las excepciones generan problemas de clasificación.
3.6 Características binarías consideradas
Las preguntas binarias que se trabajaron por separado por no adecuarse para un análisis
de conglomerados están relacionadas con los siguientes aspectos:
1. Recibidor
2. Gimnasio
3. Estudio o biblioteca
4. Cuarto para la servidumbre
5. Cuarto de lavandería
6. Servicio de agua potable
7. Servicio de drenaje
8. Servicio de electricidad
9. Servicio de recolección de basura
10. Servicio de alumbrado público
11. Servicio de gas entubado
37
12.
13.
14.
15.
16.
17.
18.
19.
20.
Lavadora de ropa
Secadora de ropa
Lavadora de platos
Tostador de pan
Computadora personal
Contrato de internet
Colección con valor personal
Obra de arte
Decoración
Estas variables fueron utilizadas solo como referencia y apoyo a la descripción de las
características de cada nivel, sin embargo, en el proceso de determinación del
cuestionario breve serán incluidas para procesarse mediante el método CHAID pues
además de que el método es capaz de trabajarlas, es importante saber si es necesario
preguntar alguna de ellas para ubicarlos en el nivel socioeconómico asignado
anteriormente.
3.7 Características de los grupos resultantes
3.7.1 Características de los grupos resultantes de la segmentación en cuatro grupos
4G++
Este nivel incluye a las personas que habitan hogares en propiedad con 500 o más metros
cuadrados de terreno, con acabados de alta calidad o piedra, pisos de madera o mármol,
tienen 9 o más habitaciones en la vivienda, 5 o más baños con al menos 4 regaderas y una
tina. Cuentan con cochera cubierta para al menos 2 autos, terrazas, biblioteca, gimnasio,
cuarto de lavado y estancias. Cuentan con aire acondicionado en sus hogares sin
excepción, calentador de agua, al menos 4 aparatos telefónicos conectados y 2 líneas
38
telefónicas, equipo de sonido bien equipado, refrigerador grande y con despachador de
hielo, lavadora y secadora de ropa, lavadora de platos, videocasetera, contrato de
televisión por cable, tienen computadora personal y contrato para internet.
La escolaridad del padre de familia es en promedio licenciatura, pero un alto porcentaje
cuenta con algún posgrado, los ingresos del jefe de familia son de más de $50,000 y los
ingresos totales sobrepasan los $70,000 al mes.
Poseen al menos dos inmuebles además de la casa que habitan. Cuentan por lo menos con
3 autos de modelos recientes, compran la ropa en el extranjero al igual que los zapatos.
Invierten aproximadamente el 35% de su ingreso para la compra de alimentos. Cuentan
con al menos 1 empleado de planta para las labores domésticas. Practican deportes en
clubes exclusivos.
Las vacaciones dentro del país son de 2 a 3 veces al año y al menos una al extranjero.
Todos sus autos son asegurados con cobertura amplia y todos los miembros del hogar
mayores de edad cuentan con póliza de seguro.
4G+
En este grupo se encuentran las personas que viven en propiedad en un terreno de 200 a
500 metros cuadrados, el material de piso es loza o mosaico, los acabados son
comerciales, en promedio 2 baños con una regadera cada uno, 6 habitaciones. Cuentan
con estudio o biblioteca. Cuentan con aire acondicionado individual, 2 aparatos
telefónicos, calentador de agua, equipos de sonido con reproductor de discos compactos,
videocasetera, refrigerador grande, lavadora y secadora de ropa, computadora personal al
menos en el 50% de los hogares. Poseen al menos 12 focos.
39
La escolaridad del jefe de familia es preparatoria o licenciatura y sus ingresos varían
entre $5,000 a $10,000 y los ingresos familiares están entre $18,000 y $30,000. Poseen 2
autos en promedio de modelos con dos o tres años de antigüedad.
Tienen empleados domésticos de tiempo parcial, aseguran al menos uno de sus autos y
cuentan con pólizas de seguro de vida o gastos médicos para al menos uno de los
miembros de la familia. Compran la ropa y los zapatos en tiendas departamentales de
lujo. Invierten el 25% de sus ingresos en alimentos. Suelen vacacionar al menos una vez
al año dentro del país y rara vez al extranjero.
4G-
Tienen vivienda en posesión en un terreno que varía entre 100 a 200 metros cuadrados,
con acabados comerciales o pintura, el piso es de loza o mosaico, cuentan con 2 baños
con al menos 1 regadera, la mayoría no cuenta con tina. Tienen aparato de aire lavado y
abanicos, lavadora de ropa, refrigerador mediano, videocasetera, equipo de sonido
austero, un promedio de 10 focos, un auto de modelo de 4 a 7 años de antigüedad.
La escolaridad del padre de familia es de preparatoria y los ingresos familiares alcanzan
hasta $10,000 si trabajan más de dos miembros. No cuentan en general con empleados
domésticos. La ropa y los zapatos son comprados en boutiques pequeñas. Las vacaciones
son dentro del país y poco frecuentes.
4G--
En este grupo un alto porcentaje renta su habitación o bien es de familiares. El piso es de
cemento y en algunas ocasiones es de arena. No tienen buenos acabados o bien carecen
de ellos. En promedio hay un solo baño en la vivienda y en muchos casos no cuentan con
40
regadera. Tienen un promedio de 8 focos, refrigerador pequeño. Los ingresos son
menores a $1,500 para la familia y el 70% es invertido en alimentos.
3.7.2 Características de los grupos resultantes de la segmentación en cinco grupos
5G++
Este grupo incluye a las personas que habitan hogares en propiedad con 500 a 1,500
metros cuadrados de terreno, con acabados de alta calidad o piedra, pisos de madera o
mármol, tienen 10 o más habitaciones en la vivienda, 5 o más baños con al menos 4
regaderas y una tina o tina de hidromasaje. Cuentan con cochera cubierta para al menos
2 autos, terrazas, biblioteca, gimnasio, cuarto de lavado y estancias. Poseen al menos 2
inmuebles además de la casa que habitan. Tienen aire acondicionado central o al menos 2
individuales instalados, calentador de agua, al menos 4 aparatos telefónicos conectados y
2 líneas telefónicas, teléfonos inalámbricos, equipo de sonido bien equipado, refrigerador
grande y con despachador de hielo, lavadora y secadora de ropa, lavadora de platos,
videocasetera, contrato de televisión por cable, tienen computadora personal y contrato
para internet.
La escolaridad del padre de familia es en promedio licenciatura, pero un alto porcentaje
cuenta con algún posgrado, los ingresos del jefe de familia en promedio son de $30,000 o
más y los ingresos totales sobrepasan $70,000 al mes. Cuentan por lo menos con 3 autos
de modelos recientes, compran la ropa en el extranjero al igual que los zapatos. Invierten
el 29% de su ingreso para la compra de alimentos. Cuentan con al menos 1 empleado de
planta para las labores domésticas. Compran la ropa y zapatos de marca en el extranjero y
practican deportes en clubes exclusivos. Las vacaciones dentro del país son de 2 a 3 veces
al año y al menos una al extranjero. Todos sus autos son asegurados con cobertura amplia
y todos los miembros del hogar mayores de edad cuentan con póliza de seguro.
41
5G+
En este grupo se encuentran las personas que viven en propiedad en un terreno de 200 a
500 metros cuadrados, el material de piso es loza o mosaico, los acabados son
comerciales, en promedio 3 baños con una regadera cada uno, 7 habitaciones. Cuentan
con estudio o biblioteca. Cuentan con aire acondicionados individuales, calentador de
agua, equipos de sonido con reproductor de discos compactos, videocasetera, refrigerador
grande, lavadora y secadora de ropa, computadora personal, al menos 26 focos.
La escolaridad del jefe de familia es licenciatura. Los ingresos del jefe de familia varía
entre $10,000 a $18,000. Poseen 2 autos en promedio de modelos con dos o tres años de
antigüedad. Tienen empleados domésticos de tiempo parcial, aseguran al menos uno de
sus autos y cuentan con pólizas de seguro de vida o gastos médicos para al menos uno de
los miembros de la familia. Compran la ropa y los zapatos en tiendas departamentales de
lujo. Invierten el 35% de sus ingresos en alimentos. Vacacionan al menos una vez al año
dentro del país o al extranjero.
5G
Tiene casa en propiedad con 100 a 200 metros cuadrados de terreno, el material del piso
es loza o mosaico y acabados comerciales. Cuentan con 6 habitaciones y 2 baños con 2
regaderas. La escolaridad del jefe de familia corresponde al nivel preparatoria y sus
ingresos varían de $5,000 a $10,000. Tienen al menos un auto de algunos años de
antigüedad. La ropa y los zapatos los compran en tiendas departamentales, cuentan con
una línea telefónica, poseen un auto y si cuentan con empleada para labores domésticas
es de tiempo parcial.
5G-
42
Se incluyen los hogares cuya vivienda tiene en promedio 4 habitaciones, el piso de la
vivienda es de loza o mosaico, con pintura en el exterior y dos baños con una regadera.
La escolaridad del jefe de familia es de preparatoria y su nivel de ingreso es de $1,500 a
$3,000 mensuales. El porcentaje del ingreso que destinan a alimentos está al rededor de
45%. Cuentan con un automóvil de diez años de antigüedad o más. Tienen lavadora,
equipo de sonido austero, refrigerador pequeño, algunos hogares tienen videocasetera. La
ropa y los zapatos son adquiridos en cadenas departamentales. Cuentan con
aproximadamente 10 focos, una línea telefónica con un solo aparato. Vacacionan menos
de una vez al año al interior del país y se alojan en casa de familiares. Frecuentan parques
y centros deportivos populares.
5G--
En este grupo un alto porcentaje renta su habitación o bien es prestada o de familiares. El
piso es de cemento y en algunas ocasiones es de arena. No tienen buenos acabados o bien
carecen de ellos. En promedio hay un solo baño en la vivienda y en muchos casos no
cuentan con regadera, tienen aproximadamente 4 habitaciones. Tienen un promedio de 7
focos, refrigerador pequeño. La escolaridad del jefe de familia es secundaria y en la
mayoría de los casos primaria inconclusa. Los ingresos son menores a $1,500 para la
familia y el 70% es invertido en alimentos.
43
CAPITULO 4
Aplicación del método de Detección Automática de Interacción Ji-cuadrada
(CHAID)
Los métodos de segmentación de mercado son considerados como métodos
exploratorios, sin embargo, son una fuente de resultados confiables y
adecuados. CHAID es un proceso mercadológico que será herramienta
para la construcción del cuestionario breve como instrumento de
colocación de individuos en el nivel socioeconómico que le corresponda
según lo definido en el capítulo anterior. En esta sección se desarrollará
la aplicación del método CHAID a los datos muéstrales y sus resultados.
4.1 Definición de criterios de ejecución
Una vez obtenidos los grupos de población se procederá a aplicar el método CHAID a
través del paquete AnswerTree® 2.0 para SPSS®, este paquete crea sistemas de
clasificación en árboles de decisión bajo el criterio CHAID para detectar formas de
agrupación de casos. Permite encontrar variables claves que identifican los elementos que
forman parte de un grupo y formular reglas para ubicar elementos de un grupo para
nuevos casos.
El algoritmo que ejecuta el sistema AnswerTree® 2.0 para el CHAID fijnciona con todos
los tipos de variables continuas y categóricas. Cada variable predictora X tiene cierto
número de categorías. Para cada una de las variables X el sistema busca parejas de
categorías cuya diferencia presenta la menor significancia (mayor nivel crítico) respecto a
la variable criterio Y. Si Y es continua se utiliza una prueba F, si es nominal se forma una
tabla de contingencia con las categorías de X como filas y las de Y como columnas,
44
después se aplica la prueba ji-cuadrada de Pearson o la prueba de la razón de
verosimilitud. Si Y es ordinal se ajusta un modelo de asociación de Y y la prueba de la
razón de verosimilitud. Se establecen niveles de significancia Omerge y Ospüt, para la pareja
de categorías de X con el mayor nivel crítico se compara el valor de nivel crítico con el
nivel de alfa pre-especificado ot,,^. Si el nivel crítico es mayor que otmerge, se funde esta
pareja en una sola categoría compuesta y se forma un nuevo conjunto de categorías de X.
El proceso se vuelve a iniciar.
Se calcula entonces el nivel crítico corregido para el conjunto de las categorías de X y las
categorías de Y mediante la corrección de Bonferroni pertinente (Magidson, 1992). Se
selecciona una variable predictora X cuyo nivel crítico corregido sea el menor y se
compara su nivel crítico con el nivel alfa preestablecido, a,^. Si el nivel crítico es menor
o igual que a,^, se divide el nodo conforme al conjunto de categorías de X y si es mayor
que ct̂ bt, no se divide el nodo y éste se vuelve terminal.
4.1.1 Reglas de parada
Un nodo no se dividirá si cumple alguna de las siguientes condiciones:
1. Todos los casos de un nodo tienen valores idénticos en todos los predictores.
2. El nodo se vuelve puro, es decir, todos su casos tienen el mismo valor en la variable
criterio.
3. La profundidad del árbol ha alcanzado el valor máximo preestablecido.
4. El número de casos que constituyen el nodo es menor que el tamaño mínimo
preestablecido para un nodo parental.
5. La división del nodo tiene como resultado un nodo filial cuyo número de casos es
menor que el tamaño mínimo preestablecido para un nodo filial.
45
4.2 Variables para el estudio
La base de datos utilizada para este proceso incluye las variables:
1. Propiedad de la vivienda (si es propia, rentada, prestada, etc.)
2. Tamaño de terreno
3. Material del piso
4. Tipo y calidad de los Acabados
5. Número de pisos en la vivienda
6. Número de baños
7. Número de regaderas
8. Número de tinas
9. Número de tinas de hidromasaje
10. Número de habitaciones
11. Recibidor
12. Número de terrazas
13. Número de patios
14. Número de autos cubiertos en la cochera
15. Fuentes
16. Piscina
17. Gimnasio
18. Estudio
19. Cuarto para la servidumbre
20. Cuarto de lavandería
21. Agua (si cuenta con el servicio)
22. Drenaje (si cuenta con el servicio)
23. Pavimentación (si cuenta con el servicio)
24. Alumbrado (si cuenta con el servicio)
25. Gas (si cuenta con el servicio)
46
26. Basura (si cuenta con el servicio)
27. Número de líneas telefónicas
28. Número de aparatos telefónicos conectados y funcionando
29. Teléfono inalámbrico (binaria: lo posee o no)
30. Lavadora de ropa (binaria: lo posee o no)
31. Secadora de ropa (binaria: lo posee o no)
32. Lavadora de platos (binaria: lo posee o no)
33. Refrigerador (tamaño)
34. Escolaridad del jefe de familia
35. Escolaridad de la madre de familia
36. Ingresos mensuales de la familia
37. Número de autos
38. Videocasetera (binaria: lo posee o no)
39. Juegos de vídeo (binaria: lo posee o no)
40. Televisión por cable (binaria: lo posee o no)
41. Empleada doméstica
42. Tostador de pan (binaria: lo posee o no)
43. Computadora personal (binaria: lo posee o no)
44. Contrato de internet (binaria: lo posee o no)
45. Colección con valor comercial (binaria: lo posee o no)
46. Obra de arte (binaria: lo posee o no)
4.3 Árboles de decisión para la determinación de factores a preguntar en un
cuestionario breve.
Para obtener los cuestionarios breves se aplicó el método CHAID exhaustivo que incluye
el paquete AnswerTree®. Se utilizó una base de datos similar a la empleada para en el
análisis kmeans, de la base original se retiraron las variables: número de focos y
porcentaje del ingreso dirigido a alimentos por el riesgo de mala clasificación en casos
47
atípicos y la variable ingreso mensual del padre de familia por ser una pregunta que
implica algunas veces que el entrevistado se niegue a dar respuesta o bien mienta sobre
ésta.
El análisis se realizó varias veces debido al ajuste de la segmentación de los nodos y el
evitar el cruce de los niveles dentro de las ramas del árbol. Dentro del paquete fue
necesario establecer el número de casos mínimos para los nodos parentales y los filiales.
Para los nodos parentales se decidió establecer como condición de parada fueran 10
casos, mientras que en los filiales 5. La significancia para las pruebas fue 0.05 con la cual
se realizó la toma de decisión sobre el rechazo o no de la segmentación del nodo.
Los árboles se encuentran en el Anexo 5, y son la fuente de donde se obtuvieron las
preguntas a incluir en el instrumento para clasificar individuos a los niveles
socioeconómicos determinados (ya sean cuatro o cinco).
4 Grupos
El árbol resultado de la ejecución del CHAID para cuatro niveles socioeconómicos
resultó con cuatro niveles que involucran 7 variables con nueve nodos terminales.
La variable que discrimina en primer nivel es el número de aparatos telefónicos
conectados y funcionando en la vivienda. Con un nivel crítico menor a 0.001, un
estadístico Ji-cuadrada igual a 92.1058 con 6 grados de libertad se formaron tres nodos:
• Nodo 2: con 185 elementos correspondiente a aquellas
viviendas con ningún o un aparato telefónico en donde el
36.2% de ellas pertenecen al nivel 4G- - y el 41.8 al 4G-.
• Nodo 3: con 64 elementos correspondientes a las
viviendas con dos aparatos telefónicos. El 36% de éstas
48
viviendas pertenecientes al nivel 4G- y un 42.1% al nivel
4G+
• Nodo 4: con 27 viviendas donde hay tres o más aparatos
telefónicos y de las cuales el 40.74% pertenece al nivel
4G++.
Todos los nodos presentan posibilidades de ramificación. El nodo 2 con un nivel crítico
<0.0001, un estadístico Ji-cuadrada de 28.7936 y 3 grados de libertad resultó que el
número de autos asegurados es la variable que puede discriminar a los hogares con un
aparato telefónico. Se formaron dos nodos:
• Nodo 5: con 149 hogares que no cuentan con autos
asegurados donde el 43% con nivel 4G- - y 41.6% 4G-.
• Nodo 6: las 36 viviendas que además de tener un aparato
telefónico tienen al menos un auto asegurado forman este
nodo. De éstos el 52.7% son del nivel 4G+
Los nodos 5 y 6 pueden dividirse aún más. Para el nodo 5 con un estadístico Ji-cuadrada
igual a 13.9598 y un nivel crítico de 0.0089 con 3 grados de libertad, la variable que
decidirá el nivel socioeconómico de los hogares con un aparato telefónico y sin autos
asegurados será el porcentaje de personas que tienen celular en el hogar:
• Nodo 11: con 135 elementos correspondientes a los
hogares cuyos habitantes no tienen celular, de los cuales el
45% son 4G-.
• Nodo 12: 14 son los hogares cuyos habitantes tienen al
menos un celular, de los cuales el 57% son nivel 4G-.
49
Para el nodo 6 con un nivel crítico 0.0080 y un estadístico Ji-cuadrada de 11.8654 con 2
grados de libertad, la variable predictora resultó ser el número de puertas del refrigerador,
dado esto, surgieron dos ramificaciones que resultaron nodos terminales.
• Nodo 13: 17 viviendas que tienen refrigerador de una
puerta. El 58% resultó ser 4G-.
• Nodo 14: 19 viviendas que tienen un aparato telefónico,
tienen al menos un auto asegurado, tienen un refrigerador de
dos puertas. El 78.9% resultó ser 4G+
Del nodo 3 con un nivel crítico 0.0026 y un estadístico Ji-cuadrada de 15.7499 con 3
grados de libertad, la variable predictora resultó ser el numero de empleados domésticos,
dado esto, surgieron dos ramificaciones que resultaron nodos terminales:
• Nodo 7: de 59 viviendas que no tienen empleados o los
tienen de tiempo parcial, el 42% se clasifican como 4G+ y el
37% como 4G-.
• Nodo 8: 5 viviendas que tienen empleado doméstico de
planta, resultaron ser el 40% 4G+ y 40% 4G++
Dadas las características del nodo 7, con un nivel crítico 0.0031 y un estadístico Ji-
cuadrada de 13.8759 con 3 grados de libertad, la variable predictora resultó ser la
posesión de calentador de agua, dado esto, surgieron dos ramificaciones que resultaron
nodos terminales:
• Nodo 15: con 5 viviendas que no tienen calentador de
agua. El 80% resultó ser 4G- -.
• Nodo 16: 54 viviendas que tienen al menos un calentador.
El 46% resultó ser 4G+.
50
El nodo 8 es un nodo terminal. Todas aquellos hogares que cumplan con tener dos
aparatos telefónicos y cuenten con empleada doméstica, inmediatamente serán
clasificados como 4G+.
Del nodo 4 con un nivel crítico 0.0023 y un estadístico Ji-cuadrada de 17.4313 con 3
grados de libertad, la variable predictora resultó ser el numero de baños, dado esto,
surgieron dos ramificaciones que resultaron nodos terminales:
• Nodo 9: 13 viviendas que tienen dos o tres baños, el 54%
se clasifican como 4G+.
• Nodo 10: 14 viviendas que tienen más de tres baños,
resultaron ser 4G++ el 79%.
5 Grupos
Si nos referimos al árbol resultante del análisis para la clasificación en cinco grupos, se
tiene como variable de primer nivel a la correspondiente al material del piso. Este
resultado se obtuvo con un nivel crítico <0.0001, un estadístico Ji-cuadrada igual a
112.6982 y con 8 grados de libertad, formando tres nodos:
• Nodo 2: con 93 elementos correspondiente a aquellas
viviendas con piso de arena o cemento en donde el 43% de
ellas pertenecen al nivel 5G- - y el 40% al 5G-
• Nodo 3: con 173 elementos correspondientes a las
viviendas con piso de loza o mosaico. El 32% de éstas
viviendas pertenecientes al nivel 5G y un 31% al nivel
5G+
51
• Nodo 4: con 10 viviendas donde el piso es de madera o
mármol y de las cuales la mitad pertenece al nivel 5G++
Los nodos 2 y 4 resultaron ser nodos terminales. Aquellos hogares que cuenten con piso
de arena o cemento se clasificarán como nivel 5G- -. Las viviendas que tengan piso de
madera tratada o mármol, serán clasificados automáticamente como del nivel 5G++.
El nodo 3 aún presenta posibilidades de ramificación. Con un nivel crítico <0.0001, un
estadístico Ji-cuadrada de 77.666 y 12 grados de libertad resultó se el número de baños la
variable que puede discriminar a los hogares con piso de loza o mosaico. Se formaron
cuatro nodos:
• Nodo 5: con 70 hogares que cuentan con un baño donde el
40% con nivel 5G+ y 32% 5G- -
• Nodo 6: las 67 viviendas que además de tener piso de loza
o mosaico tienen 2 baños forman este nodo. De estos el 37%
son del nivel 5G
• Nodo 7: las viviendas con 3 baños resultaron ser 22 de las
cuales 10, es decir, el 45% resultaron ser del nivel 5G y 28
del 5G+
• Nodo 8: solo 14 viviendas tuvieron 4, 5 o 6 baños. La
mitad de ellas pertenecen al nivel 5G+
Los nodos 6 y 8 resultaron terminales, por lo que aquellas viviendas que tienen 2 baños
serán clasificadas como 5G y las que tengan más de 4 baños como 5G+. Los nodos 5 y 7
resultaron ser parentales, por lo para el nodo 5 con un estadístico Ji-cuadrada igual a
14.28 y un nivel crítico 0.0025 con 3 grados de libertad, la variable que decidirá el nivel
socioeconómico de los hogares con piso de loza o mosaico y con un baño será el número
de terrazas:
52
• Nodo 9: con 61 elementos correspondientes a las
viviendas que no tienen terraza, de los cuales el 46% son
5G-
• Nodo 10: 9 viviendas con terraza, de las cuales el 67% son
nivel 5G
Para el nodo 7 con un nivel crítico 0.0341 y un estadístico Ji-cuadrada de 8.6667 con 3
grados de libertad, la variable predictora resultó ser la posesión de secadora de ropa. Esta
variable origina dos ramificaciones que resultaron nodos terminales:
• Nodo 11: 11 viviendas que tienen piso de loza o mosaico,
tienen tres baños pero no tienen secadora de ropa. El 45%
resultó ser 5G y otro 45% 5G-
• Nodo 12: 11 viviendas que tienen piso de loza o mosaico,
tienen tres baños y cuentan con secadora de ropa. El 45%
resultó ser 5G y el 45% 5G+
Dadas las características del nodo 7, se concluye de esta ramificación que los elementos
no pueden ser de nivel más bajo que el 5G por lo que si caen en el nodo 11 tras la
segmentación serán categonzados como 5G y si caen en el nodo 12 como 5G+.
4.4 Cuestionario propuesto
4 Grupos
Al árbol resultante de la aplicación del método CHAID a la base de datos resultó con
cuatro niveles y nueve nodos terminales. Estos nueve nodos terminales resultan de las
53
siete variables predictoras resultantes, por lo que, se incluyen al cuestionario siete
preguntas.
El resultado de la aplicación de estas preguntas, será la clave para clasificar a un
individuo en uno de cuatro niveles socioeconómicos. El número de aparatos telefónicos
que están conectados y funcionando en la vivienda, el contar con al menos un seguro de
automóvil, la posesión de un aparato telefónico celular, el tamaño del refrigerador de la
vivienda, la posesión de calentador de agua, contar con servicio doméstico y el número
de baños son las siete variables predictoras que señalarán el camino hacia la clasiñcación
de un individuo en uno de los cuatro niveles 4G--, 4G-, 4G+ y 4G++.
Así, la construcción del cuestionario resultó sencilla, pues según las variables predictoras
y las categorías de las respuestas que asignaron la ramificación, se redactaron tanto
preguntas como respuestas. Las siguientes son las preguntas que resultaron y el
procedimiento a seguir para aplicarlas:
/. ¿Cuántos aparatos telefónicos están conectados y funcionando en
su vivienda?
1 Uno o ninguno Pasar a pregunta 2
2 Dos Pasar a pregunta 5
>3 Tres o más Pasar a pregunta 7
2. ¿Cuántos autos tiene asegurados?
0 Ninguno Pasar a pregunta 3
>1 Al menos uno Pasar a pregunta 4
3. ¿Cuántas personas en su hogar tienen celular propio?
0 Ninguna Clasificar como 4G- -
>1 Al menos una Clasificar como 4G-
54
4. ¿Cuántaspuertas tiene su refrigerador?
<1 No tengo o es de una puerta Clasificar como 4G-
2 Dos Clasificar como 4G+
5. ¿ Tiene empleados domésticos de tiempo completo?
No Pasar a pregunta 6
Si Clasificar como 4G+
6. ¿Tiene calentador de agua?
0 No tengo Clasificar como 4G- -
>1 Si tengo Clasificar como 4G+
7. ¿Cuántos baños hay en su vivienda?
<3 Tres o menos Clasificar como 4G+
>4 4 o más Clasificar como 4G++
Este procedimiento es aplicable en pocos minutos al entrevistado, está construido de tal
manera que a lo más se le harán tres preguntas a cada entrevistado. Estas preguntas son
fáciles de contestar y no toman más de unos segundos preguntarlas y responder cada una.
Son muy breves y no presentan confusión o mala interpretación al ser escuchadas por el
encuestado y esto facilita aún más el proceso, además de que reduce el tiempo de
respuesta. El resultado será la fácil y rápida ubicación del individuo en el nivel que le
corresponde.
5 Grupos
El árbol resultante cuenta con cuatro niveles y ocho nodos terminales. Resultado de este
proceso de segmentación surgen cuatro preguntas. Estas resultan sencillas de responder,
son muy claras y breves. Un individuo puede ser clasificado desde la primera pregunta si
55
es que pertenece al nivel 5G- - o al 5G++. Para la clasificación de individuos de los
niveles intermedios es necesario realizar tres preguntas en caso de que se tenga uno o tres
baños en la vivienda, en caso contrario con dos preguntas será suficiente para clasificar
al individuo en alguno de los tres niveles intermedios.
El cuestionario propuesto es el siguiente:
¿De qué material es el piso de su vivienda?
1 Arena o cemento Clasificar como 5G--
2 Loza o mosaico Pasar a pregunta 2
>3 Madera o mármol Clasificar como 5G++
¿Cuántos baños hay en su vivienda?
4.
lUno
2 Dos
3 Tres
>4 Cuatro o más
¿Tiene terraza su vivienda?
No
Si
¿Tiene secadora de ropa?
No
Si
Pasar a pregunta 3
Clasificar como 5G
Pasar a pregunta 4
Clasificar como 5G+
Clasificar como 5G-
Clasificar como 5G
Clasificar como 5G
Clasificar como 5G+
56
Como se puede observar este instrumento resulta ser sumamente cómodo. Puede se
aplicado en un par de minutos y de inmediato se puede ubicar al entrevistado como
miembro de alguno de los cinco niveles socioeconómicos.
57
CAPITULO 5
Conclusiones.
5.1 Observaciones
En todo estudio estadístico una parte ñxndamental es conocer el nivel de confíabilidad y
los intervalos de confianza de las estimaciones realizados. Para la construcción de
intervalos de confianza en la clasificación rápida generada por la metodología y el
cuestionario breve descrito, hay que tomar en cuenta las siguientes anotaciones:
1. Los procesos de clasificación de mercadeo son técnicas meramente exploratorias, de
ahí el hecho de la imposibilidad de construir intervalos de confianza que den al
estudioso un criterio sobre la confíabilidad de la asignación de un individuo a
determinado nivel socioeconómico a través de el cuestionario breve.
2. Se pueden construir sobre la proporción de personas en cada nivel socioeconómico, al
igual que sobre los centroides de los grupos resultantes del análisis de
conglomerados, sin embargo crearlos sobre los grupos resultantes del CHAID resulta
un tanto complicado.
3. La confíabilidad en este método puede considerarse en las pruebas F y Ji-cuadrada
que se realizan al construir las divisiones en nodos.
Es muy importante volver a señalar que este estudio es meramente una muestra de las
técnicas que pueden emplearse para segmentar poblaciones según sus características.
Además que los resultados provienen de una muestra piloto y que para obtener un estudio
más detallado será necesario aumentar el número de elementos de la muestra.
58
5.2 Conclusiones
Después de la realización de este trabajo, la experiencia obtenida deja el conocimiento y
convencimiento de algunos conceptos y algunas consecuencias de realzar este tipo de
estudios. Teniendo en cuenta que se ha realzado ya la ennumeración de los niveles y su
explicación dentro del proceso, se obtienen dos importantes ideas: resultados y áreas de
oportunidad.
Dentro de las áreas de oportunidad que se encontraron a lo largo del estudio, sin tomar en
cuenta la limitante de tiempo y presupuesto, se puede concluir brevemente que la
problemática a la que hubo que hacer frente durante su desarrollo fue:
1. Sin lugar a dudas, el número de focos y el porcentaje del ingreso que se destina a la
compra de alimentos son factores muy importantes para determinar el nivel
socioeconómico de una persona. En general un número 'grande' de focos conlleva a
niveles socioeconómicos altos, es decir, hay una relación directa entre el número de
focos y el nivel socioeconómico. Para el porcentaje del ingreso destinado a la compra
de alimentos, sucede lo contrario: a mayor porcentaje del ingreso utilizado para
comprar alimentos, menor es el nivel socioeconómico al que pertenece la familia, esto
por el hecho de que tiene menos porcentaje de su ingreso para adquirir otros
productos y servicios. Sin embargo es un poco arriesgado utilizar estas variables, en
cuanto al número de focos porque existen hogares con pocos focos -adecuado para el
número de habitaciones- pero que corresponden a niveles altos por situaciones
diversas, quizá poca gente en la vivienda o viviendas que aunque son de tamaño
reducido se encuentran en zonas geográficas correspondientes a niveles altos y a
características de consumo de este grupo. En cuanto a la respuesta ante la pregunta
del porcentaje destinado a la compra de alimentos puede ser hasta cierto punto poco
confiable por dos razones: falsedad en la respuesta, desconocimiento del verdadero
ingreso del jefe de familia o bien por estimaciones mal realizadas.
59
2. La variable ingreso sin duda alguna es una de los predictores más obvios, sin
embargo, es una respuesta con alto grado de desconfianza, pues los entrevistados no
siempre contestan la verdad en este rubro. Esta es la razón por la cual esta variable no
debe ser parte de un cuestionario breve.
3. El número de baños y regaderas son variables confiables pues son elementos
tangibles y fáciles de responder, además, son -como ya lo demostró el estudio-
variables determinantes del nivel socioeconómico.
Las conclusiones importantes a las que se llegó después de la realización y el estudio
concienzudo de los resultados de este trabajo son las siguientes:
1. La población en el Área Metropolitana de Monterrey puede dividirse estadísticamente
bajo el criterio 'nivel socioeconómico' en 3, 4 o 5 grupos según las necesidades del
usuario, el tipo estudio o información que requiera y los objetivos para los cuales se
realice, además del detalle al que se quiera llegar. Es decir, si solo interesa distinguir
a las personas que tienen un gran potencial de compra, basta con segmentar la
población en tres y dirigirse al grupo de más alto nivel socioeconómico. Si lo que se
desea, por ejemplo, es introducir un producto para el hogar en la clase media, quizá
sea necesario segmentar la población en cinco y conocer los tres segmentos que
conforman la población de nivel medio: medio bajo, medio y medio alto.
2. Las características que distinguen a cada uno de los grupos son plenamente
identificables.
3. Las técnicas exploratorias utilizadas en este estudio son una herramienta confiable y
práctica con la que se obtienen excelentes resultados y sobre todo, se apegan a la
realidad.
4. El buen resultado en el contraste de los resultados del método empleado con los ya
existentes habla de la calidad de éste con las limitaciones ya mencionadas.
60
5.3 Ventajas de utilizar el instrumento propuesto
Es muy importante mencionar que los resultados de este estudio demuestran que las
técnicas empleadas en la investigación de mercado son una alternativa muy importante
para las empresas. Aquellas que buscan colocar un producto o que pretenden conocer las
necesidades de los clientes e incluso las características que deben tener los productos
según el nivel socioeconómico al que va dirigido, tienen en este tipo de estudios la
solución a sus problemas.
Muchas son las ventajas de utilizar este tipo de instrumentos para los estudios
poblacionales, aún más cuando se trata de conocer la estructura de un grupo tan grande
como una ciudad o un área urbana.
Una de las ventajas competitivas de contar con un cuestionario tan corto para ubicar a un
individuo en algún nivel socioeconómico es precisamente la reducción de los costos. El
tiempo que se invierte en la aplicación de la pregunta es tan pequeño, que en un periodo
relativamente corto se pueden obtener un gran número de entrevistas y con ello una
información más amplia. Además, la capacitación que requieren los encuestadores en
cuanto al entender el instrumento es también mínima, pues solo tienen que realizar pocas
preguntas que no presentan ninguna posibilidad de confusión.
Todo esto se verá reflejado en mejores resultado y anticipación a la competencia, pero
sobre todo, asegurará resultados de calidad a bajo costo.
5.4 Recomendaciones
Algunas de las recomendaciones a los lectores de este trabajo se refieren en su mayoría a
la precaución que debe tenerse por el problema de tamaño de muestra. Éste originó
algunos problemas de representatividad del grupo de nivel más alto, por ello es
61
recomendable aplicar este análisis a una muestra de mayor tamaño y para reducir costos,
aplicando un cuestionario sólo con las preguntas que resultaron importantes en el análisis
discriminante pues el resto que fueron utilizadas como descriptivas ya están reflejadas en
los resultados.
Otra nota importante es recalcar el hecho de que este estudio es local, es decir, no se
puede aplicar a otra ciudad sin las revisiones pertinentes. El origen de la falta de
generalidad radica en las características particulares de cada población en cuanto a
geografía, clima, costumbres y niveles de ingreso y productividad. Para ejemplo claro, en
Monterrey y su Área Metropolitana, contar con aire acondicionado es un factor que
determina el nivel socioeconómico, pero si tomamos esta variable en Ciudad de México,
no tendrá sentido pues el clima de esa zona no sugiere el uso de este tipo de aparatos.
Una anotación relevante asociada con este estudio es la revisión constante de la
metodología que día a día los investigadores desarrollan, las adecuaciones realizadas a
los métodos con miras a reducir la problemática que pudieran generar y sobre todo, los
nuevo métodos que optimizan el proceso y reducen los costos sin mermar la calidad de
los resultados.
Es de igual manera relevante recordar que este tipo de estudios son tan importantes y
necesarios para la vida política y comercial de una población que cualquier aportación en
este rubro es muy apreciada por los estudiosos del mercadeo y la estructura social y
económica de las naciones.
No hay que dejar a un lado la importancia del conocimiento de la población, cualquiera
que ésta sea, y mucho menos si se trata de la población hacia la cual van dirigidos los
esfuerzos de nuestra empresa o de nuestro gobierno.
62
Anexo 1
Cuestionario
El cuestionario que se aplicó en la encuesta para obtener los niveles socioeconómicos del
Área Metropolitana de Monterrey es el que se presenta en las páginas siguientes.
En la portada, el entrevistador llena los espacios vacíos con su número de entrevistador,
el nombre del municipio y el nivel socioeconómico aparente. Ademas incluye en la parte
superior el número de manzana y el número del plano Guía Roji en el que se encuentra
ubicada la manzana.
El cuestionario fue impreso de la siguiente manera: en la hoja uno, la portada por el
anverso y de la pregunta 1 a la 20 en el reverso. La pregunta 21 y hasta la 37 en el
anverso de la segunda hoja y de la 38 a la 59 en el reverso. La parte frontal de la tercera
hoja incluyó las preguntas de la 60 a la 78 y respaldo de la 79 a la 101. La cuarta y última
hoja incluyó por en anverso de la pregunta 102 a la 117.
Los números pequeños junto a las posibles respuestas es la codificación que se estableció
para clasificar la información en la base de datos para el análisis.
• Aquellas preguntas que no tienen número asignado, el código que se asignó en la base
de datos fue la cantidad que el encuestado responda a la pregunta, por ejemplo, a la
pregunta ¿cuántos baños tiene la casa donde vive?, si la respuesta es 3, se introduce
en el campo asignado a esta pregunta para ese cuestionario, el número 3.
• Las que tienen un asterisco (*) son las correspondientes a la opción 'OTRO' para este
tipo de respuestas, se localizó la respuesta en la categoría más cercana a la respuesta.
• El doble asterisco (**) es para la opción 'COMBINACIÓN DE' y la respuesta del
entrevistado cuyo valor sea el más grande en la escala fue el que se introdujo en la
base de datos.
B
INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE
MONTERREY
Departamento de Matemáticas
UNIDAD DE ESTUDIOS ESTADÍSTICOS
ESTUDIO SOCIOECONÓMICO AMM
Al entrevístador: La entrevista se llevará a cabo sólo en hogares del Área Metropolitanade Monterrey los cuales hayan resultado seleccionados aleatoriamente. Este cuestionariose aplicará a personas de 18 años de edad o mayores, que fonnen parte de la familia quehabita en el hogar seleccionado. No se aplicará la entrevista a empleados del hogar,aunque estos últimos vivan ahí.
Al entrevistado: Este es un estudio que tiene como propósito conocer informaciónsocioeconómica de los habitantes de Monterrey y su Área Metropolitana. Agradecemossu participación. Los datos son confidenciales y anónimos. No se registraránnombres, domicilios ni teléfonos.
Municipio
Entrevistador
NSE
CARACTERÍSTICAS DE LA VIVIENDA
1.- La casa en la que habita es:
QH| Propia (pasar a preg. 5)
La está pagando (pasa a la preg 4)
Está hipotecada
| ] Rentada (pasa a la preg 2)
1 | ^ | Prestada o de familiares
* Q Otro
2.- En caso de que rente, el lugar lo renta
| | No aplica
3 Q Amueblado
2 | | Parcialmente amueblado
1 Q Sin muebles
3.- La renta mensual que paga por la casa en la que habita es:(pasara la pregunta 6)
| | No aplica
1 Q Menor a $500
9.-
2 | I De $500 a menos de $1500
3 Q De $1500 a menos de $2500
4 Q De $2500 a menos de $8000
5 Q De $8000 a menos de $12000
6 C U De $12000 a menos de $20000
7 • Másde$20000
4.- Si la está pagando, ¿cuánto paga de mensualidad?
| | No aplica
1 Q Menos a $1,500
2 C U De $1,500 a menos de $3,000
3 Q De $3,000 a menos de $5,000
4 Q De $5,000 a menos de $10,000
5 C U De $10,000 a menos de $15,000
6 CU Más de $15,000
5.- Si su casa es propia:
| | No aplica
3 | | El terreno es propio
2 | | El terreno es ejidal
1 | | El terreno es zona federal
* CU Ota)6.- El terreno en el que está construida su casa es:
1 | | Indivudual
2 C U Compartid0 0>p"».c»°d"n'«"».*ipieiiois»íix>cúj)
7.- El tamaño de la casa en la que habita es:
1 Q Menor a 100m2
2 CU De 100 a menos de 200 mts2
3 C U De 200 a menos de 500 mts2
4 Q De 500 a menos de 1000 mts2
5 I I 1000mts2omás
10.-
11.-
¿De qué material está hecha la vivienda?
1 | | Lámina-Cartón
2 Q Madera
3 Q Ladrillos
4 Q Contec
5 | | Blocks de concreto
** | | Combinación de
* Q OtroEl piso de su vivienda es de:
1 | | Arena
2 Q] Cemento
3 [^| Loza, Mosaico
4 Q Madera
5 | [ Mármol
** £^j Combinación de
¿Qué tipo de acabado tiene su casa?
1 | | No tiene acabados
2 | | Solo reboque (cal o cemento) y no pintura
3 Q Pintura
4 | | Acabados comerciales (texturizados, imitación piedra)
5 Q Piedra, ladrillo
¿De cuántos pisos es la casa donde vive?
12.- ¿Cuántos baños tiene la casa donde vive?
13.- ¿Cuántos baños tienen regadera?
14.- ¿Cuántos baños tienen tina?
15.-
16.-
¿Tiene jacuzzi?
r ~ | Si, ¿Cuántos?
¿Cuántas habitaciones tiene la casa donde habita?(Sin bafios, incluir sala, comedor y salas de estar. Sara-comador as nna.)
17.- ¿Tiene recibidor además de sala?
2 [ | Si
1 CU No18.- ¿Cuántos patios tiene en total la casa donde habita?
19.-
20.-
¿Tiene terrazas?
| | Si, ¿cuántas?
CU No¿Tiene cochera cubierta?
| | Si, ¿cuántos coches?
I I No
D
21.- ¿Tiene fuentes?
| [ Si, ¿cuántas?
• No22.- ¿Tiene piscina?
| [ Si, ¿cuántas?
• No23.-¿Tiene gimnasio?
2 • Si1 Q No
24.- ¿Tiene estudio o biblioteca?
2 Q Si
1 Q No
25.- ¿Tiene cuarto para la servidumbre?
2 • Si
1 Q No
26.- ¿Tiene cuarto de lavandería?
2 • Si1 • No
27.- ¿Cada cuanto tiempo pinta el exterior de su casa?
No aplica
28.- ¿A cuántas eiudnu se encuentra el parque más cercano'
4 | | Menos de una
3 | | Una o dos
2 Q Tres o cuatro
1 | | Más de cuatro
29.- ¿En qué condiciones se encuentra el parque?
1 | | Abandonado
2 | | Muy descuidado
3 | | Regularmente descuidado
4 | | En buenas condiciones
5 | | En excelente estado
30.- El alumbrado de la calle donde vive es:
1 \~J No hay alumbrado
2 | |3 unPoco
Bueno
31.- Marque con una X h» servicioscon los que cuenta la vivienda•
••••••
Agua potable
Drenaje
Electricidad
Pavimentación
Recolección de basura
Alumbrado público
Gas natural
32.- ¿Es dueño de algún otro inmueble? ¿Cuántos?
• No| | Casas
| | Terrenos
| | Bodegas
| | Locales comerciales
| | Edificios (especifique)
| | Casas de Campo
| j Casas de playa
| | Quintas
S Q Otro
BIENES EN EL HOGAR
33.- ¿Cuántos focos hay en su casa?
34.- De los siguientes aparatos,¿con cuántos cuenta la casa donde habita?x3 | | Abanicos
tasa? x!8| |
X36T1
Aparato de aire lavado
Aire acond. Individual
Aire acond. Central
Minisplit
roño? 35.- ¿Cuánto paga por el servicio de agua en su hogar?
1 | | Nosabe2 CU^ D4 CU5 Q« •7 [j |8 • »9 n
Nopaga
Llave compartida
Menos de $100
De $100 a menos de $200
De $200 a menos de $300
De $300 a menos de $500
De $500 a menos de $1,000
Más de $1,000
36.- ¿Cuánto paga aproximadamente por recibo de serviciode luí en su bogar durante invierno?1 | | No sabe2 D3 Q4 CU5 1 1
Nopaga
Menos de $100
De $ 100 a m enos de $200
De $200 a menos de $300
6 Q De $300 a menos de $500
7 | |p De $500 a menos de $1,000
8 Q Más de $1,000
37.- ¿Cuánto paga aproximadamente por recibo de serviciode luí en su hogar durante verano?1 • Nosabe
2 Q Nopaga
3 Q Menos de $100
4 Q De $100 amenos de $200
5 Q De $200 a menos de $300
6 Q De $300 a menos de $500
7 Q De $500 a menos de $1,000
8 Q Más de $1,000
38.- ¿Cuánto paga por el servicio de gas en su hogardurante invierno por recibo?1 Q No sabe
2 Q No paga
3 Q Menos de $100
4 Q De $100 a menos de $200
5 Q De $200 a menos de $300
6 Q De $300 a menos de $500
7 | |p De $500 amenos de $1,000
8 Q Másde$l,000
39.- ¿Cuánto paga por el servicio de gas en su bogardurante verano por recibo?1 Q No sabe
2 £ ] ] No paga
3 Q ] Menos de $100
4 Q De $100 a menos de $200
5 [~ | De $200 a menos de $300
6 Q De $300 a menos de $500
7 | |0 De $500 a menos de $1,000
8 Q Más de $1,000
40.- ¿Tiene Teléfono?
1 Q Si, ¿cuántas líneas?
2 [ ] ] No (pasar a la preg. 44)
41.- ¿Cuántos aparatos telefónicos conectadosy funcionando hay en su vivienda?
48.- ¿Tiene lavadora de platos?
2 • Si1 • No
49.- Su refrigerador de cocina es
42.- ¿Tiene Teléfono inalámbrico?
1 Q Si, ¿cuántos aparatos?
2 • No
43.- ¿Tiene línea privada?
1 Q Si, ¿cuántas líneas?
2 | | No
44.- ¿Tiene calentador de agua (Boiler)?
| | Si, ¿cuántos?
• N°45.- Durante invierno, el calentador que usa es de:
| | No tengo
• Carbón
• Degas
| 1 De aceite
| | Aparato de ventana
| | Eléctrico
• Otro
| | Mini Split
46.- ¿Tiene lavadora de ropa?
2 • Si1 Q No
47.- ¿Tiene secadora de ropa?
2 • Si1 • No
2 • Frigobar
3 | | De una puerta y pequeño
4 | | De una puerta y tamaño mediano
5 | | Dos puertas, grande y congelador
6 | | Dos puertas, grande, congelador y despachador de hielo
50.- Su equipo de sonido tiene
1 Q ] Radio
2 Q Radioytocacintas
3 | | Radio y doble tocacintas
4 [^ ] Radio, tocacintas y CD
51.- ¿Tiene tostador de pan?
2 • Si
1 [J | No52.- ¿Tiene videocassetera?
| | Si, ¿cuántas?
• No53.- ¿Tiene computadora personal en casa?
2 • Si
1 Q No (Pasar a preg. 55)
54.- ¿Tiene contrato particular para Internet?
2 | | Si
1 • No55.- ¿Tiene algún aparato para juegos de video?
1 • No2 Q Nintendo
3 Q Nintendo 64
4 £ ] Super Ninitendo
5 [ [ ] Super Nintendo 2
56.- ¿Tiene contrato con alguna compafiia de televisión por cable?
• Si, ¿Cuál?
• No57.- ¿Posee alguna colección con valor comercial?
2 Q Si
1 • No58.- ¿Tiene alguna obra de arte?
(pinturas, esculturas originales de artistas prestigiados)
2 • Si1 • No
59.- ¿Qué estilo definiría la decoración interior de su casa?
0 [ ^ Ninguno
1 | | Rústico o Colonial
1 |T] Clásico
1 Q Moderno
1 | | Combinación de
1 Q Otro
CARACTERÍSTICAS DE LA FAMILIA
60.-¿Cuan s habitas esta casa?
61.- ¿Hay alguien que no sea parte del nócleo familiar?(abuelas, primos, empleados, etc.)1 [ ] Si, ¿cuántos?
2 [ ] No62.- ¿Quién es el miembro de la famíh que que
da el mayor aporte económico?1 [ ] Padre
2 Q Madre
3 Q Algún hijo
4 [ ] Otro
63.- ¿Qne escolaridad tiene el jefe de familia?
64.- ¿Qué escolaridad tiene la madre de familia?en caso de no ser el jefe de familia
65.- ¿Cuántos habitantes de la casa son mayores de 18 anos?
66.- ¿cuantos ayos viven en casfl? <?•» b
67.- Para cada nno de los hijos
Edad Nivel deEstadios
¿Estadal•cteahacate?
Esenciaprivada opublka
Beca»/.
72.- ¿En qué rango de ingresos mensuales seencuentra b familia?1 [} Meno» de $1,500
2 [ ] De $1,500 a menos de $3,000
3 [ ] De $3,000 a menos de $5,000
4 [} De $5,000 a menos de $10,000
5 [ ] De $10,000 a menos de $20,000
6 [ ] De $20,000 a menos de $35,000
7 Q o De $35,000 a menos de $70,000
8 Q Más de $70,000
CARACTERÍSTICAS DE CONSUMO
73.- Los anmentos para la familia se compran en
1 [ j Mercado de abastos
2 \_j Mercado sobre ruedas
3 LJ Tienda cercana
4 £ ] Autoservicios como Soriana, Gigante, Azcúnaga
5 Q Autoservicios como SAM's, HEB. Wall Mart
6 Q Tiendas de conveniencia (OXXO, Seven Eleven)
74.- ¿Con qué frecueucb compran los alñnentos?
1 [ ] Diario
2 [_J Dos o tres veces a la semana
Una vez a Ja semana
Cada 15 días
Cada mes
D75.- ¿Quién reahza la compra de los alimento»?
1 Q Un miembro de la familia
2 [ J Servidumbre o empleados
76.-Cuenta con
68.- ¿Alguno de los miembros de 1» familiaha estudiado en el extranjero?1 • Si, ¿cuantos? ¿"/. de Beca? _
¿Dónde?
0 Q No6».- ¿Cuántos miembros de la familia trabajan?
KMpfeado | Catetos
Labores del hogar
Jardinero
Chofer
Niñera
Cocinera
Lava coches
Oíro
Tiempo
70.- ¿Cuántos miembros de la familia sondependientes económicos?
77.- ¿La familia cuenta con autMnóvíl(es)?
Q Si, ¿cuántos?
71.- ¿En qué rango de ingresos mensuales seencuentra el jefe de familia?1 [ ] Menos de $1,500
2 Q De $1,500 a menos de $3,000
3 [ ] De $3,000 a menos de $5,000
4 [ ] De $5,000 a menos de $10,000
5 [ ] De $10,000 a menos de $18,000
6 [ ] De $18,000 a menos de $30,000
7 Q o De $30,000 a menos de $50,000
8 U Mas de $50,000
[ ] No (pasar a la preg. 82)
n los automóviles de la familia?Modelo Ano
7».- ¿Estáa «segurados los aatos de b ramilla?
| | Si, ¿cuántos?
| ~ | No(pasealapreg.82)
80.- ¿Qae cobertara tieaea los satos qae posee?
| | Daños a terceros ¿cuantos?
| | Cobertura amplia ¿cuantos?
81.- L u primas de k» segaros de los aatos bu paga
| | Un miembro de la familia
| | La empresa donde labora
82.- Ea servidos baacarios, estad caeata coa
| | Ninguno
| | Inversión a plazo fijo
| | Tarjeta de nómina
| | Tarjeta de débito
[ | Tarjeta de crédito nacional corporativa
| | Tarjeta de crédito internacional corporativa
| | Tarjeta de crédito nacional propia
| | Tarjeta de crédito internacional propia
| |o Cuenta de cheques
» . - ¿Asiste a coasaHa ea el IMSS o ISSSTE?
1 | | Cada vez que necesito atención médica
2 Q Rara vez3 | | Solo para trámite de incapacidades
4 Q Nunca
S4.- ¿Algia ariembro de b Guaina catata coaaaaaófea de segara?
n Si, ¿cuántos?| | No (pase a la preg 87)
8S. Para cada Upo de segara ladiqae¿Caáatos miembros de h famiha?
| | Vida individual
| | Vida en grupo
| | Castos médicos mayores
Dental
Otro
H.- Las prioras de los segaros de*• fallía las paga2 [ j Un miembro de la fannlia_
1 | | La empresa donde labora___
87.- ¿Dóade saete comprar sa raariüa b ropa?
1 | | No compro ropa
2 Q] Tianguis o pulgas
3 | ¡ A plazos con algún conocido
4 | | Boutiques pequeñas
5 | I Tiendas de autoservicio (Soñana, Gigante...)
6 | | Almacenes de ropa (Ropa de AguascaUentes...)
7 | | Tiendas departamentales (Liverpool, J.C. Penny,
8 £] Bouuques demarra (Banana Republjc, Jubo. )
9 | | En el extranjero
• I 1 Otro
88.- ¿Dóade s«ete comprar priadpalmeatesi familia tos tapates?1 | | No compro zapatos
2 £ ] Tianguis o pulgas
3 | | A plazos con algún conocido
4 | | Boutiques pequeñas
5 f | Tiendas de autoservicio (SoriaDa, Gigante...)
6 £] Cadenas (Canadá, 3 Hermanos...)
7 Q Tiendas departamentales (Liverpool, J.C. Peroiv, P.H.)
S Q] Boutiques de marca (Gosetly, DomitBalJi. )
9 | | En el extranjero
* Q Otro99.- ¿Qaé perfame compra geaeramteate?
90.- ¿Dóade saek comprar priadpalmeate perfamerñ ?
1 | | No compro perfumería
2 | | Tianguis o pulgas
3 [ | A plazos con algún conocido
4 [ ^ Boutiques pequeñas
5 | | Tiendas de autoservicio (Soriana, Gigante...)
6 [̂ ] Tiendas departamentales (Liverpool, J.C. Penny, P.H.)
7 | | Boutiques de marca
8 Q]] En el extranjero
H.- ¿Abjia miembro de h familia asa (recaeatemeatealgia «ratamemto cosmético espedalbado?
92.- ¿Caiatos relojes de pabera Ueae y de qaé marcas?
93.- ¿Qaé porcrataje de los iagresos familiares coasideRsoa desttaados a los altane*tos?
94.- ¿Caiatos de los miembros de b familia cantancoa kKalhador (beeper) propio?
95.- ¿Caiatos de tos miembros de b familia cacabacoa cembtr propio?
9*. ¿Caiatos miembros de la familia a,ae aecesitaaleatesloslleaea?
97.- SI asa katos gradeados, ¿dóade tos compró?
1 Q ] No uso
2 | | Tianguis o pulgas
3 £ ] A plazos con algún conocido
4 | | Ópticas pequeñas
5 | | Tiendas de autoservicio (Soriana, Gigante...)
6 Q ] Tiendas departamentales (Liverpool, J.C. Penny, P.H.)
7 | | Ópticas exclusivas
98.- ¿Usa bates de sol? ¿qaé marca?
P.H.)
99.- ¿De qaé marca es el bobo o cartera qae trae coasigo?
100.¿Tieae mascota? ¿qaé Upo?¿Caiatas?
101.¿Qae raza soa sas mascotas?
H
02.-EI alimento de sus mascotas generalmente es:
1 | | No aplica
2 | | Sobras de la comida
3 | | Sobras y un poco de alimento comercial
4 | | Alimento comercial a granel
5 | j Alimento comercial de marca
6 [ | Alimento especializado
7 Q °^° _ _ _ _ .03.-¿Cuántas veces al mes usted asiste a la estética?
O4.-En la estética suele hacerse
1 | | No acostumbro ir a estéticas
2 | | Corte de cabello
3 | | Manicure
4
5
6
7
8
9
LJ
•••n
Tintes
Permanentes o alaciados
Tratamientos capilares
Tratamientos de la piel
Masajes
Otro
05.-¿Cuántas veces al mes va al eme?
1
2
3
4
••i |
D
Ninguna o menos de una
Una
Dos o tres
Más de tres
06. ¿Cuntas veces al mes desayuna en restaurantes
1
2
3
4
5
6
•••••D
Ninguna
Mecos de una
Una o dos
De tres a cinco
Más de cinco
Siempre
107 ¿Cuantas veces ai mes come en restaurantes?
1
2
3
4
5
6
••••••
Ninguna
Menos de una
Una o dos
De tres a cinco
Más de cinco
Siempre
0&-¿Cuáatas veces al mes cena en restaurantes?
1
2
3
4
5
6
•Da•aa
Ninguna
Menos de una
Una o dos
De tres a cinco
Más de cinco
Siempre
10» ¿Cuántas prendas envía a la tintorería al mes?
110.-¿Está inscrito en algún video club?
1 Q No
2 [J En uno cercano a casa
3 [] EnVideocentro
4 [2 EnBlockBuster
5 [J En la cineteca
lll.-¿Cnántas películas renta a la semana?
1 Q No aplica
2 Q Ninguna
3 [_J Menos de una
4 [] Una o dos
5 [J De tres a cinco
6 |_| Más de cinco
112.-¿Caántas veces al ano vacación»fnera de la cmdad pero en el país?1 L] Ninguna
2 [ j Menos de una
3 [ ] Una o dos
4 Q Tres o más
113.-¿Cnántas veces al afio vacaciona en el extrajero?
1 [ ] Ninguna
2 [ ] Menos de una
3 [ ] Una o dos
4 £j Tres o más
I14.-Para a s últimas vacaciones
Lagtr HKe nial»? Ligarle •«•eaaje
115 ¿Caenta con alguna membrasía de tiempocompartido para vacadonar?1 | J Si, ¿dónde?
2 • No116 ¿Caales son ha diversiones más asnales de la familia?
raninaPasatiempo y l ipn- doidf b practica
117 ¿Qué deporte practican los miembros de b familia?
Deporte y lugar donde lo practica
Anexo 2
Descripción de las variables empleadas en el estudio
VariableLa casa que habita esTamaño terrenoMaterial de la viviendaMaterial del pisoAcabadosMatenal de la viviendaNúmero de BañosNúmero de regaderasHúmero de tinasNúmero de JacuzziNúmero de habitacionesRecibidorNúmero de patiosNúmero de terrazasNúmero de autos cubiertosNúmero de fuentesNúmero de piscinas
Estudio o BibliotecaCuarto para servidumbreCuarto de lavanderíaPintura del exteriorParque más cercanoCondiciones del parqueAlumbrado en calleServicio de Agua PotableServicio de drenajeServicio de ElectricidadServicio de PavimentaciónServicio de Recolección de BasuraServicio de AlumbradoServicio de Cas entubadoNúmero de inmuebles en posesiónNúmero de FocosNúmero de abanicosNúmero de aires lavadosNúmero de aires acondicionados individualesNúmero de aires acondicionados centralesNúmero de minisplitsPago por recibo de aguaPago por recibo luz inviernoPago por recibo luz veranoPago por recibo gas inviernoPago por recibo gas veranoLineas telefónicasNúmero de aparatos conectados 7 funcionandoNúmero de teléfonos inalámbricos
1*»OrdinalOrdinalOrdinalOrdinalOrdinalOrdinalDiscretaDiscretaDiscretaDiscretaDiscretaBinariaDiscretaDiscretaDiscretaDiscretaDiscretaBinaria
BinariaRtmtna
BinanaOrdinalOrdinalOrdinalOrdinalBinariaBfnaria
BinariaBsiariaBinanaBinaria
BinariaDiscretaDiscretaDiscretaDiscretaDiscretaDiscretaDiscretaOrdinalOrdinalOrdinalOrdinalOrdinalOrdinalDiscretaDiscreta
VaridkHúmero de líneas privadasCalentador de AguaLavadora de ropaSecadora de ropaLavadora de platosTipo de RefrigeradorTostador de panVideocassetteraComputadora personalContrato pata internetJuegos de videoTelevisión por cableColección con valor comercialObra de arteDecoraciónNúmero de personas en el hogarEscolaridad del jefe de familiaEscolaridad del jefe de familia
Ingresos mensuales del jefe de familiaIngreso mensuales familiaresLugar de compra de aumentosFrecuencia de compra de aumentosQuien realsala compra de alimentosPersonal para labores del hogarNúmero de autos en el hogarNúmero de autos aseguradosNúmero de pólizas por dañas a tercerosNúmero de p obras por cobertura ampliaNúmero de primas pagadas por la familiaNúmero de pólizas pagadas por la empresa donde laboraNúmero de servicios bancatiosConsulta al DJSSNúmero de pólizas de seguroNúmero de pólizas de Vida individualHúmero de pólizas para vida en grupoHúmelo de pólizas para gastos médicosNúmero de pólizas de seguro dentalNúmero de pólizas pagadas por la familiaNúmero de pólizas pagadas por la empresaLugar de compra de ropaLugar de compra de zapatosPorcentaje del ingreso dirigido a alimentosHumero de beepers en la familiaNúmero de celulares en la familiaNúmero de veces que asiste a la estéticaEn la estética suele hacerce
T*. 1DiscretaOrdinalBmariaBinariaBinariaOrdinalBinariaOrdinalBinariaBinariaOrdinalOrdinalBinariaBinariaBinariaOrdinalOrdinalOrdinal
OrdinalOrdinalOrdinalOrdinalOrdinalOrdinalDiscretaDiscretaDiscretaDiscretaDiscretaDiscretaDiscretaOrdinalDiscretaDiscretaDiscretaDiscretaDiscretaDiscretaDiscretaOrdinalOrdinal
ContinuaDiscretaDiscretaDiscretaOrdinal
Anexo 3
A3.1 Gráficos de barras
Los siguientes gráficos de barras
corresponden a las variables medidas en
la encuesta mediante datos categóricos.
Material del piso
Material del piso
Acabados
La casa que habita es
Prestada/brriEares La renta La está pagando Propia
La casa que habita es
Tamaño terreno
£ oMenora100m2 200 a menos de 500m2 1000m2omás
100 amenos de 200 m 500 amenos de 1000m
Tamaño terreno
•£ oNo «ene acabado Pintura
Solo reboque Acabados comerciales
Acabados
Número de pisos en la vivienda
Número de pisos en la vivienda
K
Número de Baños Número de habitaciones
Número de Baños
1 2 3 4 5 6 7
Número de habitaciones
9 10 11 12 13 15
Número de regaderas Número de patios
0 1 2 3 4 7
Número de patios
Número de tinas Número de terrazas
S. o L100
80
60
40
20.
8 L0 1 2 3
Número de tinas
o i
Número de terrazas
2 3
Número de autos cubiertos en la cochera Condiciones del parque más cercano
Pe
Número de autos cubiertos en la cochera Condiciones det parque más cercano
Alumbrado en calleTiempo en que pinta el exterior de su casa
2m 3m Sm 6m 1a 2a 2ioa 3a 4a 5a
Pintura del exterior (m= meses, amaños)
Mate
Alumbrado en calle
Regular Bueno
Parque más cercano Número de inmuebles adicionales en posesión
Parque más cercano (calles) Número de inmuebles en posesión
M
Número de personas en el hogarRango de ingresos mensuales del jefe de familia
1 2 3 4 5 6 7 8 9
Número de personas en el hogar
Escolaridad del jefe de familia
Escolaridad del jefe de familia
Escolaridad de la madre de familia
Nofiene Secundarla Técnico MaesMa
Primaria Preparatoria licenciatura
Escolaridad de la madre de familia
Pe Illm.1500 1 innam.rosrt .vm Mas de 60000
3000a menos de5000,1500 1500 a menos de 3000
3000 a menos de 50005000 a menos de 1000
10Q00 a menos de 18018000 a mer os de 300
Rango de ingresos mensuales del jefe de familia
Ingresos mensuales de la familia
llhi...v
% x %Ingresos mensuales de la familia
Número de autos en el hogar
0 1 2 3 4 5 7
Número de autos en el hogar
N
Lugar de compra de ropa Número de veces que asiste a la estética al mes
Lugar de compra de ropa
Lugar de compra de zapatos
.1JM.1V\VXV
Lugar de compra de zapatos
Porcentaje del ingreso dirigido a alimentos
Número de veces que asiste a la estética
Número de Focos
1 5 9 13 17 22 30 40 753 7 11 15 20 25 37 54 100
Número de Focos
Número de abanicos
5 10 12 15 18 20252830353840500)70758090
Porcentaje del hgreso dirigido a alimentos0 1 2 3 4 5 6
Número de abanicos
O
Número de aires lavados Número de minisplits
l l0 1 2 3 4
INúmero de aires lavados
Número de aires acondidonacios individuales
Número de minisplits
Pago por recibo de agua
Iww-— . __0 1 2 3 4 S 7
Número de aires acondicionados individuales
Número de aires acondicionados centrales
No paga Uave compartidaMenos He 100
De 100 a menos de 200
De 200 a menos de 300
Pago por recibo de agua
De 500 a menos de 1000
Más de 1000
Pago por recibo luz invierno
Pe
-•lili.0 1 2
Número de aires acondicionados centrales
Nopaga
Pago por recibo luz invierno
De 100 De 200 De 300 De 500enos »menos a menos amenos M a s d e 1 0 X
20,, ^ J Q O ^ j g n ¿ j o ñ o
Pago por recibo luz veranoNúmero de aparatos telefónicos conectados y funcionando
No Meno De 100 De 200 De 300 De 500 1000 ópaga sde amenosa amenosa menos más
100 de 200 menos de 500 de 1000de 300
Pago por recibo luz verano1 2 3 4 5 6 7
Número de aparatos conectados y f uncbnando
Pago por recibo gas invierno
Pe MILNo Menos De 100 a De 200 De 300 a De 500 Maspaga de 100 menos a menos menos a menos de
de 200 de 300 de 500 de 1000 1000
Número de teléfonos inalámbricos
Pago por recibo gas invierno 0 1 2 3 4 5
Número de teléfonos inalámbricos
Lineas telefónicas Calentador de Agua
Pe
o 1
Lineas telefónicas
^ 5 5
Calentador de agua
Tipo de Refrigerador
Juegos de video
Tpo de Refrigerador
De uta De una Dospuerta y puerta y puertas, grande, y conpequeño médano grande despachador
de Neto
Juegos de video
Equipo de SonidoTelevisión por cable
No tengo
Equipo de Sonido
Radn y tocadntas Radto, tocacintas y
Radio y doble tocad
No tengo Cabtevisión, MVS
Televisión por cable
VideocaseteraEmpleados domésticos
Vkteocassettera
Empleados domésticos (enteros= tiempo completo, fracción^ tiempo parcial)
R
A3.2 Histogramas
Número de personas por habitación
.25 .75 1.25 1.75 2.26 2.75 3.2650 1.00 160 2.00 2.50 3.00 3.50
Número de personas por habitación
Proporción de dependientes económicos
Proporaón de dependientes económicas
Proporción de mayores de 18 años
Proporción de habitantes respecto al numera deautos en la vivienda
FrSld Dev = 1 25
Mean = 99
277.00
0.00 1.00 2.00 3 00 4.00 5.00 6.00 7.00.50 1.50 2.50 3.50 4.50 5 50 6.50 7.50
Número de Habitantes/autos
Proporción de mayores de 18 anos
Número de miembros de la familiaque trabajan
5.0 6.0 7.0 8.0 9.0
Número de miembros de la famiiaque trabaja
Proporción de asegurados
SU. Dw = 0.30
Mean =Q13
N = 277.00
Proporción de asegurados
Proporción del ingreso dirigido a alimentos
De» = 18.78
Mean - 45.9
N = 270.00
Proporción del ingreso dirigido a aimentos
Proporción que tiene localizador
Std. Dev = .13
Me» = 0 4
N = 277.00
Proporción que teñe localizador
Proporción que tiene celular
Std D<v = .24
« m = 1 2
= 277.00
Proporción que tiene celular
Anexo 4
Centros de grupo
Variable 3G- 3G 3G+
La casa que habita es (rentada, prestada, propia)Tamaño terreno
Material del piso
AcabadosNúmero de pisos en la vivienda
Número de BañosNúmero de regaderasNúmero de tinasNúmero de habitacionesNúmero de personas por habitaciónNúmero de patiosNúmero de terrazasNúmero de autos cubiertosPintura del exteriorParque más cercanoCondiciones del parqueAlumbrado en calle
Número de inmuebles en posesiónNúmero de personas en el hogarEscolaridad del jefe de familiaEscolaridad de la madre de familiaRango de ingresos mensuales del jefe de familiaIngresos mensuales de la familiaNúmero de autos en el hogarAutosPorcentaje de aseguradosLugar de compra de ropaLugar de compra de zapatosPorcentaje del ingreso dirigido a alimentos
Porcentaje que tiene localizadorPorcentaje que tiene celularNúmero de veces que asiste a la estéticaNúmero de FocosAbanicos y Aires
U
4.291.41
2.492.75
1.35
1.311.070.014.511.240.990.190.19
1.552.143.272.58
0.044.895.301.71
2.112.470.330.950.044.30
4.4969.68
0.000.050.538.203.36
4.461.72
2.71
3.151.461.671.460.055.250.931.090.260.321.752.383.30
2.610.184.40
6.492.292.843.090.851.640.175.115.2537.34
0.040.10
0.6310.255.87
4.542.46
3.354.131.83
3.963.21
0.218.170.53
1.380.461.382.202.71
4.002.75
1.043.9610.614.005.79
6.052.542.55
0.537.547.54
28.86
0.170.501.08
36.4127.25
Variable 3G- 3G 3G+
Pago por recibo de aguaPago por recibo luz inviernoPago por recibo luz veranoPago por recibo gas inviernoPago por recibo gas verano
Líneas telefónicasNúmero de aparatos conectados y funcionandoNúmero de teléfonos inalámbricosBoilerTipo de RefrigeradorVideocaseteraJuegos de videoTelevisión por cableEmpleados domésticosPorcentaje de autos asegurados
Porcentaje de automóviles con seguro de dañosPorcentaje de autos con cobertura ampliaPorcentaje de pólizas de seguro de auto pagadas por la familiaPorcentaje de pólizas de auto pagadas por la empresaPorcentaje de personas aseguradas en el hogarTotal de pólizas en la familiaPorcentaje de pólizas de seguro pagadas por familiaresPorcentaje de pólizas de seguro pagadas por la empresa
Tabla A4.1 Centroides de nivel para tres grupos
4.304.564.44
3.52
3.420.631.350.20
0.462.910.360.280.160.01
0.110.11
0.330.440.000.040.30
0.070.25
4.624.914.974.29
4.050.781.52
0.330.713.290.600.400.190.08
0.350.14
0.500.610.020.110.880.250.22
6.176.947.196.07
5.801.383.57
1.171.094.171.210.580.920.600.930.17
0.550.710.010.511.940.600.09
VARIABLE 4 G -
1.40
2.48
2.721.34
1.281.050.004.491.250.990.160.161.56
2.123.252.58
0.044.90
5.151.692.102.460.330.970.044.27
4.4769.81
0.000.04
0.518.003.204.274.504.383.463.370.621.34
0.170.442.90
4G-
1.63
2.633.061.46
1.571.410.095.011.01
1.120.230.321.80
2.473.202.640.114.51
6.212.092.40
2.650.701.270.11
4.694.88
45.420.030.090.56
9.855.524.614.86
4.874.133.890.76
1.49
0.350.643.14
4G+
1.88
2.87
3.381.49
2.041.700.04
5.840.791.080.310.391.80
2.283.562.60
0.304.217.56
2.763.763.991.252.170.286.03
6.0624.580.060.160.80
12.477.73
4.725.195.314.664.390.871.78
0.440.873.57
4G++
2.67
3.50
4.201.934.203.400.208.470.49
1.400.601.73
1.822.873.872.73
1.333.8710.43
4.145.776.002.532.470.597.33
7.3335.38
0.150.551.05
43.0733.476.586.917.276.206.101.40
3.79
1.211.074.33
Tamaño terreno
Material del pisoAcabadosNúmero de pisos en la vivienda
Número de BañosNúmero de regaderasNúmero de tinasNúmero de habitacionesNúmero de personas por habitaciónNúmero de patios
Número de terrazasNúmero de autos cubiertosPintura del exterior
Parque más cercanoCondiciones del parqueAlumbrado en calle
Número de inmuebles en posesiónNúmero de personas en el hogarEscolaridad del jefe de familia
Escolaridad de la madre de familiaRango de ingresos mensuales del jefe de familiaIngresos mensuales de la familiaNúmero de autos en el hogarAutosPorcentaje de aseguradosLugar de compra de ropaLugar de compra de zapatosPorcentaje del ingreso dirigido a alimentosPorcentaje que tiene localizadorPorcentaje que tiene celularNúmero de veces que asiste a la estéticaNúmero de FocosAbanicos y AiresPago por recibo de agua
Pago por recibo luz inviernoPago por recibo luz veranoPago por recibo gas inviernoPago por recibo gas veranoLíneas telefónicas
Número de aparatos conectados y funcionandoNúmero de teléfonos inalámbricosCalentador de aguaTipo de Refrigerador
W
VARIABLE 4 G - 4G- 4G+ 4G++
Equipo de SonidoVideocaseteraJuegos de videoTelevisión por cableEmpleados domésticosPorcentaje de autos aseguradosPorcentaje de automóviles con seguro de dañosPorcentaje de autos con cobertura ampliaPorcentaje de pólizas de seguro de auto pagadas por la familiaPorcentaje de pólizas de auto pagadas por la empresaPorcentaje de personas aseguradas en el hogarTotal de pólizas en la familiaPorcentaje de pólizas de seguro pagadas por familiaresPorcentaje de pólizas de seguro pagadas por la empresa
Tabla A4.2 Centroides de nivel para cuatro grupos
2.340.340.290.14
0.01
0.100.000.380.380.000.040.300.070.25
2.630.510.410.19
0.07
0.280.270.430.700.000.070.470.130.30
3.130.79
0.420.30
0.140.530.070.530.550.040.211.190.340.16
3.731.270.47
0.930.73
0.920.190.60
0.790.000.552.360.740.02
X
5 Grupos
Variable
Tamaño terrenoMaterial del pisoAcabadosNúmero de pisos en la viviendaNúmero de BañosNúmero de regaderasNúmero de tinasNúmero de habitacionesNúmero de personas por habitaciónNúmero de patiosNúmero de terrazasNúmero de autos cubiertosPintura del exteriorParque más cercanoCondiciones del parqueAlumbrado en calleNúmero de inmuebles en posesiónNúmero de personas en el hogarEscolaridad del jefe de familiaEscolaridad de la madre de familiaRango de ingresos mensuales del jefe de familiaIngresos mensuales de la familiaNúmero de autos en el hogarAutosPorcentaje de aseguradosLugar de compra de ropaLugar de compra de zapatosPorcentaje del ingreso dirigido a aumentosPorcentaje que tiene localizadorPorcentaje que tiene celularNúmero de veces que asiste a la estéticaNúmero de FocosAbanicos y AiresPago por recibo de aguaPago por recibo luz inviernoPago por recibo luz veranoPago por recibo gas inviernoPago por recibo gas veranoLíneas telefónicasNúmero de aparatos conectados y funcionandoNúmero de teléfonos inalámbricosCalentador de aguaTipo de RefrigeradorEquipo de Sonido
5G- 5G- 5G 5G+ 5G++
1.402.482.721.341.281.050.004.491.250.990.160.161.562.123.252.580.044.905.151.692.102.460.330.970.044.274.4769.810.000.040.518.003.204.274.504.383.463.370.621.340.170.442.902.34
1.562.592.951.421.461.300.034.911.041.100.180.231.712.413.122.600.114.615.752.002.212.490.591.060.064.384.5845.380.030.070.539.003.614.584.784.824.033.810.711.350.260.583.092.57
1.882.863.311.481.991.670.045.700.811.070.320.371.792.293.582.600.264.267.362.643.673.891.182.260.295.976.0124.360.060.150.8012.117.014.665.145.304.604.310.861.730.400.863.563.08
2.273.044.171.742.872.430.266.730.581.270.431.222.392.743.702.780.393.619.823.484.784.891.912.150.406.967.0042.760.150.380.80
20.0923.575.475.955.795.415.181.172.550.911.093.833.35
2.883.864.132.134.753.880.389.630.471.500.881.751.312.883.752.752.134.1311.384.386.296.572.882.490.517.887.8828.570.080.471.29
54.2535.886.637.177.506.176.001.504.251.381.004.384.00
Variable 5G- 5G- 5G 5G+ 5G++
VideocaseteraJuegos de videoTelevisión por cableEmpleados domésticos
Porcentaje de autos asegurados
Porcentaje de automóviles con seguro de dañosPorcentaje de autos con cobertura ampliaPorcentaje de pólizas de seguro de auto pagadas por la familiaPorcentaje de pólizas de auto pagadas por la empresaPorcentaje de personas aseguradas en el hogarTotal de pólizas en la familiaPorcentaje de pólizas de seguro pagadas por familiaresPorcentaje de pólizas de seguro pagadas por la empresa
0.340.290.14
0.010.100.000.380.380.000.040.300.070.25
0.480.350.150.07
0.220.140.520.670.000.040.500.100.23
0.790.440.290.10
0.510.070.490.520.050.211.230.350.16
0.870.570.650.37
0.800.260.55
0.820.00
0.371.170.460.25
1.380.500.88
0.88
0.980.330.420.750.000.512.500.650.03
Tabla A4..3 Centroides de nivel para cinco grupos
(Ufó
ISt-
Ir
•
u
i*5Jlil12
1
i
1
y
f
11!
4 Grupo» en
Capa
li-
l i
* -
IiU
1u
s
1
»
T!
fe iS
se i« a
Crtpn.fe(5-; .
lt.
W
1l í
SISMni
•
i
Ü
a
\¡ú
ao
aren
S"
Sío
if~
8
teM
1
:a
33
i«
i
ui,'•:,
1
s
oeroi
•ce
t*JB«*
w
sfuitntlll
iaIH
i
1•
i
um i-m
tí*
Iltl
1
: : • •
uu
1*
,1:¡
II11
I H M í-ISK»
tupi
(fei>
t>
ti-
Iltl
1It
1 ,
)ía*:!íiÍ.1
1»
1
¡
||
s
Cttgu.
«
tt-
ÍS
wim no
1
íi
1i
©
it-
tt-
IiM
l
'#
11
i
1
13 W
' i 111
»
USUS
"i!
ÍW
1
1!;
1lt
btp
í>
ÍÍ.
(t-Titl
P
i,
ms?i!3t
•
i
1
(1
1»
t»*
« • •
Iltl
« 1
tfl 1'¿S •
r?i¡ S
«s :w it
D
f*JO
(íí-
«r
<¡-
ttIII
|
3:5
SÍ:
l'S
w
'«¡uto: [(ifar.t;
i
j
¡
!
11
CUJIE
fttt
it-
ft*•Iltl
"1mkíiii¡4
JeifKittb-
í
Uí
!t«
1U,1DIPK
1
i[¡
1
11)
foja
(St-
*
fi-
fi.Iltl
i
»
mID
í
1
I
J
1!
(tarómtt-
t¿
1£tó•il
Iltl IH
i
!
5
:t¡i
5 Grupos
Cat.so-so
5 0 -5G++g ¡'-; ,.total
%33.702B.4528.822 90
(1 00.00)
n3373t ÍJ
3
276
Material del pisoNivel crítico=0.0000, Chl-cuadrado=11 2.6982, gl=8
Areria;Cementoi
Loza o Mosaico
Cat.5G-5 O
5O-5G + +
Total
%40.8616.1343.010.000.0G
(33.70)
, n381 54000
9 3
Cat.5G-5G
50—5G*-*-
Total
%31 2131.7922.541 73
(62.68)
n545 5393
1 7 3
Madera ;Marmol;<perdido>i
Cat.5 0 -5 G
f.f;--
<.,;;-..Total
%1 0 0030.00o oo
50.00•• >:• i ; i . ¡
(3.62)
n13n51
10
N»
O*O
"O
a»
2.9O
90e
coCd
Número de BañosNivel crítico=0.0000, Chi-cuadrado=77.6B60, gl=1 2
Cat.SO-SO
5O*+
Total
i
%
40.0022.8632.880.00
(25.36)
n2816
0
70
TNúmero de terrazas
Nivel crítico=0.0025, Ch¡-cuadrado=1 4.281 4, gl=3
Cat.5Q-5<i
5 G -5O+*5O-*
Total
%31.3437.3122.390.00B 9€>
(24.28)
n212 51806
67
—I4;5;6
Cat.5O-5G
'ÍG—5G«*
Total
%22.7345.45•1 560.00
(7.97)
n5
1010
22
ISecadora de ropa
Nivel crítico=0.0341, Chi-cuadrado=8.6667, gl=3i
Cat.5O-5G
5 G -
Total
%0 00
28.570 00
21 43fíO.OO(5.07)
n040
71 4
Cat.5G-5 G
5 G -
Total
%45.9016.3934.43O.OC
(22.10)
n2810210
61
Cat.5G-5 G
5O-SG**5 O *
Total
%0.00
66.6?22 220 0 01 1 i :(3.26)
n0620)
9
1
Cat.5G-5Gse-so**
Total
%45.4545.450 000.009 09
(3.99)
n
500
11
Cat.5G-5G
5 G—SQ*+
Total
%0 00
45.459 090 0045 4'::(3 99)
n05
05
11
Referencias
Agresti, Alan (1990), CategoricalData Analysis, New York: John Wiley and Sons.
Assael, H. A., and A. M. Roscoe, Jr. (1976), "Approaches to Market Segmentatíon Analysis,'Jc»«mo/ ofMarketing, 40 (October), 67-76.
Bishop, Y. M.,Fienberg, S. E. and Holland, P. W. (1975), "Discrete Multivariate Analysis," Cambridge,Mass.: MIT Press.
Boltvinik, Julio (1994), Pobreza y Estratificación Social en México; INEGI, ECM, IIS-UNAM.
Cochran, William G. (1998),Sampling Techniques; Second Editíon. Harvard University: John Wiley andSons.
Cohén, J. And P. Cohén (Í975)+Applied Múltiple Regression / Correlation Analysis in the BehavióralSciences. New York: John Wiley & Sons, Inc.
Conover, W. J. (1971), Practical Nonparametric Statistics. New York: Wiley.
Cuadras, C.M., Rao, C.R (1993), Multivariate Analysis: future directions 2. Elsevier Science Publishers.
Doyle, P. and L Fenwick (1975), "The pitfalls of AID Analysis," Journal of Marketing Research, 12(November), 408-13.
Fisher, W. D. (1958), "On Grouping for Máximum Homogeneity,"JbMr«a/ of American Statistics Society,Vol. 53, 789-798.
Gillo, M.W. and M. W. SheUy (1974), "Predictíve Modeling of Multívariable and MultívariateData," Journal of the American StatisticalAssociation, 58 (June), 415-35.
Graybill, Franklin A. (1980), Theory and Application ofthe Linear Model, Colorado: Duxbury Press.
Hawkins, D, Dougias M. (1982), Topics in Applied Multivariate Analysis. Cambridge, New York:Cambridge University Press.
Hawkins, D. M. (1975a), "Significance Testing in Automatic Interaction Detection AID," Journal ofAmerican Statistical Association, Vol. 24, 178-189.
Johnson, Richard A. andWicbern, Dean W. (1992), Applied Multivariate Statistical Analysis, ThirdEditíon. New Jersey: Prentice Hall, Englewood Cliffs.
Jobnston J. (1963), Econometrics Methods. New York: McGraw Hill.
Kass, G. V. (1975), "Significance Testing in Automatic Interaction Detection AS) "Applied Statistics,Vol. 24, 178-189.
Kass, G. V. (1980), "An Exploratory Technique for Investígating Large Quantítíes of Categorical Data,"Applied Statistics, Vol. 29 No. 2,119-127.
CC
Kendall, M.G. and Stuart, A., (1961), The Advanced Theory ofStatistics, Vol. 2. London: GrifFm.
Krzanowsky W. J. (1980), "Mixtures of Continuous and Categorical Variables inDiscriminant Analysis,"Biometrics, 36 (September), 493-99.
MacLachlan, Douglas L., Johansson Johny K. (1981), "Maiket Segmentation wifli Multivariate AID,"Journal ofMarketing, (Winter), 75-84.
Magidson, Jay (1982), "Some Common Pitfalls in Causal Analysis of Categorical Data," Journal ofMarketing Research, (November), 461-71.
Magidson, Jay (1992), "Chi-squared analysis of a scalable dependent variable," Proceedings ofthe 1992Annual Meeting ofthe American Statistical Association, Educactional Statistics Section.
Manly, Brian F. J. (1995), Multivariate Statistical Methods, A primer, New Zeland. Chapman & Hall.
Messenger, R. C. andMandell, L. M. (1972), "A Modal Search Technique for Predictíve Nominal ScaleDependent Variables," Journal of American Statistical Association, Vol. 67, 768-772.
Morgan, J. A. and Messenger, R. C. (1973), "THAID - a Sequential Analysis Program for the Analysis ofNominal Scale Dependent Variables," Survey Research Centre, Institute for Social Research, University ofMichigan.
Perreault, William D. and Hiram C. Barksdales. (1980), "A Model-Free Approach for Analysis ofComplex Contingency Data in Survey Research" Journal ofMarketing Research, Vol. XVII, (November1980),503-15.
Sonquist, James N., (1970), Multivariate Model Building, Michigan: Institute for Social Research,University of Michigan.
Sonquist, James N., Elizabeth L. Baker, and James N. Morgan (\91\),Searching for Structure, AnnArbors Survey Research Center, University of Michigan.
Sonquist, James N. and Morgan, J. A. (1964),77ie Detection of Interaction Effects, Monograph No. 35.Survey Research Centre, Institute for Social Research, University of Michigan.
Trejo, Guillermo, y Jones, Claudio (1992), Contra la Pobreza: Por una Estategia de Política Social, Caly Arena México.
DD
top related