1
FEDERACION DE COLEGIOS DE VALUADORES, A.C. LII CONGRESO NACIONAL DE VALUACIÓN
“Retos y Oportunidades"
Con el lema:
Revalorando México
Ponencia:
Análisis Cualitativo Aplicado al Proceso de Investigación de Mercado inmobiliario y
estimación del valor por Métodos Multivariados.
Por:
Oscar Pérez Veyna1 1Programa de Doctorado en Estudios del Desarrollo
Edificio de la Unidad Académica en Estudios del Desarrollo Av. Preparatoria s/n Col. Hidráulica Zacatecas, Zac. C.P. 98064 e.mail: [email protected]
email2:[email protected] Phone: 52 (492) 9256690 ext 3515
Hermosillo Sonora. junio de 2016
2
INDICE
1 INTRODUCCIÓN ......................................................................................... 3
1.1 Objetivo general: ................................................................................... 4
2 MATERIALES Y MÉTODOS ........................................................................ 4
2.1 Área de Estudio ..................................................................................... 4
2.2 Investigación de Mercado...................................................................... 5
2.2.1 Enfoque cualitativo ............................................................................ 5
2.2.2 Entrevista en profundidad ................................................................. 5
2.2.3 Grupos focales .................................................................................. 6
2.2.4 Selección de la muestra .................................................................... 6
2.2.5 Análisis cuantitativo ........................................................................... 7
3 RESULTADOS Y DISCUSIÓN .................................................................... 9
3.1 Análisis cualitativo ................................................................................. 9
3.1.1 Entrevistas en profundidad ............................................................... 9
3.1.2 Grupos focales ................................................................................ 10
3.2 Análisis estadístico .............................................................................. 10
3.2.1 Tamaño de la muestra. ................................................................... 10
3.2.2 Análisis de Grupos (Cluster) ........................................................... 11
3.2.3 Componentes Principales (ACP). .................................................... 12
3.2.4 Estimación de valor ......................................................................... 16
4 CONCLUSIONES Y RECOMENDACIONES ............................................. 22
5 Referencias ................................................................................................ 24
3
1 INTRODUCCIÓN
La estimación del valor de los bienes raíces mediante modelos es un tema
ampliamente tratado en la literatura económica. Appraisal, I. (2002). En la práctica
valorativa, existe una dificultad de estimar el valor de mercado de un bien raíz, debido a
la falta de transparencia del mismo y a la escasez de transacciones inmobiliarias. La
determinación del valor de los inmuebles mediante métodos científicos es, todavía hoy,
una asignatura pendiente para todos aquellos que necesitan conocerlo, (Guadalajara,
2002). Por añadido, la heterogeneidad de los inmuebles plantea una problemática
especial en lo relativo a su valuación. Así, tanto Guijarro (2013) como Pérez et al. (2003),
indican que una serie de factores influyen y a veces distorsionan el conocimiento que
pueda tenerse de un bien raíz en una zona determinada.
El estudio de los factores que contribuyen a la formación de valor de los
inmuebles, como los físicos: ubicación, superficie, servicios, equipamiento urbano, y sus
interrelaciones; económicos: disponibilidad de capital, programas de desarrollo, crédito,
distribución de la tenencia de la tierra, social: grupos y organizaciones sociales; y
políticos: conflictos sociales, invasiones, entre otros, representa un problema mayúsculo.
No por ello, deben dejarse de lado desde una perspectiva de nuevos y más eficientes
métodos en valuación. El determinar si alguna variable es o no significativa en términos
de la estimación del valor es una tarea compleja, y si sabemos que una misma variable
tiene diferente respuesta según la ubicación del sujeto que se trate, la estimación
buscada deberá considerar el uso de herramientas que faciliten la tarea de una
ponderación dinámica del peso relativo de las variables independientes sobre el valor.
Al utilizar la metodología aplicada en la Investigación de Mercados para obtener
el valor percibido por el mercado de las variables que caracterizan el valor de los
inmuebles utilizadas en la valuación por el método del enfoque de mercado y aplicando
métodos estadísticos multivariantes se podrá llegar a resultados de valor más
consistentes de acuerdo al mercado inmobiliario.
Por lo anterior, se plantean los siguientes:
4
1.1 Objetivo general:
Aplicación del análisis cualitativo en el proceso de la investigación de mercados
y estimar el valor con técnicas de valuación de naturaleza multivariada, como alternativa
para analizar la similitud de muestras de inmuebles en la selección de comparables y
estimación de valor en el enfoque de mercado en la valuación de inmuebles.
Como objetivos particulares:
a) Identificar las variables independientes relevantes de las muestras del mercado
para caracterizar los comparables y sujeto a valuar.
b) Proponer las escalas de medición apropiadas en variables para el análisis
estadístico de comparables de mercado.
2 MATERIALES Y MÉTODOS
2.1 Área de Estudio
El área de estudio donde se desarrolló el presente estudio fue la ciudad de
Santiago de Querétaro, la cual se ubica en el centro de México, en la región del Bajío del
país.
Figura 2 Localización geográfica del Municipio de Querétaro, Fuente: INEGI
5
2.2 Investigación de Mercado.
2.2.1 Enfoque cualitativo
Los métodos de investigación cualitativa son importantes cuando hay necesidad
de establecer los requisitos de la información, cuando interesan las ideas preliminares
sobre factores de motivación, emocionales, de actitudes y personalidad que influyen en
las conductas en un mercado. También resultan determinantes cuando se trata de
elaborar escalas de medición confiables y válidas para investigar factores específicos del
mercado y cualidades de los consumidores (actitudes, sentimientos, percepciones y
convicciones) así como resultados conductuales. El estudio se basa en grupos focales y
entrevistas individuales en profundidad con el fin de investigar si las personas le dan
sentido a las variables relevantes que intervienen en el valor de un bien inmueble.
La propuesta de llevar a cabo dos técnicas cualitativas, entrevista en profundidad
y grupos focales, surge de la necesidad de contar con elementos que den cuenta de la
influencia de los factores contextuales en las respuestas a las preguntas en el
cuestionario definitivo. Adicionalmente se pretende construir un escenario común, que
será crucial, con el fin de establecer un entendimiento mutuo entre el entrevistado y el
entrevistador, y así generar una conversación significativa.
Un punto adicional de la inserción de estas dos técnicas cualitativas es dar a los
participantes un cierto grado de libertad en la interpretación y la asignación de un
significado al escenario de valoración. En esta fase se espera descubrir e identificar
ideas, pensamientos, sentimientos, conocimientos preliminares y comprensión de ideas
y objetos relacionados con las variables que dan el valor a un bien inmueble. El enfoque
cualitativo –previo al cuantitativo- proporcionará un medio para analizar lo que hay detrás
de respuestas de la gente a las preguntas de la encuesta y qué significado atribuyen a
los diferentes temas sobre el valor de los bienes inmuebles.
2.2.2 Entrevista en profundidad
Es un proceso formal en el que un entrevistador capacitado formula al sujeto
entrevistado preguntas semi-estructuradas en un encuentro personal. La entrevista
6
permitirá reunir datos de actitudes y conductas del entrevistado que comprendan el
pasado, presente y futuro de la valuación en Querétaro. Una característica de esta técnica
es que a partir de preguntas de sondeo, el entrevistador busca obtener información
adicional sobre el tema. Al tomar la primera respuesta del entrevistado y transformarla en
pregunta, se busca con ello incitar a que abunde más sobre ella y abre oportunidades
espontáneas para detenerse más en el tema. La regla es que cuanto más hable el
entrevistado, más posibilidad se tiene para que revele actitudes, motivos y conductas.
Dos condiciones son necesarias para una entrevista en profundidad.
i). Capacidad de comunicación personal, esto es, facultad del entrevistador para
articular preguntas de manera directa y clara.
ii). Capacidad para saber escuchar, es decir, facultad del entrevistador para interpretar y
tomar nota con fidelidad de las respuestas del entrevistado.
2.2.3 Grupos focales
Se refiere a un proceso formalizado que consiste en reunir un grupo pequeño de personas
para una discusión libre, espontánea e interactiva sobre un tema. Son grupos de no más
de doce personas guiadas por uno o dos moderadores de la discusión no estructurada.
Al hacer que el grupo se extienda en la discusión sobre un tema, el moderador podrá
conseguir tantas ideas, actitudes, sentimientos y experiencias como pueda.
La técnica de Grupos focales permitirá saber cómo los encuestados están
utilizando la información, si la entienden y cómo la entienden, si la creen o no y si la
valoración que hagan de los bienes y servicios se basa en los cambios reales del objeto
de la valoración (bienes y servicios).
2.2.4 Selección de la muestra
A diferencia de la investigación cuantitativa que hace hincapié en la re-
presentatividad de la muestra, para poder generalizar los resultados, la investigación
cualitativa acentúa la pertinencia de la muestra a los objetivos de la investigación. No
importa el tamaño de la muestra, sino la riqueza en la información que se busca. El
7
tamaño de la muestra no se calcula, sino que, idealmente, cumple con el principio de
saturación (cuando los datos se vuelven redundantes).
Por muestra en la investigación basada en las sesiones de grupos entendemos
cuántos y qué tipos de grupos se van a convocar (con impacto en el número de éstos), y
no el número de participantes en el interior de los grupos.
El criterio de selección de la muestra es de comprensión o pertinencia (no de
extensión y representatividad como sucede en el muestreo estadístico), ya que se busca
generar grupos donde mediante los discursos de sus miembros se reproduzcan
relaciones relevantes para los objetivos del proyecto de investigación.
En la composición de los grupos son importantes tanto las variables cuantitativas
(NSE, nivel educativo y edad) como las variables cualitativas (características de los
participantes relevantes para los objetivos de estudio).
En este caso se seleccionaron dos perfiles diferentes para poder tener una
percepción de personas que estén involucrados con las variables que caracterizan el
valor de los bienes inmuebles.
Perfil 1. Valuadores que actualmente se dediquen a la valuación con una
experiencia en la valuación de al menos tres años.
Perfil 2. Agentes inmobiliarios con experiencia de al menos tres años en el ramo
inmobiliario.
2.2.5 Análisis cuantitativo
Existen muchas alternativas metodológicas para el estudio de mercado, ya que, las
empresas requieren información sobre la eficiencia de sus instrumentos de
mercadotecnia, los directivos necesitan información para tomar decisiones oportunas. No
obstante, se requieren con frecuencia estudios formales sobre situaciones específicas.
Para tal efecto, la investigación de mercado es un proceso que identifica y define las
oportunidades y problemas del mercado, vigila y evalúa las acciones y el rendimiento del
8
mercado y comunica a la dirección los hallazgos o las implicaciones Kotler, (1997). Fig.
2
Entre sus actividades más comunes, según la apreciación del citado autor, están
la medición de los potenciales del mercado, el análisis de la participación en el mercado,
la determinación de las características del mercado, el análisis de ventas, los estudios de
las tendencias de negocios, el pronóstico de largo alcance, los estudios de productos
competitivos, los estudios de sistemas de información y la evaluación de los productos
existentes. Malhorta, N. K. (2008).
Fig. 2. Estructura metodológica de un estudio de mercaado
2.2.5.1 Métodos multivariados
Para fines de ilustrar la bondad de los métodos estadísticos en la valuación, se ha
considerado importante partir de un ejemplo que permita al lector encontrar la justificación
de la explicación previa, al mismo tiempo que abrir su percepción sobre la forma de
abordar tan compleja situación, misma que a todas luces demanda atención y por tanto
dar alternativas que vayan dejando atrás prácticas que si bien han dado cabida a la
imaginación y el empirismo, hoy son demandantes de fundamento metodológico.
Cuadras, C. (2007). Se propone en primera instancia el tratamiento de la información por
el Análisis de Componentes Principales (ACP). Este método permite determinar las
variables relevantes en la estimación del valor y en el estudio que se presenta, se hace
9
evidente que dada la heterogeneidad de las condiciones climáticas y edáficas de nuestro
país, el (ACP) parece ser una técnica adecuada para reducir la dimensión analítica del
fenómeno y preparar la información de mercado para posteriormente realizar otros
análisis estadísticos subsecuentes.
Una vez reducida la información, se sugiere aplicar el (AC) análisis cluster o análisis de
grupos, con el cual se pretende reducir la subjetividad al momento de seleccionar los
comparables, ya que se utiliza la información de las variables que han sido compactadas
por el ACP en las llamadas Componentes Principales (CP) para cada comparable y,
conforme a estas CP se calculan diferentes medidas de distancia y similitud entre los
comparables. Es importante mantener en mente que el uso de comparables (ventas
realizadas que son muy parecidas al sujeto a valuar) es fundamental en el enfoque de
mercado. Una vez medida la distancia y/o similitud se lleva a cabo la ordenación en
grupos homogéneos internamente y diferentes entre sí. Esto es, el AC, es una técnica
mutlivariante que se aplica en este caso de manera secuenciada con respecto al ACP,
con el fin de formar grupos de comparables que sean lo más homogéneo posible intra
grupo y lo más heterogéneo entre grupos. Lo más interesante resulta ser el subgrupo que
se identifique en el cual se ubique al sujeto a valuar. Una técnica más en esta propuesta
es la aplicación de la Regresión Lineal Múltiple (RLM) y obtener el modelo Regresión
Lineal Múltiple por Componentes Principales, a partir del cual se obtendrá la estimación
del valor del predio a valuar.(Flores-Lázaro y Pérez-Veyna, 2007)
3 RESULTADOS Y DISCUSIÓN
3.1 Análisis cualitativo
3.1.1 Entrevistas en profundidad
Se realizaron cuatro entrevistas a profundidad a valuadores expertos en el tema,
con más de 15 años de experiencia. Se detectaron dos tendencias, una muy
conservadora en donde no se visualizan cambios en las metodologías, y si se ven se
considera que no deben cambiar la forma en que se hacen los avalúos. Sin embargo, las
nuevas generaciones perciben cambios. Cambios en el crecimiento de las ciudades, en
10
las nuevas formas de comercializar y promover los bienes inmuebles y en las variables
que caracterizan el valor de los inmuebles.
Se nota un deseo de dejar atrás la subjetividad en los avalúos y aplicar los nuevos
métodos estadísticos, que aunque no eliminan la experiencia del valuador, su aplicación
haría más homogéneo y sustentado el avalúo. Se nota apertura a experimentar lo que se
está haciendo en otros países más avanzados en este campo que el nuestro. También
se percibe más apertura a conocer la opinión de otros actores involucrados con el valor
de los bienes inmuebles, como pueden ser los agentes inmobiliarios, que pueden
enriquecer nuestro trabajo.
Como una nota importante, solo se realizaron cuatro entrevistas ya que no hubo
disposición de los valuadores a colaborar en este tema.
3.1.2 Grupos focales
Se realizaron dos grupos focales considerando como analistas principales en los
estudios de mercado inmobiliario, valuadores profesionales y agentes inmobiliarios, tanto
del sector profesional independiente como de instituciones bancarias, los resultados
obtenidos fueron en principio la preocupación de que no existe investigación formal al
respecto, es diferenciado el criterio de aplicación de las variables y escalas de medición
para caracterizar los inmuebles.
3.2 Análisis estadístico
3.2.1 Tamaño de la muestra.
La muestra se obtuvo de cuarenta y ocho propiedades en venta en la ciudad de
Santiago de Querétaro, Qro., durante el año del 2015. El tipo de vivienda al cual fue
enfocada la investigación es del tipo Residencial. Teniendo en cuenta el radio de
observaciones recomendado por Hair (1995) para no afectar la potencia de la regresión
ni la R² se optó por tomar el tamaño de la muestra de cuarenta y ocho observaciones por
variable del bien inmueble, así no se infringe la relación de menos de cinco observaciones
por variable ni más de mil, teniendo así un tamaño adecuado de la muestra.
11
3.2.2 Análisis de Grupos (Cluster)
Se procede a identificar dentro de los cuarenta y ocho comparables los elementos
más similares al sujeto, para ello se realizan el análisis de grupos utilizando las variables
de nuestro archivo. Es pertinente considerar que el Análisis de Componentes (AC) ofrece
una buena cantidad de métodos para calcular distancia entre individuos, objetos o cosas.
De manera análoga también el AC presenta una serie de métodos de aglomeración (esto
es, como se van uniendo los sujetos para formar los grupos). Para el caso, se ilustran los
resultados que arroja el AC cuando se aplicó la distancia euclidiana al cuadrado y el
método de aglomeración de Ward´s. Esta selección o particular combinación tiene un
fundamento, el método de Ward´s asegura que por encima de los demás métodos de que
dispone el AC, éste ayuda a controlar la variabilidad intra grupo, esto asegura mayor
estabilidad del grupo que se forme. Los resultados se muestran a continuación y
consisten en la salida que ofrece el paquete estadístico Statgraphics /Windows XP®.
Figura 3-1 Dendograma obtenido al realizar un análisis de grupos con las puntuaciones de las variables
Fuente: Elaboración propia.
12
La expresión gráfica del análisis, arroja 4 grupos bien definidos, agrupando a los
comparables:
Sujeto, 3, 1, 2, 5, 45, 10, 15, 4, 12 y 11, observando un grupo compacto.
También se podrá observar que los comparables son de Jurica, Juriquilla y San Isidro,
zonas en donde se encuentra el sujeto con excepción de San Isidro.
A partir de este resultado se eliminan los demás componentes y se trabaja solo
con los antes indicados.
3.2.3 Componentes Principales (ACP).
3.2.3.1 Identificación de las variables relevantes utilizando el Análisis de Componentes
Principales
Se seleccionan de la base de datos el Sujeto y diez comparables y se analizan
con las siguientes treinta y ocho variables para realizar el Análisis de Componentes
Principales:
Utilizando el programa STATGRAPHICS® se realiza el cálculo de las
Componentes Principales aplicando todas las variables teniendo el siguiente resultado:
Analysis Summary Data variables:
obtienen los resultados de la Tabla 4-2.
Analysis Summary Data variables:
Data input: observations Number of complete cases: 11 Missing value treatment: listwise Standardized: yes Number of components extracted: 7
13
Tabla 4-1 Análisis de Componentes Principales
Análisis de Componentes Principales ---------------------------------------------------------------------------------- Número de Porcentaje de Porcentaje Componente Eigenvalue Varianza Acumulado 1 5.0099 27.833 27.833 2 4.07331 22.629 50.462 3 3.37038 18.724 69.187 4 1.54473 8.582 77.768 5 1.30189 7.233 85.001 6 1.09208 6.067 91.068 7 1.0 5.556 96.624 8 0.270579 1.503 98.127 9 0.21286 1.183 99.310 10 0.0897287 0.498 99.808 11 0.0345509 0.192 100.000 12 4.2937E-16 0.000 100.000 13 1.83949E-16 0.000 100.000 14 9.24271E-17 0.000 100.000 15 0.0 0.000 100.000 16 0.0 0.000 100.000 17 0.0 0.000 100.000 18 0.0 0.000 100.000
Fuente: Elaboración propia.
Para este caso, a la primera componente le corresponde el valor propio de
5.0099, lo que corresponde al 27.833% de la varianza total. Esto indica que si las
variables han sido estandarizadas en virtud de su naturaleza diferentes, entonces su
varianza será la unidad, por tanto, la Componente 1, ha sido capaz de concentrar la
información de poco más de cinco variables. De la tabla 4-2, se observa que con las cinco
primeras Componentes Principales se explica el 85.001% de la variabilidad presente en
las variables originales. Esto es, se reduce la dimensión del problema de manejar 18
variables a manejar 5 Componentes Principales.
El costo es perder un 14.999% de la variabilidad en la información original. Esta
es una decisión importante pues las cinco primeras componentes son capaces de
explicar la variabilidad de al menos cinco variables cada una de ellas (CP1, CP 2, CP3,
CP 4 y CP5). La sexta y séptima componentes arrojaron un valor característico igual a la
unidad por tanto son unas componentes que no explica la variabilidad presente en una
14
variable, esto no ayuda a sintetizar la información, por ello el criterio de selección se toma
como aquel eigenvalor o valor característico mayor o igual que uno.
Tabla 4-2 Peso de las Componentes Principales
Componente Componente Componente Componente Componente 1 2 3 4 5 --------------- ---------------- ---------------- --------------- --------------- S C -0.0976693 0.426317 0.144853 0.153797 -0.219873 S T 0.249277 0.303701 0.238865 -0.178765 -0.210523 Edad 0.205685 -0.0461421 0.405385 0.0375812 -0.0566806 E I 0.0767888 0.243254 0.0235889 0.195648 -0.268802 N H -0.225123 0.332718 0.195195 0.158088 -0.0262311 N B -0.027938 0.407311 0.186944 0.322363 0.067539 C M 0.216359 0.266438 -0.255781 0.0426993 0.134836 C S -0.284436 -0.172487 0.0024836 0.505294 0.226672 N S -7.51313E-14 3.4339E-15 -1.03627E-13 4.53916E-14 1.63633E-13 Seg 0.317943 -0.291674 -0.0590097 0.062706 -0.160521 D C I -0.376394 0.0774765 0.0302033 -0.386716 0.04408 P F L -0.368498 0.175361 -0.00887277 -0.151182 0.251062 T P 0.337181 0.118799 -0.212355 0.240069 0.286889 D A V -0.214577 -0.220203 0.277234 -0.0939984 -0.467434 P A 0.00796982 -0.166859 0.443848 0.0879342 0.329131 F E 0.00796982 -0.166859 0.443848 0.0879342 0.329131 UTME 0.184292 0.217331 0.110816 -0.50876 0.382529 UTMN -0.358563 0.00520001 -0.293052 0.0391888 0.0503349
Fuente: Elaboración propia.
La tabla 4-3 muestra las ecuaciones de los principales componentes. Por
ejemplo, el primer componente principal tiene la ecuación:
- 0.0976693*S C + 0.249277*S T + 0.205685*Edad + 0.0767888*E I - 0.225123*N H - 0.027938*N B + 0.216359*C M - 0.284436*C S - 7.51313E-14*N S + 0.317943*Seg - 0.376394*D C I - 0.368498*P F L + 0.337181*T P - 0.214577*D A V + 0.00796982*P A + 0.00796982*F E + 0.184292*UTME - 0.358563*UTMN
Donde los valores de las variables en la ecuación son estandarizados por la resta
de sus medias y dividiéndolas por sus desviaciones estándar.
Cada componente generada es ortogonal al resto, por ello, es muy importante
reconocer cuales variables se correlacionan más con cada una de las componentes, esto
se determina por la magnitud del valor o peso de la variable en cada componente. Se
trata de ubicar los valores más altos por cada variable. Del cuadro anterior, se observa
que las variables que resultan en un porcentaje más alto, mayor es el peso que posee la
combinación lineal de los primeros cinco componentes.
15
La primera componente explica el 27.833% de la varianza total, las variables con
los valores positivos más grandes son: superficie terreno, calidad de los materiales,
seguridad, transporte público y UTME.
La segunda componente explica el 22.629% de la varianza total, las variables
con los valores positivos más grandes son: superficie construida, superficie terreno,
número de habitaciones, número de baños y calidad de los materiales.
La tercera componente explica el 18.724% de la varianza total, las variables con
los valores positivos más grandes son: edad, proyecto arquitectónico, fachada exterior,
distancia a áreas verdes y superficie de terreno.
La cuarta componente explica el 8.582% de la varianza total, las variables con
los valores positivos más grandes son: número de baños, cuarto de servicio, transporte
público, superficie construida y equipamiento interior.
La quinta componente explica el 7.233% de la varianza total, las variables con
los valores positivos más grandes son: UTME, proyecto arquitectónico, fachada exterior,
transporte público y proximidad a fuentes laborables.
Tabla 4-3 Componentes Principales
Componente Componente Componente Component e Component e Fila Etiqueta 1 2 3 4 5 ------ --------------- ------------------ ----------------- ---------------- ----------------- ---------------- 1 Sujeto 1.94272 -1.85893 0.507756 0.967424 1.10413 2 C 01 1.89894 -3.9357 -0.083579 0.0890827 0.602431 3 C 02 3.59857 0.245122 -1.35317 -0.604057 -2.6827 4 C 03 0.627461 2.4129 1.3065 2.08482 -0.0500373 5 C 04 -2.38259 0.211163 2.0001 -0.425665 -0.958133 6 C 05 0.330806 0.528299 1.24253 1.29865 0.225437 7 C 10 -1.08678 1.00315 -2.67244 0.270427 0.500237 8 C 11 -2.63069 -2.49432 -0.206007 -1.12538 -0.0909313 9 C 12 -2.87715 0.0228407 1.54903 -0.181154 -0.695536 10 C 15 -1.5871 1.26847 -3.61003 0.179234 0.556142 11 C 45 2.16581 2.597 1.31931 -2.55339 1.48896
Fuente: Elaboración propia.
La tabla 4-4 muestra los valores de los componentes principales para cada fila
del archivo de datos.
16
3.2.4 Estimación de valor
Una vez que se obtienen y analizan las componentes resultantes en nuestro
análisis, se procede a realizar el análisis de regresión múltiple por componentes
principales para obtener el valor de la variable Precio para el Sujeto. Procedemos a
realizar el análisis estadístico utilizando la opción Relate; Múltiple Regression, del
software Statgraphics V.5.1®, los resultados de la salida nos indica que existen algunos
componentes que no son significativos por lo que se procede a eliminarlos y se realiza el
cálculo con las siguientes características:
Tabla 4-4 Análisis de Regresión Múltiple
----------------------------------------------------------------------------------------------------------- Variable dependiente: Valor ----------------------------------------------------------------------------------------------------------- Error Estadístico Parametro Estimado Estandar T P-Value ----------------------------------------------------------------------------------------------------------- CONSTANT 15.2973 0.0784641 194.96000 0.0000 PCOMP_1 0.0695784 0.0363418 1.91456 0.1281 PCOMP_2 0.13899 0.0405919 3.42407 0.0267 PCOMP_3 0.0971259 0.0419831 2.31345 0.0817 PCOMP_4 0.0303912 0.0647152 0.46961 0.6631 PCOMP_5 -0.166338 0.0722695 -2.30164 0.0828
Fuente: Elaboración propia.
Tabla 4-5 Análisis de Varianza
--------------------------------------------------------------------------------------------------------- Source Sum of Squares Df Mean Square F-Ratio P-Value --------------------------------------------------------------------------------------------------------- Model 1.66459 5 0.332918 5.68 0.0587 Residual 0.234566 4 0.0586416 --------------------------------------------------------------------------------------------------------- Total (Corr.) 1.89916 9 R-squared = 87.6489 percent R-squared (adjusted for d.f.) = 72.2101 percent Standard Error of Est. = 0.24216 Mean absolute error = 0.10871 Durbin-Watson statistic = 1.94911 (P=0.3045) Lag 1 residual autocorrelation = 0.0201507
Fuente: Elaboración propia.
17
Para determinar dónde puede ser simplificado el modelo, note que el valor más
alto de P-value en las variables dependientes es 0.6631, que pertenece al componente
PCOMP_4. Ya que este valor es mayor o igual a 0.10, este término no es
estadísticamente significativo al nivel de confidencia de 90% o mayor.
Consecuentemente, se deberá considerar remover este componente del modelo.
Se remueve el componente PCOMP_4 y se repite el análisis de regresión sin
este componente, llegando al siguiente resultado:
Tabla 4-6 Análisis de Regresión Múltiple, segunda corrida
------------------------------------------------------------------------------------------------------------ Dependent variable: Valor ------------------------------------------------------------------------------------------------------------ Standard T Parameter Estimate Error Statistic P-Value ------------------------------------------------------------------------------------------------------------ CONSTANT 15.2932 0.0716355 213.486 0.0000 PCOMP_1 0.067818 0.033211 2.04203 0.0966 PCOMP_2 0.141062 0.037073 3.80496 0.0126 PCOMP_3 0.096442 0.0385489 2.50181 0.0544 PCOMP_5 -0.170188 0.0659692 -2.57981 0.0494
Fuente: Elaboración propia.
Tabla 4-7 Análisis de Varianza, segunda corrida
-------------------------------------------------------------------------------------------------------------------- Source Sum of Squares Df Mean Square F-Ratio P-Value -------------------------------------------------------------------------------------------------------------------- Model 1.65166 4 0.412915 8.34 0.0195 Residual 0.247499 5 0.0494998 -------------------------------------------------------------------------------------------------------------------- Total (Corr.) 1.89916 9 R-squared = 86.968 percent R-squared (adjusted for d.f.) = 76.5423 percent Standard Error of Est. = 0.222485 Mean absolute error = 0.115283 Durbin-Watson statistic = 1.66762 (P=0.1746) Lag 1 residual autocorrelation = 0.148695
Fuente: Elaboración propia.
La salida muestra el resultado de ajustar un modelo de regresión lineal múltiple
que describa la relación entre la variable Valor y cuatro variables independientes. La
ecuación del modelo ajustado es:
18
Valor = 15.2932 + 0.067818*PCOMP_1 + 0.141062*PCOMP_2 +
0.096442*PCOMP_3 - 0.170188*PCOMP_5
Como el P-value en la tabla ANOVA es menor a 0.05, hay una relación
estadísticamente significativa entre las variables al 95% de nivel de confidencia.
El estadístico R-Squared indica que el modelo ajustado explica el 86.968% de la
variabilidad en la variable Valor. El estadístico R-Squared adjusted, el cual es más
adecuado para comparar modelos con diferentes números de variables independientes,
es 76.5423%. El error estándar de la estimación muestra la desviación estándar de los
residuales como 0.222485. Este valor puede ser usado para construir límites de
predicción para nuevas observaciones. El error medio absoluto (MAE) de 0.115283 es el
valor promedio de los residuales. El estadístico Durbin-Watson (DW) prueba los
residuales para determinar si hay alguna correlación significativa basada en el orden en
el cual ocurren en el archivo de datos. Como el P-value es mayor que 0.05, no hay
indicación de una auto - correlación seria en los residuales.
No se presentan valores residuales estudentizados ni puntos extremos y la
estimación del valor que arroja el modelo es:
Tabla 4-8 Resultados del análisis de regresión para la variable Valor
------------------------------------------------------------------------------------------------------------------------------------------- Fitted Stnd. Error Lower 95.0% CL Upper 95.0% CL Lower 95.0% CL Upper 95.0% CL Row Value for Forecast for Forecast for Forecast for Mean for Mean ------------------------------------------------------------------------------------------------------------------------------------------- 1 15.0238 0.276464 14.3131 15.7345 14.6019 15.4457
Fuente: Elaboración propia.
Aplicando antilogaritmo para obtener la variable Valor en pesos con la
calculadora HP 12c función antilogaritmo se obtiene los siguientes valores:
------------------------------------------------------------------------------------------------------------------------------------------ Fitted Stnd. Error Lower 95.0% CL Upper 95.0% CL Lower 95.0% CL Upper 95.0% CL Row Value for Forecast for Forecast for Forecast for Mean for Mean ------------------------------------------------------------------------------------------------------------------------------------------ 1 3,347,753 1.3185 1,644,751 6,814,068 2,195,455 5,104,841 ------------------------------------------------------------------------------------------------------------------------------------------
19
Esta tabla contiene información de la variable Valor generada usando el modelo
ajustado. La tabla incluye:
El valor estimado de la variable Valor usando el modelo ajustado.
El error estándar para cada valor predictivo.
95.0% de los límites de predicción para nuevas observaciones.
95.0% de los límites de confidencia para la respuesta media.
Cada número corresponde a los valores de las variables independientes en una
fila específica del archivo de datos. Para generar pronósticos para combinaciones
adicionales de variables, añadir filas a la última línea de datos del archivo. En cada nueva
fila, capturar los valores para las variables independientes pero dejar la celda de la
variable dependiente vacía. Cuando se retorna a este panel, los pronósticos serán
añadidos a la tabla para las nuevas filas, pero el modelo permanecerá sin afectarse.
Sacando el antilogaritmo de estos valores obtenemos los siguientes resultados:
Valor del sujeto $ 3,347,753.00
Error estándar 1.318
Una vez obtenido el Modelo, se procede a la evaluación del Modelo, como se
describe a continuación:
Tabla 4-9 Tabla de ANOVA para las variables seleccionadas
-------------------------------------------------------------------------------------------------------------- Source Sum of Squares Df Mean Square F-Ratio P-Value -------------------------------------------------------------------------------------------------------------- PCOMP_1 0.343598 1 0.343598 6.94 0.0463 PCOMP_2 0.643278 1 0.643278 13.00 0.0155 PCOMP_3 0.33534 1 0.33534 6.77 0.0481 PCOMP_5 0.329443 1 0.329443 6.66 0.0494 -------------------------------------------------------------------------------------------------------------- Model 1.65166 4
Fuente: Elaboración propia.
20
Esta tabla muestra la significancia estadística de cada variable como fue añadida
al modelo. Se puede usar esta tabla para ayudar a determinar que tanto el modelo podría
ser simplificado, especialmente si se está ajustando un polinomio.
Tabla 4-10 Intervalos de confianza al 95% para los coeficientes estimados
------------------------------------------------------------------------------------------------------------------ Standard Parameter Estimate Error Lower Limit Upper Limit ------------------------------------------------------------------------------------------------------------------ CONSTANT 15.2932 0.0716355 15.1091 15.4774 PCOMP_1 0.067818 0.033211 -0.0175539 0.15319 PCOMP_2 0.141062 0.037073 0.045762 0.236361 PCOMP_3 0.096442 0.0385489 -0.00265135 0.195535 PCOMP_5 -0.170188 0.0659692 -0.339768 -0.000608552
Fuente: Elaboración propia.
Esta tabla muestra los intervalos de confianza de 95.0% en el modelo. Los
intervalos de confianza muestran que tan preciso pueden ser estimados los coeficientes
dados la cantidad de datos disponibles y el ruido que está presente.
Tabla 4-11 Matriz de correlación para los coeficientes estimados
-------------------------------------------------------------------------------------------------- CONSTANT PCOMP_1 PCOMP_ PCOMP_3 CONSTANT 1.0000 0.1133 -0.1194 0.0379 PCOMP_1 0.1133 1.0000 -0.1099 0.0349 PCOMP_2 -0.1194 -0.1099 1.0000 -0.0368 PCOMP_3 0.0379 0.0349 -0.0368 1.0000 PCOMP_5 0.1247 0.1147 -0.1210 0.0384 -------------------------------------------------------------------------------------------------- PCOMP_5 CONSTANT 0.1247 PCOMP_1 0.1147 PCOMP_2 -0.1210 PCOMP_3 0.0384 PCOMP_5 1.0000
Fuente: Elaboración propia.
Esta tabla muestra las correlaciones estimadas entre los coeficientes en el
modelo ajustado. Las correlaciones pueden ser usadas para detectar la presencia de
multicolinealidad seria, por ejemplo, correlación entre las variables predictivas. En este
caso, no hay correlaciones con valores absolutos mayores a 0.5 (sin incluir el término
CONSTANT).
21
Tabla 4-12 Tabla de Residuales Inusuales
-------------------------------------------------------------------------------- Predicted Studentized Row Y Y Residual Residual -------------------------------------------------------------------------------- 9 15.0683 15.3691 -0.300798 -2.35 --------------------------------------------------------------------------------
Fuente: Elaboración propia.
La tabla de “residuales inusuales” lista todas las observaciones que tienen
residuales Studentized mayores que 2.0 en valor absoluto. Los residuales Studentized
miden cuantas desviaciones estándar de cada valor observado de Valor se desvían de
un modelo ajustado usando todos los datos excepto el observado. En este caso, hay un
residual Studentized mayor que 2.0, pero no más grande que 3.0
Tabla 4-13 Tabla de Puntos de Influencia
----------------------------------------------------------------- Mahalanobis Row Leverage Distance DFITS ----------------------------------------------------------------- 3 0.959268 187.515 -2.84699 9 0.369587 3.8012 -1.79918 ----------------------------------------------------------------- Average leverage of single data point = 0.5
Fuente: Elaboración propia.
La tabla de puntos de influencia lista todas las observaciones que tienen valores
palanca mayor que tres veces el promedio de los datos, o que tienen un valor
inusualmente grande de DFITS. La palanca es un estadístico que mide que tanto
influencia cada observación en determinar los coeficientes del modelo estimado. El
DFITS es un estadístico que mide cuanto cambiarán los coeficientes estimados si cada
observación fuera removida del conjunto de datos. En este caso, un punto de dato
promedio tiene una palanca igual a 0.5. No hay puntos de datos con más de tres veces
la palanca promedio. Hay dos puntos de datos con valores inusualmente grandes de
DFITS. (LEVERAGE= PALANCA).
22
4 CONCLUSIONES Y RECOMENDACIONES
El trabajo aquí desarrollado parte de la premisa de que los bienes inmuebles
tienen diversas características inherentes a ellos que influyen en su valor pero que
normalmente no son consideradas en un avalúo cuando se realiza el análisis de mercado,
en donde por lo general se utilizan de cinco a seis factores en el proceso de valoración.
Se realizó un análisis cualitativo previo, mediante entrevistas en profundidad a
expertos y grupos focales, para construir el instrumento para la investigación del mercado
inmobiliario, explorando dos sectores representativos el primero a expertos en el campo
de la valuación y la otra a los involucrados en el mercado de bienes raíces, los asesores
inmobiliarios, para obtener las características que el mercado percibe dan valor a los
bienes inmuebles.
Una vez obtenidas estas características se complementaron con otras más
obtenidas en la literatura consultada para llegar a un total de treinta y cinco
características. En la investigación de mercado se obtuvo información de cuarenta y ocho
comparables, se caracterizaron de acuerdo a las treinta y cinco características obtenidas
y se aplicaron las escalas obtenidas en el análisis cualitativo para las treinta y cinco.
Se aplicó la técnica de Análisis de Grupos a los comparables y sus características
y del resultado obtenido en el Dendograma resultante, se seleccionó el grupo que
contenía al sujeto con diez comparables (Sujeto, C03, C01, C02, C05, C45, C10, C15,
C04, C12 C11). El criterio de selección cumple con las premisas de:
El grupo seleccionado se caracteriza por contener los comparables más
similares entre sí.
Este mismo grupo se diferencia totalmente de los demás grupos
resultantes.
Este resultado muestra que la técnica de Análisis de Grupos es una
herramienta que puede resolver el problema multifactorial de la
variabilidad de características de los bienes inmuebles, ya que nos permite
proponer un criterio para seleccionar el mejor agrupamiento de los
inmuebles comparables.
23
A continuación se aplica el análisis de Componentes Principales en donde de las
treinta y cinco características iniciales obtenemos diez y ocho características
significativas finales, las cuales se agrupan en cinco grupos de meta - variables. De estos
un grupo no es estadísticamente significativo llegando a tener finalmente cuatro grupos.
Una vez seleccionadas de nuestra base de datos diez comparables y cuatro meta
- variables se realiza un análisis de Regresión Múltiple para obtener el valor de mercado
del sujeto.
Podemos concluir que aplicando esta metodología el proceso nos entrega los
comparables más semejantes al sujeto y las características más significativas.
Entre las recomendaciones sugeridas están:
Contar con una base de datos de comparables, actualizada, cuyos componentes
contengan las características que se van a analizar.
Utilizar un software específico que permita aplicar los métodos estadísticos de
forma rigurosa y con celeridad.
La experiencia del valuador juega un papel muy importante en cada paso del
proceso. En el Análisis de Grupos su criterio es importante al definir el tamaño del grupo
que se selecciona y lo mismo sucede en el Análisis de Componentes Principales, ya que
se pueden eliminar o añadir características según las considere el valuador como
significativas o no significativas.
Lo anterior contribuye a disminuir el error en la estimación de valores
inmobiliarios, con herramientas de naturaleza multivariada para encaminar la valuación
a obtener valores técnica y científicamente demostrables.
24
5 Referencias
Appraisal, I. (2002). El Avalúo de Bienes Raíces (12a. ed.). Chicago Il.: Appraisal
Institute.
Cuadras, C. (2007). Nuevos Métodos Multivariantes. Barcelona, España: CMC
Editions.
Guadalajara, O. N. (2002). El mercado de la tierra en España. Modelos
econométricos para la estimación del valor. Departamento de Economía y Ciencias
Sociales. Escuela Técnica Superior de Ingenieros Agrónomos.
Guijarro Martinez, F. (2013). Estadística Aplicada a la Valoración. Modelos
Multivariantes. Valencia: Universitat Politécnica de Valencia.
Hair, F. J. (1999). ANALISIS MULTIVARIANTE (5a. ed.). Madrid: Prentice Hall
Iberia.
Kotler, Philup y Armstrong, Gary (1991) Fundamentos de Mercadotecnia. 2da
Edición. México. Prentice-Hall Hispanoamericana.
Malhorta, N. K. (2008). Investigación de Mercados (5a. ed.). México: Pearson
Educación.
Pérez, O. (2002). El análisis de grupos en la Homologación de Comparables.
Ponencia. Primer Congreso Internacional de Valoración y Tasación. Valencia:
Universidad Politécnica de Valencia.
Pérez, O., & Flores, N. (Enero de 2007). La valuación rural, aplicación de métodos
emergentes en el Valle de Zamora. Zamora, Michoacán.
25
Anexo: base de datos y variables
26