reconocimiento de un patrón de estimación humana aplicando ... · j. c. romero y a. aguilar :...
TRANSCRIPT
Computación y Sistemas Vol.3 No.2 pp. 105 -114@ 1999, CIC- IPN. ISSN 1405-5546 Impreso en México
Reconocimiento de un Patrón de Estimación Humana Aplicando el
Modelo de Regresión Lineal Borrosa
José C. Romero Cortés y Arturo Aguilar VázquezDepartamento de Sistemas, UAM-Azcapotzalco
e-mail: [email protected]
Artículo recíbido el 17 de noviembre. 1998 : ace-Dtado ellO de Qctubre. 1999
Resumen 1 Introducción
Los modelos estadísticos lineales son importantes no sólo porlos desarrollos matemáticos alcanzados sino también por suaplicación a situaciones reales. Sin embargo, estas relacio-nes no son de utilidad para explicar las estimaciones huma-nas , pues se limitan a trabajar con datos generados median-te la planeación y diseño de experimentos. En el artículo semodela esta experiencia humana, vía un modelo lineal en losparámetros, donde la variable dependiente es borrosa. Estoimplica que los parámetros sean de naturaleza difusa y setenga que aplicar la programación lineal para estimar éstos,especificamente se analiza el problema dual y susimplicaciones en reducción de la borrosidad.
Palabras Clave
Variable borrosa, regresión borrosa, funciones de pertenen
cia, reducción de borrosidad, programación lineal.
Modelar sistemas donde la estimación humana es fundamental,requiere del uso intensivo de la modelística borrosa o difusa.Específicamente en el contexto del modelo de regresión li-neal múltiple, la borrosidad corresponde a las imprecisionesde las estimaciones humanas y las generadas por el modelo,esto a diferencia del modelo convencional donde las desvia-ciones corresponden a los errores aleatorios observados. Enel modelo difuso la fuente de variación de la variable depen-diente es borrosa más que en el sentido ordinario donde las yson variables aleatorias observadas y entonces también lo~parámetros tienen asociadas ciertas funciones de pertenen-cia, es decir, son borrosos. La estimación del modelo difusorequiere resolver un modelo de programación lineal (Tanakael al., 1982). En el presente trabajo se desarrolla el análisisdel problema dual asociado, y sus implicaciones en la re-ducción de la borrosidad, como parte fundamental delanálisis. Se presentan y discuten dos casos de aplicacióna saber:
(i) las estimaciones realizadas en el área metropolitana dela Ciudad de México de los precios de venta de casas-habita-ción, considerando como variables independientes la super-ficie del terreno, la superficie construida, la ubicación geo-gráfica del inmueble, etc.
(ii) la fijación de los precios de venta de las acciones de em-presas que pertenecen a una cierta industria que cotizan en uncierto mercado de valores, considerando como variables inde-pendientes el valor en libros de la acción, su rendimiento, volu-men operado, evolución del índice Dow-Jones, etc.
105
J. c. Romero y A. Aguilar : Reconocimiento de un Patrón de Estimación Humana Aplicando el Modelo de Regresión Lineal Borrosa
El Modelo de Regresión Lineal MúltipleDifuso (MRLMD)
Este modelo se construye a partir de una muestra de tamañon de k variables independientes, de tal manera que permite
relacionarla con las correspondientes respuestas borrosas, pro-
porcionadas por alguna fuente de estimación humana, y conlos correspondientes errores de estimación asociados. Lo an-terior se muestra esquemáticamente en la tabla I.
Se asumen funciones de pertenencia triangulares porqueresultan ad-hoc en el modelo de programación lineal que pos-
teriormente usaremos y además esta forma se asemeja al pro-ceso subjetivo de asignar valores a la variable dependientedifusa (Kaufmann, 1991 ), donde se asume un valor de 1 de
pertenencia para Yi' y conforme las desviaciones a éstecrecen el experto esperaría niveles menores de pertenenciaal conjunto, se pudo usar alguna membresía similar, digamos
una "be!!".
Análogamente, si los coeficientes jJ tienen asociadas fun--1
ciones de pertenencia triangulares con centros al y con valo-res de dispersión CI la función de pertenencia se muestra enla figura 2.
~
Tabla 1
Figura 2.
x = Valor fijado para la variable independiente
j, en la i-ésima muestra, con X =1.iO
El símbolo -asociado a los parámetros indica que éstos son
borrosos o difusos, es ~ecir, que tienen asociadas funcionesde pertenencia ó distribuciones de posibilidad.
Los términos de error e. están asociados a las estimaciones, .humanas, que bien pueden ser proporcionadas por expertos,de tal manera que, asumiendo funciones de pertenencia trian-
gulares, la correspondiente gráfica de la función de pertenen-cia sería:
Se construye el modelo matemático que minimiza la sumade las dispersiones c asociadas a los centros a, al hacer la
J Jsuposición lineal de las funciones de membresía de losvalores borrosos y con las funciones de membresía de los
-ijJcoeficientes borrosos -j .
Entonces la estimación estadística borrosa de los parámetrosa y c (j=1,2,...,k) nos conduce a tener que resolver el si-
g¿ient¿ modelo de programación lineal (Tanaka, 1981 ):
MinZ=cO+c1+c2+ooo+c
Sujeto a :
k
=1,2,!x¡¡I?y¡+(I-h)eaOxiO +a1xi1 +...+akxik +(1-h) j ~ OC jl
(2)
y;+{I-h)e"i=I,2,aOxiO -a\xi\ akxik +(\-h) .f oc j lX,
J=c. 2: O,j=O,I,2,...,k.
J
a. E 91,j = O,I,2,...,k., esto es, son variablesirrestrictls en signo.1
106
J. c. Romero y A. Aguilar : Reconocimiento de un Patrón de Estimación Humana Aplicando el Modelo de Regresión Lineal Borrosa
esta variable es básica, y se debe reoptimizar. Algo análogo
ocurre cuando se remueve una variable original. Lo anteriorimplica manteneNas a O' s y c O' s básicas óptimas cuando las
a y c no sean b~sicas~ en caso contrario habrá quek+l k+1
reoptimizar, con posibles cambios en la solución óptima, lo
que puede mover algunas distribuciones de posibilidad
de ¡30 y puede implicar una reducción en borrosidad, aunque
también puede indicar lo contrario. El caso de remoción nue-
vamente contempla 2 casos: Si alguna de las a °'s, c °'s bási-
cas óptimas es removida a menos de que pudi~ra dirse dege-
neración, la solución cambia, con decremento en zO; pero sila remoción corresponde a una (30 cuyas a °,C o no sean bási-
1 1 .-.j j jcas entonces a so uclón se mantIene.
Este problema primal tiene asociado el siguiente problema
dual donde las w, D (i=I,2,...,n), corresponden a lasI I
variables duales, para hacer análisis de sensibilidad y que
resultan claves para poder disminuir borrosidad:
n I k
MaxZ= ~Wil Yi +(I-h)ej -d~xij
. [ k
-~D; Y; -(l-h)e; -d~Xij
n n
(l-h)LWIIXijl-(l-h)LDiIXijl ~ 1,j =0,1,2,
i=1 1=1
,k(3)
n n
¿WiXij -¿Dixij ~O,j =0,1,2,
i=1 i=1
,k
El problema anterior ha sido planteado por varios autores,el aporte de este artículo es realizar el análisis de sensibilidadpara investigar cómo los valores óptimos de (2) a.°, c. °
J JU=l,i,...,k) y ZO varían al cambiar los valores de los
parámetros, al añadir observaciones y al agregar o remover
variables independientes al MRLMD, lo cual nos indicará,en cuánto se corrige la borrosidad ó ímprecisión de las esti-maciones humanas mediante las distribuciones de posibili-
dad asociadas a las :
Y.=(y,e) y ~j=(a.,c),
iii) Introducción de una nueva restricción.- Esto
se refiere a incluir una nueva y n+!' asociada a Xn+!,1' Xn+!,2"..'
Xn+!,k al modelo. Si ésta es satisfecha por la solución óptima
entonces se conserva la solución, si no habrá que iterar hasta
obtener el nuevo óptimo. Este punto es importante porque
sabemos que, a mayor tamaño de muestra se espera menor
borrosidad.
para i = 1,2, ...,n;j = 0,1,2, ...,k.
La solución de (2) nos dará la estimación del modelo (I),mientras que con la solución de (3) se podrá realizar análisisde sensibilidad. Para aclarar ésto, a continuación se presen-tan los casos clásicos de sensibilidad, pero sobre todo su sig-
nificado asociado, en el contexto del análisis de Regresión
Lineal Múltiple Difuso.
i) Cambios en los i:y +(l-h)e ' s.- Estos miembros
derechos del primal se les d~nota en IJ literatura de la progra-mación lineal como b , las variables duales óptimas w O' s,
D O' s, nos dan los prec~os sombra cuya interpretación ec¿nó-
m~ca en este contexto, debe traducirse en una interpretaciónde ganancia en conocimiento del sistema o reducción de bo-
rrosidad, pudiendo investigar el máximo ( mínimo) incremen-to admisible a estos miembros derechos, manteniendo lasmismas variables en la solución óptima, permitiendo corre-
gir las percepciones borrosas expresadas en los datos.
iv) Cambi~ en coeficientes de variables básicas
y no básicas.- Esto no es importante en el contexto de la
Regresión Lineal Múltiple Difusa porque los x las asumi-
mos fijas y corresponden al diseño del experime~to. Respec-to a la programación paramétrica se tiene sólo el caso de inte-rés de cambiar los valores :1: y + (l-h)e 's y significa valorarla sensibilidad de la solucióA zo, a o~s, c °'s cuando estos
miembros derechos se incrementan jen hakta o e, estos es,analizar sobre todo cuando se reduce ZO al mo~er alguno ó
algunos:1:y+(l-h)e 'senoe,dondee>o yOE~.i i i iLos puntos señalados anteriormente correspondientes al
análisis de postoptimalidad, son tratados con profundidad por
Simonnard (1992) y en Hillier (1990).
Aunque en muchos casos es inconveniente reducir la borro-sidad en una variable, sobre todo si ésta se debe en realidad a
que la distribución seleccionada no es la correcta(multiplicidadde máximos locales), ya que esta reducción genera una estima-
ción más pobre, sin embargo, en el caso que nos ocupa pudie-ran existir soluciones óptimas altemativas al problema de pro-gramación lineal, usado para estimar el MRLMD, ésto no re-presenta problema alguno, pues son programas extremos. En
programación lineal no se tiene el problema de multiplicidad deextremos locales y explícitamente en el MRLMD lo que intere-
sa es reducir la borrosidad o vaguedad en las estimaciones, algoparecido a lo que sucede con el modelo crisp, donde lo que se
buscar es reducir la varianza en las estimaciones.
ii) Introducción o remoción de una nueva varia-
ble independiente.- Si se introduce una nueva variable
independiente X;.k+J ' al MRLMD que corresponde a 13 , des-
de el punto de vist~ de la programación lineal, sólo b~~ta in-
vestigar si la correspondiente restricción añadida al dual se
satisface también para la solución óptima, en caso contrario
107
> 0 .- 12w¡ -,1- , ,...,n.
D; ?: O,i = 1,2,...,n.
J. c. Romero y A. Aguilar : Reconocimiento de un Patrón de Estimación Humana Aplicando el Modelo de Regresión Lineal Borrosa
Casa no. SuperficieTerreno
,2
Superficie Construida
2m
Edadaños
Localización(Precio de venta,ei)
$
Tabla 2.
Ya que la variable dependiente corresponde a estimacio-nes humanas, esta deberá modelarse usando el modelo de re-gresión lineal múltiple difuso, quedando la ecuación de la
siguiente forma:
Aplicación L- A continuación se da un ejemplo para
ilustrar la estimación puntual del MRLMD. Para esto con-sidérese el desarrollo de un modelo del precio de venta decasas habitación en la Ciudad. de México y su área me-tropolitana, sobre la base de la superficie del terreno, su-perficie construida, edad de la construcción y su ubica-ción o colonia a la que pertenece. Se obtuvo una muestrade tamaño doce con expertos en esta actividad como son
corredurías y hasta los propios dueños de los inmuebles(Segundamano, 1997; El Universal 1997), quienes anun-ciaron sus estimados en cuanto a los precios y caracterís-ticas, según se muestra en la tabla 2:
>; =A +fJ.X" +Ax" +Ax" +fJ.x,. +fJ.x" +f1.,X'6 i=I,2, ,12 (4)
Las variables independientes 4°, 5° y 6° son variables
"dummy" (asumen valores O ,1). La estimación de las distri-buciones de posibilidad de la jJ , se obtiene resolviendo elsiguiente problema de progr;/nación lineal, usando los
algoritmos convencionales:
MinZ=co +C1 +C2 +CJ +C4 +CS +CI
Sujeta a :
ao +136al +203a2 +30a3 +a4 +(l-h)[co +136cl +203c2 +c330+c4]~390,OOO+10,OOO(1-h). .(5.1)
ao +120a. +150a2 +9a3 +a6 +(I-h)[co +12Oc. +150c2 +9c3 +c6]~800,OOO+40,OOO(I-h), .(5.3)
ao +215a. +240a2 +35aJ +as +(l-h)[co +215c1 +240c2 +35cJ +cs]~950,OOO+50,OOO(1-h). (5.7)
108