reconocimiento de un patrón de estimación humana aplicando ... · j. c. romero y a. aguilar :...

Computación y Sistemas Vol.3 No.2 pp. 105 -114@ 1999, CIC- IPN. ISSN 1405-5546 Impreso en México

Reconocimiento de un Patrón de Estimación Humana Aplicando el

Modelo de Regresión Lineal Borrosa

José C. Romero Cortés y Arturo Aguilar VázquezDepartamento de Sistemas, UAM-Azcapotzalco

e-mail: [email protected]

Artículo recíbido el 17 de noviembre. 1998 : ace-Dtado ellO de Qctubre. 1999

Resumen 1 Introducción

Los modelos estadísticos lineales son importantes no sólo porlos desarrollos matemáticos alcanzados sino también por suaplicación a situaciones reales. Sin embargo, estas relacio-nes no son de utilidad para explicar las estimaciones huma-nas , pues se limitan a trabajar con datos generados median-te la planeación y diseño de experimentos. En el artículo semodela esta experiencia humana, vía un modelo lineal en losparámetros, donde la variable dependiente es borrosa. Estoimplica que los parámetros sean de naturaleza difusa y setenga que aplicar la programación lineal para estimar éstos,especificamente se analiza el problema dual y susimplicaciones en reducción de la borrosidad.

Palabras Clave

Variable borrosa, regresión borrosa, funciones de pertenen

cia, reducción de borrosidad, programación lineal.

Modelar sistemas donde la estimación humana es fundamental,requiere del uso intensivo de la modelística borrosa o difusa.Específicamente en el contexto del modelo de regresión li-neal múltiple, la borrosidad corresponde a las imprecisionesde las estimaciones humanas y las generadas por el modelo,esto a diferencia del modelo convencional donde las desvia-ciones corresponden a los errores aleatorios observados. Enel modelo difuso la fuente de variación de la variable depen-diente es borrosa más que en el sentido ordinario donde las yson variables aleatorias observadas y entonces también lo~parámetros tienen asociadas ciertas funciones de pertenen-cia, es decir, son borrosos. La estimación del modelo difusorequiere resolver un modelo de programación lineal (Tanakael al., 1982). En el presente trabajo se desarrolla el análisisdel problema dual asociado, y sus implicaciones en la re-ducción de la borrosidad, como parte fundamental delanálisis. Se presentan y discuten dos casos de aplicacióna saber:

(i) las estimaciones realizadas en el área metropolitana dela Ciudad de México de los precios de venta de casas-habita-ción, considerando como variables independientes la super-ficie del terreno, la superficie construida, la ubicación geo-gráfica del inmueble, etc.

(ii) la fijación de los precios de venta de las acciones de em-presas que pertenecen a una cierta industria que cotizan en uncierto mercado de valores, considerando como variables inde-pendientes el valor en libros de la acción, su rendimiento, volu-men operado, evolución del índice Dow-Jones, etc.

105

J. c. Romero y A. Aguilar : Reconocimiento de un Patrón de Estimación Humana Aplicando el Modelo de Regresión Lineal Borrosa

El Modelo de Regresión Lineal MúltipleDifuso (MRLMD)

Este modelo se construye a partir de una muestra de tamañon de k variables independientes, de tal manera que permite

relacionarla con las correspondientes respuestas borrosas, pro-

porcionadas por alguna fuente de estimación humana, y conlos correspondientes errores de estimación asociados. Lo an-terior se muestra esquemáticamente en la tabla I.

Se asumen funciones de pertenencia triangulares porqueresultan ad-hoc en el modelo de programación lineal que pos-

teriormente usaremos y además esta forma se asemeja al pro-ceso subjetivo de asignar valores a la variable dependientedifusa (Kaufmann, 1991 ), donde se asume un valor de 1 de

pertenencia para Yi' y conforme las desviaciones a éstecrecen el experto esperaría niveles menores de pertenenciaal conjunto, se pudo usar alguna membresía similar, digamos

una "be!!".

Análogamente, si los coeficientes jJ tienen asociadas fun--1

ciones de pertenencia triangulares con centros al y con valo-res de dispersión CI la función de pertenencia se muestra enla figura 2.

~

Tabla 1

Figura 2.

x = Valor fijado para la variable independiente

j, en la i-ésima muestra, con X =1.iO

El símbolo -asociado a los parámetros indica que éstos son

borrosos o difusos, es ~ecir, que tienen asociadas funcionesde pertenencia ó distribuciones de posibilidad.

Los términos de error e. están asociados a las estimaciones, .humanas, que bien pueden ser proporcionadas por expertos,de tal manera que, asumiendo funciones de pertenencia trian-

gulares, la correspondiente gráfica de la función de pertenen-cia sería:

Se construye el modelo matemático que minimiza la sumade las dispersiones c asociadas a los centros a, al hacer la

J Jsuposición lineal de las funciones de membresía de losvalores borrosos y con las funciones de membresía de los

-ijJcoeficientes borrosos -j .

Entonces la estimación estadística borrosa de los parámetrosa y c (j=1,2,...,k) nos conduce a tener que resolver el si-

g¿ient¿ modelo de programación lineal (Tanaka, 1981 ):

MinZ=cO+c1+c2+ooo+c

Sujeto a :

k

=1,2,!x¡¡I?y¡+(I-h)eaOxiO +a1xi1 +...+akxik +(1-h) j ~ OC jl

(2)

y;+{I-h)e"i=I,2,aOxiO -a\xi\ akxik +(\-h) .f oc j lX,

J=c. 2: O,j=O,I,2,...,k.

J

a. E 91,j = O,I,2,...,k., esto es, son variablesirrestrictls en signo.1

106


esta variable es básica, y se debe reoptimizar. Algo análogo

ocurre cuando se remueve una variable original. Lo anteriorimplica manteneNas a O' s y c O' s básicas óptimas cuando las

a y c no sean b~sicas~ en caso contrario habrá quek+l k+1

reoptimizar, con posibles cambios en la solución óptima, lo

que puede mover algunas distribuciones de posibilidad

de ¡30 y puede implicar una reducción en borrosidad, aunque

también puede indicar lo contrario. El caso de remoción nue-

vamente contempla 2 casos: Si alguna de las a °'s, c °'s bási-

cas óptimas es removida a menos de que pudi~ra dirse dege-

neración, la solución cambia, con decremento en zO; pero sila remoción corresponde a una (30 cuyas a °,C o no sean bási-

1 1 .-.j j jcas entonces a so uclón se mantIene.

Este problema primal tiene asociado el siguiente problema

dual donde las w, D (i=I,2,...,n), corresponden a lasI I

variables duales, para hacer análisis de sensibilidad y que

resultan claves para poder disminuir borrosidad:

n I k

MaxZ= ~Wil Yi +(I-h)ej -d~xij

. [ k

-~D; Y; -(l-h)e; -d~Xij

n n

(l-h)LWIIXijl-(l-h)LDiIXijl ~ 1,j =0,1,2,

i=1 1=1

,k(3)

n n

¿WiXij -¿Dixij ~O,j =0,1,2,

i=1 i=1

,k

El problema anterior ha sido planteado por varios autores,el aporte de este artículo es realizar el análisis de sensibilidadpara investigar cómo los valores óptimos de (2) a.°, c. °

J JU=l,i,...,k) y ZO varían al cambiar los valores de los

parámetros, al añadir observaciones y al agregar o remover

variables independientes al MRLMD, lo cual nos indicará,en cuánto se corrige la borrosidad ó ímprecisión de las esti-maciones humanas mediante las distribuciones de posibili-

dad asociadas a las :

Y.=(y,e) y ~j=(a.,c),

iii) Introducción de una nueva restricción.- Esto

se refiere a incluir una nueva y n+!' asociada a Xn+!,1' Xn+!,2"..'

Xn+!,k al modelo. Si ésta es satisfecha por la solución óptima

entonces se conserva la solución, si no habrá que iterar hasta

obtener el nuevo óptimo. Este punto es importante porque

sabemos que, a mayor tamaño de muestra se espera menor

borrosidad.

para i = 1,2, ...,n;j = 0,1,2, ...,k.

La solución de (2) nos dará la estimación del modelo (I),mientras que con la solución de (3) se podrá realizar análisisde sensibilidad. Para aclarar ésto, a continuación se presen-tan los casos clásicos de sensibilidad, pero sobre todo su sig-

nificado asociado, en el contexto del análisis de Regresión

Lineal Múltiple Difuso.

i) Cambios en los i:y +(l-h)e ' s.- Estos miembros

derechos del primal se les d~nota en IJ literatura de la progra-mación lineal como b , las variables duales óptimas w O' s,

D O' s, nos dan los prec~os sombra cuya interpretación ec¿nó-

m~ca en este contexto, debe traducirse en una interpretaciónde ganancia en conocimiento del sistema o reducción de bo-

rrosidad, pudiendo investigar el máximo ( mínimo) incremen-to admisible a estos miembros derechos, manteniendo lasmismas variables en la solución óptima, permitiendo corre-

gir las percepciones borrosas expresadas en los datos.

iv) Cambi~ en coeficientes de variables básicas

y no básicas.- Esto no es importante en el contexto de la

Regresión Lineal Múltiple Difusa porque los x las asumi-

mos fijas y corresponden al diseño del experime~to. Respec-to a la programación paramétrica se tiene sólo el caso de inte-rés de cambiar los valores :1: y + (l-h)e 's y significa valorarla sensibilidad de la solucióA zo, a o~s, c °'s cuando estos

miembros derechos se incrementan jen hakta o e, estos es,analizar sobre todo cuando se reduce ZO al mo~er alguno ó

algunos:1:y+(l-h)e 'senoe,dondee>o yOE~.i i i iLos puntos señalados anteriormente correspondientes al

análisis de postoptimalidad, son tratados con profundidad por

Simonnard (1992) y en Hillier (1990).

Aunque en muchos casos es inconveniente reducir la borro-sidad en una variable, sobre todo si ésta se debe en realidad a

que la distribución seleccionada no es la correcta(multiplicidadde máximos locales), ya que esta reducción genera una estima-

ción más pobre, sin embargo, en el caso que nos ocupa pudie-ran existir soluciones óptimas altemativas al problema de pro-gramación lineal, usado para estimar el MRLMD, ésto no re-presenta problema alguno, pues son programas extremos. En

programación lineal no se tiene el problema de multiplicidad deextremos locales y explícitamente en el MRLMD lo que intere-

sa es reducir la borrosidad o vaguedad en las estimaciones, algoparecido a lo que sucede con el modelo crisp, donde lo que se

buscar es reducir la varianza en las estimaciones.

ii) Introducción o remoción de una nueva varia-

ble independiente.- Si se introduce una nueva variable

independiente X;.k+J ' al MRLMD que corresponde a 13 , des-

de el punto de vist~ de la programación lineal, sólo b~~ta in-

vestigar si la correspondiente restricción añadida al dual se

satisface también para la solución óptima, en caso contrario

107

> 0 .- 12w¡ -,1- , ,...,n.

D; ?: O,i = 1,2,...,n.


Casa no. SuperficieTerreno

,2

Superficie Construida

2m

Edadaños

Localización(Precio de venta,ei)

$

Tabla 2.

Ya que la variable dependiente corresponde a estimacio-nes humanas, esta deberá modelarse usando el modelo de re-gresión lineal múltiple difuso, quedando la ecuación de la

siguiente forma:

Aplicación L- A continuación se da un ejemplo para

ilustrar la estimación puntual del MRLMD. Para esto con-sidérese el desarrollo de un modelo del precio de venta decasas habitación en la Ciudad. de México y su área me-tropolitana, sobre la base de la superficie del terreno, su-perficie construida, edad de la construcción y su ubica-ción o colonia a la que pertenece. Se obtuvo una muestrade tamaño doce con expertos en esta actividad como son

corredurías y hasta los propios dueños de los inmuebles(Segundamano, 1997; El Universal 1997), quienes anun-ciaron sus estimados en cuanto a los precios y caracterís-ticas, según se muestra en la tabla 2:

>; =A +fJ.X" +Ax" +Ax" +fJ.x,. +fJ.x" +f1.,X'6 i=I,2, ,12 (4)

Las variables independientes 4°, 5° y 6° son variables

"dummy" (asumen valores O ,1). La estimación de las distri-buciones de posibilidad de la jJ , se obtiene resolviendo elsiguiente problema de progr;/nación lineal, usando los

algoritmos convencionales:

MinZ=co +C1 +C2 +CJ +C4 +CS +CI

Sujeta a :

ao +136al +203a2 +30a3 +a4 +(l-h)[co +136cl +203c2 +c330+c4]~390,OOO+10,OOO(1-h). .(5.1)

ao +120a. +150a2 +9a3 +a6 +(I-h)[co +12Oc. +150c2 +9c3 +c6]~800,OOO+40,OOO(I-h), .(5.3)

ao +215a. +240a2 +35aJ +as +(l-h)[co +215c1 +240c2 +35cJ +cs]~950,OOO+50,OOO(1-h). (5.7)

108

reconocimiento de un patrón de estimación humana aplicando ... · j. c. romero y a. aguilar :...

Documents