construcción de modelo1

Upload: joffre-arismendi-solis-tucto

Post on 06-Jul-2018

219 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/16/2019 Construcción de Modelo1

    1/9

    Construcción de Modelos: Existen varios tipos de modelos. Revisaremos aquí cómo construir algunos deellos y luego haremos una comparación. Todas las construcciones aquírevisadas son hechas con métodos estadísticos. Esto significa que las

    variables escogidas y la manera de mezclarlas se realiza con algoritmos biendefinidos que utilizan la información de la muestra de construcción y quepueden ser implementados en el computador. Modelos invariados: !n modelo univariado es uno que usa una sola variable. "or e#emplo$ 

    • %i antig&edad menor a '( meses rechace. %i no acepte.

     )tro e#emplo de modelo univariado$

     • %i edad est* entre +, y -, acepte. %i no rechace.

     "ara construir estos modelos se puede calcular el % en la muestra deconstrucción tomando para cada variable el me#or punto de corte. /inalmente elmodelo escogido es alguno con buen %. 0maginemos que en la base de construcción se calcularon los % siguientes$

    Esto significa que si se escoge Edad  y ésta tiene ese % para el punto de corte+-1 a2os entonces el modelo 

    %i edad  34 +-1 a2os rechace. %i no acepte. 5ebe ahora correrse este modelo sobre una muestra de testeo. %i el % en lamuestra de testeo da ',+ entonces ',+ es el estimador de % que tiene elmodelo. 6o que sigue es muy importante$ "uede ser que #ugando con el punto de corte se descubre que en la base detesteo el punto de corte +17 a2os da un % me#or por e#emplo un % de '7(.%in embargo si se desea usar ese nuevo punto de corte entonces debetestearse el modelo en otra muestra independiente para poder estimar el %. %ino no vale el c*lculo como estimador de lo que ser* la capacidad de

  • 8/16/2019 Construcción de Modelo1

    2/9

    discriminación con nuevos clientes o con otra base. Tercera advertencia$ es lamisma advertencia que las dos anteriores ante el mismo error. %i no entiendeeste error entonces est* preparado para cometer un error grave. Modelos con puntaje lineal:

     !n modelo con punta#e lineal requiere convertir todas las variables anuméricas o usar sólo aquellas que se traducen a n8meros. "or e#emplohabría que traducir la variable sexo con valores 9asculino y /emenino a lavariable sexo_N  con valores : y ' respectivamente. !n modelo de punta#e usa una suma de variables ponderadas. Este tipo demezclas se llama combinación lineal. "or e#emplo un modelo de punta#e es elsiguiente$ 

    Puntaje 4 '+;Edad  < :,; Antigüedad  = ,>;Cargas

     %i Puntaje 34 1: rechace. %i no acepte.

     !n modelo de punta#e asume implícitamente que existe una moneda deintercambio que dice cu*nto de una variable es equivalente a cu*nto de otracuando el resto de las variables est*n fi#as. Esto significa que si una variableest* complicada esto puede ser compensado por otras. Esta suposición esmuy discutida pues hay factores como los de moralidad que si est*n mal sedebe rechazar el cliente sin importar qué tan bien estén las otras variables. %inembargo si la moralidad est* bien entonces otros factores tienen granimportancia. !n criterio así no puede ser puesto como suma ponderada defactores. 6os métodos de construcción de modelos de punta#e tratan de encontrar losme#ores coeficientes posibles de manera que la capacidad de discriminacióndel modelo sea m*xima. "ara esto normalmente se calculan para cadavariable promedios de las variables para clientes malos y los promedios de lasvariables de los clientes buenos. ?dem*s se calculan las dos matrices decovarianzas la para clientes malos y las para clientes buenos. !sando lospromedios y las covarianzas puede encontrarse una nueva variable que resultaser suma ponderada de las originales. Esa nueva variable es un mecanismo de

    punta#e que puede tener un buen %. %i para todas las variables tanto ladistribución de clientes buenos como malos son normales y ambos con lamisma covarianza entonces el mecanismo es óptimo. Existen otra granvariedad de otros métodos que son variaciones del anterior. @o est* claro cu*les el me#or pero para datos normales AgaussianosB el descrito con lacovarianza es el óptimo. Modelos con árboles: 6a construcción de un *rbol se hace por etapas. En cada etapa se seleccionauna de las variables m*s discriminantes y de acuerdo a ella se segmenta lo

    que queda de la muestra en dos. 

  • 8/16/2019 Construcción de Modelo1

    3/9

    Tomemos como e#emplo esta mini muestra Asacada de C+DB de construcción con'+ clientes A- buenos y - malosB y cinco variables$ %alario asa "ropia ?uto"ropio Edad y Estado ivil.

    Esta muestra es extremadamente chica como para hacer nada serio peropermite ilustrar los conceptos b*sicos. ?dem*s este e#emplo #uguete permitecalcular a mano todo lo que sea necesario y así asegurarse que uno haentendido el algoritmo de construcción de *rboles. Tomemos adem*s esta segunda muestra con ( clientes A> buenos y > malosB ylas mismas cinco variables. Esta ser* nuestra muestra para testeo.

    6os % de cada variable #unto a su desviación est*ndar seg8n la muestra deconstrucción son$

  • 8/16/2019 Construcción de Modelo1

    4/9

    laramente la desviación es enorme. Esto se debe al tama2o extremadamentepeque2o de la muestra. ?un así la variable %alario es la m*s discriminante. %i escogemos %alario y segmentamos por esa variable obtenemos el siguiente*rbol

     

    Este es un *rbol muy elemental. En el segmento izquierdo est*n aquellosclientes con salario 34 ',:. 5e la muestra de construcción quedan - clientesAes decir >'7F de los clientes que est*n en la muestraB y estos se reparten enuno bueno y > malos. En el segmento derecho est*n aquellos clientes consalario mayor a ',:. Gay un total de 7 de los cuales , son buenos y + sonmalos. Este modelo tiene un % de ,:F. ?mbos segmentos pueden seguir segment*ndose. %in embargo dado el error lo de#amos hasta ac*.  ?hora es muy importante medir el % del modelo y su desviación en lamuestra de testeo. Eso son los valores que importan. !sando la muestra detesteo tenemos que cinco casos quedan en el segmento izquierdo y tres en elderecho$

  • 8/16/2019 Construcción de Modelo1

    5/9

    ) sea el % es sólo de +,F. Esto quiere decir que si tomamos otra muestracualquiera de clientes independiente de la muestra de construcción el %andar* alrededor de +,F pudiendo variar desde : hasta 7'F en la granmayoría de los casos.Modelos no lineales:

    Existen varios tipos de modelos no lineales. !no de los tipos no lineales es el

    de *rboles de decisión. )tros son las redes neuronales los algoritmosgenéticos y muchos otros.

    6os modelos de redes neuronales asumen que todas las variables sonnuméricas. %i no lo son o sólo se traba#a con las numéricas o bien seconvierten a numéricas de acuerdo a un criterio especificado. El modeloneuronal busca una combinación de variables con sumas ponderadas yfunciones umbrales Asi el valor es m*s all* de cierto umbral sale uno si no saleceroB.

    6os modelos genéticos también requieren variables numéricas. 6os algoritmosrecombinan criterios creando nuevos a partir de criterios b*sicos con métodossimilares a la creación de moléculas recombinando partes de moléculas yhaciendo mutaciones. En este caso se mutan partes de fórmulas y se creannuevas #untando fórmulas. ?quellas fórmulas con me#or capacidad dediscriminación van sobreviviendo y vuelven a mutarse y recombinarse.Eventualmente se llegan a buenas fórmulas que corresponden a criterios conbuena capacidad de discriminación.

     

     ?n*lisis comparativo de diferentes tipos de modelos y algoritmos

     

    Naturalidad

     

    !n aspecto muy importante de un modelo es que sea natural para la mentehumana. Hue exprese en un lengua#e f*cil de comprender las característicasesenciales de los diferentes patrones de riesgo en la cartera. 9uchas veceseste producto de un modelo es el esencial. "ermite hacerse un clarodiagnóstico del estado de la cartera encontrar oportunidades y hacer a#ustes a

    las políticas. En general para el an*lisis de riesgo crediticio los modelos tipo*rbol son m*s naturales que otros. Esta mayor naturalidad se debe a que

  • 8/16/2019 Construcción de Modelo1

    6/9

    encontrar un *rbol discriminante es equivalente a encontrar segmentos condiferentes niveles de riesgo unos bien distintos de los otros. "or e#emplo elsegmento de los menores a +, a2os y sin casa propia no es m*s que un nodode un *rbol. Esta manera de concebir el riesgo describiendo segmentos con suriesgo asociado es una manera natural e intuitiva. Es una manera

    ecológicamente v*lida es decir est* expresada en un formato natural a lamente.

     

    apacidad de discriminación

     

    !n estudio internacional Aver C'DB llevado a cabo durante > a2os por varioscentros estadísticos universitarios e industriales de varios países de la

    omunidad Europea que compararon varias decenas de métodos concluyóque los métodos de *rboles de decisión son los de me#or capacidad dediscriminación en crédito. 5e +1 algoritmos probados de los cuales , eran de*rboles de decisión el me#or resultó ser de *rbol de decisión y tres algoritmosde *rboles estaban entre los seis primeros lugares. El estudio concluyó queIparte de la razón del éxito Ade los *rbolesB en esta *rea es sin lugar a dudasque los métodos de *rboles de decisión pueden mane#ar m*s naturalmente conuna gran cantidad de atributos binarios o categóricos Asiempre que el n8merode alternativas sea peque2oB. Ellos también incorporan términos de interacciónen su desarrollo. J quiz*s m*s significativamente ellos son un espe#o delproceso de decisión humanaK.

     

    Estabilidad simplicidad y comunicabilidad

     

     ?parte de la capacidad de discriminación de un modelo y en particular de unmodelo tipo *rbol es muy importante considerar la estabilidad simplicidad ycomunicabilidad.

    Estabilidad significa que en muestras independientes sus indicadores dediscriminación no varíen mucho. @aturalmente esto depende del tama2o de lamuestra con que se construyó el modelo. "ero también depende si se intentósobre a#ustar la información llegando hasta segmentos con muy pocoscasos. )tra prueba importante de estabilidad es ver cu*ntos varían losindicadores medidos en diferentes condiciones de stress Apor e#emplo sacandoclientes malos muy evidentesB. )tra prueba adicional de estabilidad esdeterminar cómo se comportan los indicadores a través del tiempo.

    %implicidad significa que cada vez que hay dos modelos o *rboles con similar capacidad de discriminación y estabilidad es preferible el m*s simple$ con

    menos variables menos condiciones y con segmentos que hagan sentido.

  • 8/16/2019 Construcción de Modelo1

    7/9

    omunicabilidad significa que el *rbol puede resumirse en algunos criterios osegmentos f*ciles de interpretar y relatar a terceros. Esto asegura que si huboalg8n error en el proceso de construcción o se han producido cambiosmacroeconómicos o cambios en el mercado ob#etivo entonces ser* f*cildetectar esos problemas. 6a comunicabilidad facilita el seguimiento y la

    capacidad de hacer a#ustes oportunos mucho antes que errores o desa#ustessean muy evidentes.

     

    0nclusión de variables indirectas

     

    6a construcción de un buen modelo sea éste tipo *rbol o no depende de lainclusión de variables significativas que no siempre est* explícitamente en la

    información original. "or e#emplo variables como$

     

    • @8mero de veces con mora sobre 1: días en los 8ltimos - meses

    •  ?ltura m*xima de mora en los 8ltimos 1 meses

    • %aldo actual L saldo promedio en los 8ltimos 1 meses etc.

     

    Es importante incluir un gran con#unto de estas variables y echarlas a competir con las otras. ?sí el algoritmo de construcción las tendr* en cuenta tanto

    separadamente para toda la muestra de construcción como en cada uno de lossegmentos particulares que se vayan definiendo.

    Determinación de niveles de riesgo para diferentes segmentos y puntos

    de corte según rentabilidad.

    !n *rbol contiene varios segmentos finales. ada segmento tiene unacombinación de clientes buenos y clientes malos. El nivel de riesgo de cadasegmento se obtiene contando los clientes buenos y malos que caen en el

    segmento y calculando sus proporciones.

    Retomemos el e#emplo 1. En el nodo izquierdo que corresponde al segmentoedad menor a +, a2os hay >:: clientes buenos y +:: malos. "or lo tanto latasa de malos es 111F y la de buenos es ---F. En el nodo del mediocorrespondiente al segmento de clientes con edad igual o mayor a +, a2os ysolteros hay (:: buenos clientes y +:: malos. "or lo tanto la tasa de malos es+:F. En el otro nodo el de la derecha correspondiente a clientes con edadigual o mayor a +, a2os y casados hay (1:: clientes buenos y ':: malos. Esdecir la tasa de malos es '+F.

    El mismo *rbol puede tener varios puntos de corte. "or e#emplo podemos

  • 8/16/2019 Construcción de Modelo1

    8/9

    •  ?ceptar todos

    • Rechazar a los con edad menor a +, a2os

    • Rechazar a los con edad menor a +, a2os o a los solteros con edad +,

    a2os o m*s

    • Rechazar a todos

     

    6as otras combinaciones no son naturales de acuerdo al *rbol. "ara cada cortetendremos un % y su correspondiente desviación. El corte óptimo se decidecon la muestra de construcción.

    !na vez escogido el corte se eval8an todos los clientes de la muestra detesteo. %e cuentan cu*ntos clientes buenos y malos caen en la zona derechazo Amenor al corteB y con esos datos se obtiene una estimación del %.

    Ajustes

    0nclusión de clientes negados

     

    6a información de clientes negados es muy importante para detectar posibilidades de ampliar los criterios crediticios actuales. Es muy posible que sehayan estado rechazando clientes que podrían haber tenido un buencomportamiento. Marios de esos clientes deben tener ciertos perfiles es decirpertenecer a ciertos segmentos bien definidos. El problema es que hay que

    detectar cu*les son esos segmentos. !na vez detectados pueden rela#arsecriterios crediticios para pasar a aceptar clientes en esos segmentos.

    0nformación necesaria que debe tenerse para poder usarse la información denegados

    El mayor problema para implementar la estrategia de incluir negados en laconstrucción del modelo es la escasez de información sobre los negados. Esnecesario haber de#ado almacenada toda la información al momento de lapresentación tal como con los clientes aceptados. Esto incluye información demoralidad proveniente de centrales de riesgo información demogr*fica y

    financiera. %i no est* esta información relativamente completa una estrategiaes intentar conseguirla con terceros. "or e#emplo con centrales de riesgo.

    "or otra parte es importante conseguir información de comportamiento de esos

    clientes con operaciones crediticias similares que pudieran haber conseguido

    en esos mismos momentos con terceros. Esta información puede conseguirse

    traba#ando con centrales de riesgo.

     

    ompra de información de negados almacenada en centrales de riesgo

    externas

  • 8/16/2019 Construcción de Modelo1

    9/9

    "ara que la adquisición en centrales de riesgo sea efectiva debe tener lossiguientes requisitos$

     

    • 5ebe ser información de los clientes negados o de una muestra aleatoria

    de negados suministrado por el constructor del modelo no por la centralde riesgo.

    • 6a información de iniciación debe ser al momento Aa la misma fechaB en

    que se negó el cliente. Este punto es delicado pues no esnecesariamente f*cil para la central de riesgo conseguirla. El traba#o esno trivial pues diferentes clientes son negados en diferentes fechas."ara la central le es f*cil conseguir la información de todos lo clientes ala misma fecha.

    • 6a información de comportamiento de cada clientes es desde el

    momento de negación en adelante y o#al* haciendo seguimiento a una

    operación crediticia conseguida con terceros que sea similar a lanegada.

     

    Ajustes según definición de buenos y malos 

    NHué pasa si se cambia la definición de buenos versus malos después que elmodelo est* terminadoO NEs necesario rehacer todo de nuevoO

    Es normal hacer a#ustes a la definición de buenos y malos. "or e#emplo parainiciación de una definición de bueno como aquel cliente que durante los dosa2os iniciales del crédito nuca pasó de mora de 9 días cambiar una definiciónde bueno como aquel cliente que durante los dos a2os iniciales del créditonuca pasó de mora de !" días. )tro cambio es definir como bueno aquelcliente que durante el primer  a2o inicial del crédito nuca pasó de mora de P:días.

    Todos estos cambios significan reclasificar la cartera. 6uego se pasa toda lamuestra de testeo por el modelo ya construido. 6o 8nico que cambia es laproporción de buenos y malos en cada segmento final del *rbol. on esa nuevacontabilidad de nuevos y malos se puede calcular directamente el nuevoestimador de %.