de clientes - segmentacion

Técnicas de monitoreo de clientes -segmentacion

PRÁCTICAS ANTI LAVADO DE ACTIVOS, FINANCIACION DEL TERRORISMO Y CORRUPCION - PALATC

Agenda

1. Principios estadísticos.

2. La segmentación como herramienta de monitoreo.

3. Alcance de la segmentación.

4. Modelos estadísticos aplicables.

5. Uso de herramientas estadísticas para la segmentación de los factores de riesgo.

La Estadística es la rama de las matemáticas queestudia la variabilidad, así como el procesoaleatorio que la genera siguiendo leyes deprobabilidad.

Su resultado basa su éxito en el ordenamiento, elanálisis e interpretación de datos generados en lavaloración de hechos, individuos, datos, paradeducir de ello conclusiones precisas,probabilidades o estimaciones futuras.

La estadística se fundamenta enaspectos asociados a:

Principios estadísticos

Eventos determinísticos / se conoce el resultado

de la situación

Definir la población - determinar la muestra y aplicar la técnica

Eventos aleatorios / se desconoce el resultado final

Técnicas de análisis

Distribución NORMAL – BINOMIAL -POISSON

Variables cualitativas y cuantitativas – Continuas y discretas –

Dependientes e independientes

Muestreo

PROCESO DE

SEGMENTACION

MODELOS

ESTADISTICOS

La segmentación y la estadística

CBJ: Es el proceso por medio del cual se lleva a cabo laseparación de elementos en grupos homogéneos alinterior de ellos y heterogéneos entre ellos. Laseparación se fundamenta en el reconocimiento dediferencias significativas en sus características(variables de segmentación).

❑ Consolidación de cierta información❑ Sistematización de esos datos❑ Evaluación del resultado

Clasificar

Que no es segmentar

RIESGO ALTO

RIESGO MEDIO

RIESGO BAJO

Que no es segmentar

Combinar

Trasladar

Foto estática

Segmentar es

AGRUPAR

Razonamiento I

Para que el proceso de segmentación puedadeterminar lógicamente la detección deoperaciones inusuales, es indispensable conocer:

Pasado Transaccional ( )

Futuro transaccional ( )

Respuesta

Alcance de lasegmentación

Reglas de relevancia

Minería de datos

METODOLOGIA CRISP-DM

Minería de datos


Fase Inicial

Cumplimiento de objetivos

Alcance de los productos

Mercado Objetivo

Colección de datos inicial

Identificación de problemas

Conocimiento de datos

Planteamiento para el mejoramiento

Minería de datos


Selección de tablas y atributos

Transformación de datos

Limpieza de los datos

Recalibrar la preparación

Aplicación de técnicas entendimiento

de grupo de datos

Calibración de valores óptimos

Minería de datos


Comparación del modelo Vs

Objetivos

Revisión de cumplimiento de

los pasos anteriores

Despliegue del modelo

Supervisión del resultado

Herramientas estadísticaspara la segmentación de losfactores de riesgo

Modelos estadísticos aplicables

La segmentación como herramienta de monitoreo

(…) Las entidades deben segmentar sus

clientes de acuerdo con las características

particulares de cada uno de ellos,

garantizando homogeneidad al interior de

los segmentos y heterogeneidad entre ellos.

(…)

Análisis de conglomerados (clúster)

Es un método estadístico que permite formar grupos de

elementos (clientes) utilizando sus características (ingreso,

monto de las transacciones, frecuencia de operación, etc.).

Metodología aglomerativa

Rangos transaccionales

homogéneos

Valores financieros cercanos

Asignación de segmentos

heterogéneos

1

2

3

ANALISIS DE RESULTADOS

$

%

#

T

P

Metodología Jerárquica

Técnica que permite

encontrar patrones de

comportamiento basados en un

conjunto de variables

independientes. “Mapa” de los

posibles resultados de una serie

de decisiones relacionadas.

Arboles de Clasificación

Redes Neurales

Categorizan grandes

cantidades de datos mediante

su representación en un mapa

bidimensional, que muestra las

similitudes de los datos, de tal

modo que datos similares

aparecen representados en

regiones contiguas o

adyacentes.

Self-Organizing Maps - SOM

Análisis log-lineal

•Análisis log-lineal: Analiza la

relación entre variables

dependientes (o de respuesta) y

variables independientes (o

explicativas). Las variables

dependientes siempre son

categóricas, mientras que las

variables independientes pueden

ser o no categóricas (factores).

Razonamiento IILa segmentación se aplica a cada uno de losfactores de riesgo o a la base general de clientespara luego determinar el factor de riesgoinfluyente:

Falso ( ) Verdadero ( )

Respuesta

Uso de Herramientas estadísticas

Caso de negocio

❑K- means

Ejemplo de algoritmo en “R”

Definición de las variables utilizadas en la base de datos

TIPO ID

NUMERO

DESCRIPCION PRODUCTO

TIPO DE CLIENTE

NATURALEZA

NICHO

ACTIVIDAD ECONOMICA

CATEGORIA ACTIVIDAD

CANAL DE DISTRIBUCION

ZONA O JURISDICCION

CANTIDAD CREDITOS

VALOR DE CREDITOS

CANTIDAD DEBITOS

VALOR DE DEBITOS

VALOR INGRESOS

VALOR EGRESOS

Cargue de comandos en «R»

Instalación R versión 3.4.0 en adelante.

1- Importación del archivo

> setwd «ruta y nombre del archivo»

> library(readxl)

> Pn<-read_excel «nombre del archivo y de la hoja a usar»

2- Cargar el paquete o librería en «r»

> library(dplyr)

Ejecución comandos «R»

3- Selección de variables.

< clustervar<-select(Pn, 'NUMERO ID', 'NATURALEZA', 'CATEGORIA

ACTIVIDAD', 'CANAL', 'JURISDICCION','CREDITOS', 'CANTIDAD, etc)

4- Cargar el paquete «cluster».

< library(cluster)

5- Se calcula la distancia de los datos con gowerdis <- daisy(clustervar[,-1],

metric = c("gower"))

6- Cargar paquete < library(purrr)


7- Cálculo de clúster. (1 es buen cluster)

< sil_width<-map_dbl(2:40,function(k){

model<-pam(x=gowerdis,k=k)

model$silinfo$avg.width})

8- Construcción de un «data frame».

< sil_df<-data.frame( k=2:40, sil_width= sil_width)

9- Ver el consolidado de clúster «Número de Clúster - nc»

< sil_df

Asignar al modelo < model<-pam(x=gowerdis,k= nc)


10- Conteo de número de casos

< segments<-mutate(clustervar,cluster=clust ”nc”)

Base final por segmento

¡Gracias!

Alexander Devia BetancourAsesor Experto en PALATCm. +57 (316) 525 8352

www.riesgocero.com

de clientes - segmentacion

Documents