de clientes - segmentacion
TRANSCRIPT
Técnicas de monitoreo de clientes -segmentacion
PRÁCTICAS ANTI LAVADO DE ACTIVOS, FINANCIACION DEL TERRORISMO Y CORRUPCION - PALATC
Agenda
1. Principios estadísticos.
2. La segmentación como herramienta de monitoreo.
3. Alcance de la segmentación.
4. Modelos estadísticos aplicables.
5. Uso de herramientas estadísticas para la segmentación de los factores de riesgo.
La Estadística es la rama de las matemáticas queestudia la variabilidad, así como el procesoaleatorio que la genera siguiendo leyes deprobabilidad.
Su resultado basa su éxito en el ordenamiento, elanálisis e interpretación de datos generados en lavaloración de hechos, individuos, datos, paradeducir de ello conclusiones precisas,probabilidades o estimaciones futuras.
La estadística se fundamenta enaspectos asociados a:
Principios estadísticos
Eventos determinísticos / se conoce el resultado
de la situación
Definir la población - determinar la muestra y aplicar la técnica
Eventos aleatorios / se desconoce el resultado final
Técnicas de análisis
Distribución NORMAL – BINOMIAL -POISSON
Variables cualitativas y cuantitativas – Continuas y discretas –
Dependientes e independientes
Muestreo
PROCESO DE
SEGMENTACION
MODELOS
ESTADISTICOS
La segmentación y la estadística
CBJ: Es el proceso por medio del cual se lleva a cabo laseparación de elementos en grupos homogéneos alinterior de ellos y heterogéneos entre ellos. Laseparación se fundamenta en el reconocimiento dediferencias significativas en sus características(variables de segmentación).
❑ Consolidación de cierta información❑ Sistematización de esos datos❑ Evaluación del resultado
Clasificar
Que no es segmentar
RIESGO ALTO
RIESGO MEDIO
RIESGO BAJO
Que no es segmentar
Combinar
Trasladar
Foto estática
Segmentar es
AGRUPAR
Razonamiento I
Para que el proceso de segmentación puedadeterminar lógicamente la detección deoperaciones inusuales, es indispensable conocer:
Pasado Transaccional ( )
Futuro transaccional ( )
Respuesta
Alcance de lasegmentación
Reglas de relevancia
Minería de datos
METODOLOGIA CRISP-DM
Minería de datos
METODOLOGIA CRISP-DM
Fase Inicial
Cumplimiento de objetivos
Alcance de los productos
Mercado Objetivo
Colección de datos inicial
Identificación de problemas
Conocimiento de datos
Planteamiento para el mejoramiento
Minería de datos
METODOLOGIA CRISP-DM
Selección de tablas y atributos
Transformación de datos
Limpieza de los datos
Recalibrar la preparación
Aplicación de técnicas entendimiento
de grupo de datos
Calibración de valores óptimos
Minería de datos
METODOLOGIA CRISP-DM
Comparación del modelo Vs
Objetivos
Revisión de cumplimiento de
los pasos anteriores
Despliegue del modelo
Supervisión del resultado
Herramientas estadísticaspara la segmentación de losfactores de riesgo
Modelos estadísticos aplicables
La segmentación como herramienta de monitoreo
(…) Las entidades deben segmentar sus
clientes de acuerdo con las características
particulares de cada uno de ellos,
garantizando homogeneidad al interior de
los segmentos y heterogeneidad entre ellos.
(…)
Análisis de conglomerados (clúster)
Es un método estadístico que permite formar grupos de
elementos (clientes) utilizando sus características (ingreso,
monto de las transacciones, frecuencia de operación, etc.).
Metodología aglomerativa
Rangos transaccionales
homogéneos
Valores financieros cercanos
Asignación de segmentos
heterogéneos
1
2
3
ANALISIS DE RESULTADOS
$
%
#
T
P
Metodología Jerárquica
Técnica que permite
encontrar patrones de
comportamiento basados en un
conjunto de variables
independientes. “Mapa” de los
posibles resultados de una serie
de decisiones relacionadas.
Arboles de Clasificación
Redes Neurales
Categorizan grandes
cantidades de datos mediante
su representación en un mapa
bidimensional, que muestra las
similitudes de los datos, de tal
modo que datos similares
aparecen representados en
regiones contiguas o
adyacentes.
Self-Organizing Maps - SOM
Análisis log-lineal
•Análisis log-lineal: Analiza la
relación entre variables
dependientes (o de respuesta) y
variables independientes (o
explicativas). Las variables
dependientes siempre son
categóricas, mientras que las
variables independientes pueden
ser o no categóricas (factores).
Razonamiento IILa segmentación se aplica a cada uno de losfactores de riesgo o a la base general de clientespara luego determinar el factor de riesgoinfluyente:
Falso ( ) Verdadero ( )
Respuesta
Uso de Herramientas estadísticas
Caso de negocio
❑K- means
Ejemplo de algoritmo en “R”
Definición de las variables utilizadas en la base de datos
TIPO ID
NUMERO
DESCRIPCION PRODUCTO
TIPO DE CLIENTE
NATURALEZA
NICHO
ACTIVIDAD ECONOMICA
CATEGORIA ACTIVIDAD
CANAL DE DISTRIBUCION
ZONA O JURISDICCION
CANTIDAD CREDITOS
VALOR DE CREDITOS
CANTIDAD DEBITOS
VALOR DE DEBITOS
VALOR INGRESOS
VALOR EGRESOS
Cargue de comandos en «R»
Instalación R versión 3.4.0 en adelante.
1- Importación del archivo
> setwd «ruta y nombre del archivo»
> library(readxl)
> Pn<-read_excel «nombre del archivo y de la hoja a usar»
2- Cargar el paquete o librería en «r»
> library(dplyr)
Ejecución comandos «R»
3- Selección de variables.
< clustervar<-select(Pn, 'NUMERO ID', 'NATURALEZA', 'CATEGORIA
ACTIVIDAD', 'CANAL', 'JURISDICCION','CREDITOS', 'CANTIDAD, etc)
4- Cargar el paquete «cluster».
< library(cluster)
5- Se calcula la distancia de los datos con gowerdis <- daisy(clustervar[,-1],
metric = c("gower"))
6- Cargar paquete < library(purrr)
Ejecución comandos «R»
7- Cálculo de clúster. (1 es buen cluster)
< sil_width<-map_dbl(2:40,function(k){
model<-pam(x=gowerdis,k=k)
model$silinfo$avg.width})
8- Construcción de un «data frame».
< sil_df<-data.frame( k=2:40, sil_width= sil_width)
9- Ver el consolidado de clúster «Número de Clúster - nc»
< sil_df
Asignar al modelo < model<-pam(x=gowerdis,k= nc)
Ejecución comandos «R»
10- Conteo de número de casos
< segments<-mutate(clustervar,cluster=clust ”nc”)
Ejecución comandos «R»
Base final por segmento
¡Gracias!
Alexander Devia BetancourAsesor Experto en PALATCm. +57 (316) 525 8352
www.riesgocero.com