sistema para la verificaciÓn automÁtica de firmas ... · sep snest dgest instituto tecnolÓgico...

118
SEP SNEST DGEST INSTITUTO TECNOLÓGICO DE TOLUCA SISTEMA PARA LA VERIFICACIÓN AUTOMÁTICA DE FIRMAS AUTÓGRAFAS TESIS QUE PARA OBTENER EL GRADO DE MAESTRÍA EN: CIENCIAS, EN CIENCIAS DE LA COMPUTACIÓN PRESENTA: LUIS MANUEL FLORES SOBERÓN ASESOR: DR. EDUARDO GASCA ALVAREZ METEPEC, EDO. DE MÉXICO, OCTUBRE DE 2012

Upload: duongnhan

Post on 15-Oct-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

  • SEP SNEST DGEST

    INSTITUTO TECNOLGICO DE TOLUCA

    SISTEMA PARA LA VERIFICACIN AUTOMTICA DE FIRMAS

    AUTGRAFAS

    T E S IS

    QUE PARA OBTENER EL GRADO DE MAESTRA EN:

    CIENCIAS, EN CIENCIAS DE LA COMPUTACIN

    PRESENTA:

    LUIS MANUEL FLORES SOBERN

    ASESOR:

    DR. EDUARDO GASCA ALVAREZ

    METEPEC, EDO. DE MXICO, OCTUBRE DE 2012

  • i

    Agradecimientos

    En primer lugar, agradezco a mi esposa por brindarme la paciencia, apoyo y

    motivacin necesarios para poder llevar a cabo este proyecto.

    A mis padres, por haber estado presentes en todo momento para guiarme y

    apoyarme. Sin su ejemplo, gua y ayuda, sera simplemente impensable estar aqu y

    ahora.

    A mis hermanas por apoyarme incondicionalmente.

    Agradezco tambin al Doctor Eduardo Gasca la confianza brindada al aceptar ser mi

    asesor de tesis as como la gua que siempre estuvo dispuesto a dar para llevar a

    buen puerto el desarrollo del presente trabajo.

    Este perodo de tiempo me deja un gran aprendizaje, no slo acadmicamente sino

    tambin personalmente y eso slo es posible por la gran calidad humana de las

    personas con las que trat, tanto alumnos como profesores. Es por ello que tengo

    que agradecer a mis revisores de tesis, los doctores Pacheco, Sergio y No, por

    tomarse el tiempo necesario para hacer que creciera mi proyecto as como a mis

    profesores, el Dr. Gasca, la Mtra. Julieta, el Dr. Pacheco, el Dr. Celso, el Mtro.

    Rafael, la Dr. Citlali y la Mtra. Itzel por la amistad brindada, por compartir sus

    conocimientos y experiencia en el saln de clase, por haber tenido el objetivo tan

    claro de hacernos crecer acadmica y profesionalmente y, sin darse cuenta, por

    haber enriquecido mi vida personal al compartir pensamientos, puntos de vista,

    experiencias, ancdotas de sus vidas personales, o simplemente, por servir como

    ejemplo de lo que es hacer bien las cosas.

    Por ltimo agradezco a mis amigos Roco, Cesar, Jimmy y Omar con los cuales

    compart esta etapa de mi vida por haberme ofrecido su amistad.

  • ii

    DEDICATORIA

    A mis padres, esposa e hijos que vienen en camino.

  • iii

    RESUMEN

    En el presente proyecto se propone y examinan los resultados de un sistema que

    utiliza para la representacin de firmas autgrafas digitalizadas, una nueva

    caracterstica no reportada en la bibliografa que sirve de base al presente proyecto,

    la cual est formada por los coeficientes de la Transformada Wavelet obtenidos de

    su aplicacin a los puntos borde de distintos trazos de la firma en conjunto con una

    serie de caractersticas existentes en la literatura consultada las cuales son la

    relacin altura-anchura, la entropa, la mxima, la energa, el rea de la firma, el

    nmero de puntos borde y el nmero de puntos de interseccin. Como clasificador se

    ha utilizado una Red Neuronal Artificial del tipo Perceptron Multicapa con una

    topologa de 4 nodos en la capa oculta y 2 nodos en la capa de salida entrenada

    utilizando el algoritmo BackPropagation con un valor de 0.7 como razn de

    aprendizaje y 0.9 como momento.

    Las caractersticas existentes utilizadas, han sido tomadas de distintos trabajos en

    los que las han utilizado de manera individual o en conjunto con caractersticas no

    presentadas en el presente proyecto, es decir, la combinacin de caractersticas

    existentes utilizadas no ha sido reportada en la literatura consultada, por su parte, la

    nueva caracterstica propuesta se basa en los puntos iniciales y finales de los trazos

    tomados en cuenta por la grafoscopa siendo stos de inters por su dificultad para

    ser falsificados. Como se ya se mencion, para la representacin de estos ltimos,

    se utiliza la Transformada Wavelet.

    Los experimentos realizados dieron mejores resultados para el uso exclusivo de la

    combinacin de caractersticas ya existentes que cuando se hizo uso de las

    caractersticas obtenidas por medio de la Transformada Wavelet.

  • iv

    Abstract

    In this project it is proposed and analyzed the results of a system that represents the

    written signatures using a new feature that does not exist in the literature that was

    consulted. This new feature uses the coeficients of the Wavelet Transform applied to

    the final points of the different strokes of the signature. This new feature is also used

    in combination with a set of existing features such as height to width ratio (aspect

    ratio), entropy, maximum, energy, signature area, number of final points and the

    number of intersection points. As a classifier, an Artificial Neural Network Multilayer

    Perceptron was used with a topology of 4 hidden units and two output units using

    BackPropagation Algorithm to train it with a value of 0.7 as learning rate and 0.9 as

    momentum.

    The existing features have been taken from different papers, this means that they

    haven't been used in combination before. The new feature proposed, is based on the

    start and end points of the signature strokes used in graphology. These points are of

    interest because of the difficult to be counterfeited. As already mentioned, these

    points are represented using the Wavelet Transform.

    The different experiments show better results using exclusively the set of existing

    features than those results showed when including the new proposed feature.

  • v

    NDICE TEMTICO

    1 CAPTULO I ......................................................................................................... 1

    1.1 INTRODUCCIN ........................................................................................... 1

    1.2 OBJETIVOS ................................................................................................... 6

    1.3 CONTRIBUCIN............................................................................................ 7

    1.4 ORGANIZACIN............................................................................................ 8

    2 CAPTULO II ........................................................................................................ 9

    2.1 MARCO TERICO......................................................................................... 9

    2.2 WAVELETS .................................................................................................... 9

    2.2.1 Wavelet Daubechies .............................................................................. 11

    2.3 RECONOCIMIENTO DE PATRONES ......................................................... 13

    2.3.1 Enfoque estadstico ............................................................................... 14

    2.4 REDES NEURONALES ARTIFICIALES ...................................................... 17

    2.4.1 Modelo Biolgico ................................................................................... 19

    2.4.2 Neurona Artificial ................................................................................... 21

    2.4.3 Perceptron Simple ................................................................................. 23

    2.4.4 Perceptron Multicapa ............................................................................. 26

    2.5 PROCESAMIENTO DE IMGENES DIGITALES ........................................ 28

    2.5.1 Binarizacin ........................................................................................... 29

    2.5.2 Esqueletizacin ...................................................................................... 30

    2.5.3 Correlacin ............................................................................................ 34

    2.6 GRAFOSCOPA ........................................................................................... 36

  • vi

    2.7 SISTEMAS AUTOMTICOS DE VERIFICACIN DE FIRMAS ................... 43

    2.7.1 Caractersticas ....................................................................................... 45

    2.7.2 Clasificador ............................................................................................ 54

    3 CAPTULO 3 ...................................................................................................... 56

    3.1 MTODO ..................................................................................................... 56

    3.1.1 Base de Datos ....................................................................................... 58

    3.1.2 Formacin de los Patrones .................................................................... 59

    3.1.3 Definicin de Topologas de las RNA .................................................... 71

    3.1.4 Mtodos de Evaluacin de las RNA ...................................................... 72

    4 CAPTULO 4 ...................................................................................................... 77

    4.1 EXPERIMENTOS ......................................................................................... 77

    4.1.1 Experimento #1: Uso de una sola RNA con dos clases para todas las

    firmas 77

    4.1.2 Experimento #2: Uso de una sola RNA con dos nodos de salida por firma

    77

    4.1.3 Experimento #3: Uso de una RNA con dos nodos de salida por firma .. 78

    4.1.4 Experimento #4: Uso de una RNA con dos nodos de salida por firma

    usando nicamente la combinacin de caractersticas existentes ..................... 78

    4.2 RESULTADOS ............................................................................................. 79

    4.2.1 Experimento #1: Uso de una sola RNA con dos clases para todas las

    firmas 79

    4.2.2 Experimento #2: Uso de una sola RNA con dos nodos de salida por firma

    80

    4.2.3 Experimento #3: Uso de una RNA con dos nodos de salida por firma .. 82

  • vii

    4.2.4 Experimento #4: Uso de una RNA con dos nodos de salida por firma

    usando nicamente la combinacin de caractersticas existentes ..................... 83

    4.3 SISTEMA PROPUESTO .............................................................................. 85

    5 CAPTULO 5 ...................................................................................................... 93

    5.1 CONCLUSIONES......................................................................................... 93

    5.2 TRABAJOS FUTUROS ................................................................................ 94

    6 APNDICES ...................................................................................................... 96

    6.1 APNDICE A - MatLab ................................................................................ 97

    6.2 APNDICE B - NeuroSolutions .................................................................... 98

    6.3 APNDICE C - Microsoft Visual Studio ........................................................ 99

    7 REFERENCIAS BIBLIOGRFICAS ................................................................. 100

  • viii

    NDICE DE FIGURAS

    FIGURA 2.1. GRFICA DE LA FUNCIN COSENO Y DE LA FUNCIN WAVELET

    MADRE DAUBECHIES 20 ........................................................................................ 10

    FIGURA 2.2. WAVELET MADRE DAUBECHIES ...................................................... 12

    FIGURA 2.3. FRONTERA DE DECISIN ................................................................. 15

    FIGURA 2.4. NEURONA BIOLGICA ...................................................................... 19

    FIGURA 2.5. NEURONA ARTIFICIAL. ...................................................................... 21

    FIGURA 2.6. FUNCIN DE ACTIVACIN LINEAL .................................................. 22

    FIGURA 2.7. FUNCIN DE ACTIVACIN ESCALN .............................................. 23

    FIGURA 2.8. FUNCIN DE ACTIVACIN SIGMOIDE ............................................. 23

    FIGURA 2.9. ARQUITECTURA DEL PERCEPTRON MULTICAPA ......................... 26

    FIGURA 2.10. IMAGEN EN ESCALA DE GRISES E IMAGEN BINARIZADA .......... 29

    FIGURA 2.11. ESQUELETO DE LA LETRA H. ......................................................... 30

    FIGURA 2.12. EJEMPLO DE PIXELES CENTRALES Y FINALES ........................... 33

    FIGURA 2.13. FIGURA PARA EVALUACIN DE CONDICIONES 3 Y 4 ................. 34

    FIGURA 2.14. IMAGEN DE 4x5 ................................................................................ 34

    FIGURA 2.15. MSCARA DE 3x3 ............................................................................ 35

    FIGURA 2.16. APLICACIN KERNEL ...................................................................... 35

    FIGURA 2.17. PROCESO SIGNATRIZ ..................................................................... 37

    FIGURA 2.18. PUNTO DE ATAQUE RECTO ........................................................... 40

    FIGURA 2.19. PUNTO DE ATAQUE REDONDEADO .............................................. 41

    FIGURA 2.20. PUNTO DE ATAQUE IMPERCEPTIBLE ........................................... 41

    FIGURA 2.21. ESTRUCTURA DE UN SISTEMA DE R.P. ........................................ 43

    FIGURA 2.22. FACULTAD HOMOTETICA ............................................................... 47

  • ix

    FIGURA 2.23. VALORES DE ANCHURA Y ALTURA EN UNA FIRMA DIGITAL ..... 47

    FIGURA 2.24. ENTROPA EN IMAGEN DE UN SOLO COLOR ............................... 50

    FIGURA 2.25. ENTROPA EN IMAGEN CON DOS COLORES ............................... 50

    FIGURA 2.26. MXIMA ............................................................................................. 51

    FIGURA 2.27. RESULTADOS DE APLICAR EL ALGORITMO DE MXIMA A UNA

    FIRMA ....................................................................................................................... 52

    FIGURA 2.28. PUNTOS BORDE .............................................................................. 53

    FIGURA 2.29. PUNTOS DE INTERSECCIN. ......................................................... 53

    FIGURA 3.1. EJEMPLOS DE FIRMAS DE LA BASE DE DATOS. ........................... 59

    FIGURA 3.2. DIAGRAMA DE ALTO NIVEL DEL PROCESO DE EXTRACCIN DE

    CARACTERSTICAS. ................................................................................................ 60

    FIGURA 3.3. IMAGEN EN ESCALA DE GRISES. .................................................... 62

    FIGURA 3.4. IMAGEN BINARIZADA CON UMBRAL 0.8.......................................... 62

    FIGURA 3.5. IMAGEN BINARIZADA CON UMBRAL 0.95........................................ 62

    FIGURA 3.6. IMAGEN BINARIZADA CON UMBRAL 0.91........................................ 63

    FIGURA 3.7. IMAGEN EN ESCALA DE GRISES Y SU ESQUELETO ..................... 65

    FIGURA 3.8. MSCARA APLICADA PARA OBTENER PUNTOS BORDE Y DE

    INTERSECCIN. ...................................................................................................... 66

    FIGURA 3.9. EJEMPLOS DE ENTROPA EN 4 DIFERENTES IMGENES ............ 67

    FIGURA 3.10. EJEMPLO DE OBTENCIN DE PUNTOS BORDE .......................... 68

    FIGURA 3.11. COEFICIENTES DE DAUBECHIES 2 DE UNA IMAGEN DE 20 POR

    20 PIXELES .............................................................................................................. 69

    FIGURA 3.12. DIAGRAMA DE VALIDACIN CRUZADA ......................................... 73

    FIGURA 3.13. ERRORES COMETIDOS POR LA RED EN LOS CONJUNTOS DE

    ENTRENAMIENTO Y DE VALIDACIN CRUZADA ................................................. 75

  • x

    FIGURA 4.1. DIAGRAMA DE FLUJO DEL SISTEMA ............................................... 86

    FIGURA 4.2. ARQUITECTURA DE ALTO NIVEL DEL SISTEMA ............................ 86

    FIGURA 4.3. EJEMPLO DE CONFIGURACIN DEL CATLOGO DE FIRMAS DEL

    SISTEMA................................................................................................................... 88

    FIGURA 4.4. PANTALLA INICIAL DEL SISTEMA DE VERIFICACIN DE FIRMAS 89

    FIGURA 4.5. DROP DOWN DE FIRMAS DEL CATLOGO ..................................... 90

    FIGURA 4.6. EJEMPLO DE IMAGEN DE MUESTRA ACTUALIZADA AL CAMBIAR

    LA SELECCIN DE FIRMA DEL CATLOGO ......................................................... 90

    FIGURA 4.7. EJEMPLO DE SELECCIN DE IMAGEN A VERIFICAR .................... 91

    FIGURA 4.8. IMAGEN A VERIFICAR SE MUESTRA EN LA PARTE DERECHA DE

    LA PANTALLA DEL SISTEMA .................................................................................. 91

    FIGURA 4.9. PANEL DE RESULTADOS ACTUALIZADO ........................................ 92

  • xi

    NDICE DE TABLAS

    TABLA 2.1. VALORES DE PK PARA LA WAVELET MADRE DAUBECHIES .......... 12

    TABLA 2.2. EJEMPLO 1: CLCULO ENTROPA ..................................................... 48

    TABLA 2.3. EJEMPLO 2: CLCULO ENTROPA ..................................................... 49

    TABLA 2.4. EJEMPLO 3: CLCULO ENTROPA ..................................................... 49

    TABLA 3.1. TOPOLOGAS DE RNA A EVALUAR .................................................... 72

    TABLA 3.2. EJEMPLO DE EXPERIMENTOS DE VALIDACIN CRUZADA ............ 74

    TABLA 3.3. EJEMPLO DE MATRIZ DE CONFUSIN .............................................. 76

    TABLA 3.4. MATRIZ DE CONFUSIN DE EJEMPLO PARA CLCULO DE FAR Y

    FRR ........................................................................................................................... 76

    TABLA 4.1. PORCENTAJE DE ACIERTOS OBTENIDOS PARA EL CONJUNTO C1

    EVALUANDO LA POSIBILIDAD DE UTILIZAR DOS CLASES ................................. 79

    TABLA 4.2. PORCENTAJE DE ACIERTOS OBTENIDOS PARA EL CONJUNTO C2

    EVALUANDO LA POSIBILIDAD DE UTILIZAR DOS CLASES ................................. 79

    TABLA 4.3. MATRIZ DE CONFUSIN OBTENIDA EN LOS PRIMEROS 4

    EXPERIMENTOS ...................................................................................................... 80

    TABLA 4.4. MATRIZ DE CONFUSIN TOPOLOGAS 7 y 8 SEGUNDO

    EXPERIMENTO ........................................................................................................ 80

    TABLA 4.5. MATRIZ DE CONFUSIN TOPOLOGA 3 SEGUNDO EXPERIMENTO

    .................................................................................................................................. 81

    TABLA 4.6. MATRIZ DE CONFUSIN TOPOLOGA 4 SEGUNDO EXPERIMENTO

    .................................................................................................................................. 81

    TABLA 4.7. MATRIZ DE CONFUSIN TOPOLOGAS 1,2,5 y 6 USANDO UNA RNA

    POR FIRMA .............................................................................................................. 82

  • xii

    TABLA 4.8. DESVIACIONES ESTNDAR EXPERIMENTO VALIDACIN SIN

    WAVELETES ............................................................................................................ 83

    TABLA 4.9. RESULTADOS FINALES ....................................................................... 83

    TABLA 4.9. RESULTADOS FINALES (Continuacin) ............................................... 84

  • xiii

    LISTADO DE ACRNIMOS

    A continuacin se listan los acrnimos utilizados a lo largo de este documento:

    Acrnimo Significado

    IA Inteligencia Artificial

    RP Reconocimiento de Patrones

    RNA Red Neuronal Artificial

    FRR False Rejection Rate (Porcentaje de Falsos Rechazos)

    FAR False Acceptance Rate (Porcentaje de Falsas

    Aceptaciones)

    HMM Hidden Markov Model (Modelos Ocultos de Markov)

    VC Validacin Cruzada

    VCM Validacin Cruzada Modificada

    DLL Dynamic Link Library

    GUIDE Graphical User Interface Development Environment

    NS NeuroSolutions

    PB Punto Borde

    PI Punto de Interseccin

    ET Entropa

    A rea

    EV Energa Vertical

  • xiv

    EH Energa Horizontal

    W Width

    H Height

    RHV Relacin entre Energa en Diagonal Izquierda-Derecha y

    Relacin entre Energa en Diagonal Derecha-Izquierda

    CW Coeficiente Wavelet

  • 1

    1 CAPTULO I

    1.1 INTRODUCCIN

    Las computadoras se han utilizado desde sus inicios para asistir al ser humano en la

    realizacin de tareas repetitivas que, realizadas por el ser humano, resultan tardadas

    y propensas a errores.

    Con el paso del tiempo, ciencias como la Electrnica, Computacin, Fsica y

    Matemticas, entre otras, avanzan permitiendo utilizar la computadora para realizar

    tareas cada vez ms diversas. Adems del desarrollo que se da en la capacidad de

    almacenamiento y procesamiento por parte de las computadoras, se da tambin un

    avance muy importante dentro de diversas ramas del rea del software como lo son

    la teora de compiladores, bases de datos, grficas por computadora, algoritmos y

    estructuras de datos y computacin cientfica entre otras.

    En la dcada de los 40 y 50, surgen los primeros programas que simulan el

    razonamiento humano, originando con ello, el surgimiento de la Inteligencia Artificial

    (IA) [Jones08]. El principal reto de la IA es construir programas que puedan llevar a

    cabo tareas que se perciben como propias del ser humano. Dos de las

    caractersticas principales de los problemas que suelen ser resueltos mediante

    tcnicas de IA son que presenten variabilidad y que no haya manera de expresar su

    solucin como una serie de pasos secuenciales como se hace en los algoritmos de la

    computacin tradicional.

    El sistema descrito en el presente proyecto cae precisamente en esta rea ya que

    una persona nunca realiza dos firmas idnticas por lo que requiere de tcnicas de IA

    para poder ser modelado en una computadora.

    Desarrollar un sistema automtico de verificacin de firmas autgrafas es importante

    ya que actualmente, uno de los medios ms difundidos de identificacin personal es

  • 2

    precisamente la firma, la cual es utilizada ampliamente por toda la poblacin para dar

    fe de acuerdo y conformidad de toda clase de documentos; contratos, recepcin y

    expedicin de documentos entre otros [McCabe08] [Orellana75]. Debido a que es un

    medio tan ampliamente utilizado, la verificacin de firmas para transacciones

    importantes supone un gran consumo de tiempo por parte del ser humano que, al ser

    automatizada, se traduce en un aumento en la productividad [McCabe08].

    Los sistemas de verificacin de firmas autgrafas son estudiados en el campo de la

    biometra el cual se enfoca en encontrar mtodos automticos para la identificacin

    de personas basados en rasgos conductuales o fsicos intrnsecos. El trmino

    proviene del griego bios vida y metron medida y la informtica recurre a ella para

    encontrar mtodos de autenticacin de usuarios, como por ejemplo; lectores de

    huellas digitales, lectores de iris, patrones faciales y geometra de la mano entre

    otros [Vaca07].

    Los sistemas de verificacin de firmas en particular, se basan en el hecho de que

    cada firma contiene rasgos nicos que identifican de manera inequvoca a la persona

    que la expide. Estos rasgos son principalmente conductuales pero tambin

    intervienen rasgos fisiolgicos como si la persona es zurda o derecha [Kholmatov03]

    [Orellana75]. Pueden funcionar dinmicamente (on-line) o estticamente (off-line),

    estos ltimos con base a imgenes de firmas previamente digitalizadas. Por el primer

    mtodo, se pueden obtener caractersticas de la firma que estn en funcin del

    tiempo como pueden ser la velocidad, el tiempo total en el que se escribe la firma, el

    cambio de presin con respecto al tiempo o a los diferentes trazos de la firma entre

    otros [Leclerc94].

    Por el mtodo esttico, las caractersticas dinmicas de la firma se pierden, por

    ejemplo, no se puede saber cunto tiempo se tard la persona en firmar pero se

    conservan caractersticas propias de la imagen como son la proporcin entre altura y

    anchura, el ngulo de orientacin de la firma, entre otras [Plamondon94], sin

    embargo, estos sistemas son los ms prcticos ya que no se requiere de los

  • 3

    dispositivos electrnicos necesarios para los sistemas en lnea. El sistema que se

    estudia en esta investigacin, pertenece al grupo de sistemas off-line o estticos por

    lo que requiere ser alimentado por una imagen digital.

    Esta particularidad que se presenta de llevar a cabo una identificacin personal con

    base en rasgos conductuales o fsicos, hace que el desarrollo de este tipo de

    sistemas pueda ser tratado de manera eficiente por la rama de la IA conocida como

    Reconocimiento de Patrones (RP) la cual era inicialmente tratada por la rama de la

    teora estadstica pero, con la evolucin del poder de cmputo de los equipos

    modernos, se increment la demanda de aplicaciones prcticas lo que desemboc

    en una necesidad de nuevos desarrollos tericos. En la actualidad, el

    Reconocimiento de Patrones es de gran importancia en aplicaciones de ingeniera,

    medicina, minera de datos y manufactura, entre otros, es decir, el Reconocimiento

    de Patrones es parte integral de la mayora de los sistemas Inteligentes

    [Theodoridis08].

    Las tareas de RP consisten en realizar un mapeo de un conjunto de datos de entrada

    con un conjunto de posibles salidas. Por lo general, este mapeo se modela a travs

    de una funcin matemtica que contiene cierto nmero de parmetros ajustables y

    cuyos valores son determinados con la ayuda de datos de ejemplo denominados

    muestras de entrenamiento. Existen bsicamente dos tipos de tareas de RP las

    cuales se denominan de clasificacin y de regresin. En los problemas de

    clasificacin, el objetivo es asignar los datos de entrada a una clase de un conjunto

    discreto de posibles clasificaciones. Por su parte, en los problemas de regresin, las

    posibles salidas representan valores de variables continuas. Un ejemplo de problema

    de clasificacin puede ser el reconocimiento de caracteres manuscritos mientras que

    un ejemplo de un problema de regresin puede ser la prediccin de la tasa de

    cambio de una moneda en el futuro. El sistema descrito en el presente proyecto, cae

    dentro de la categora de problemas de clasificacin.

  • 4

    Bsicamente, los sistemas de reconocimiento de patrones toman como entrada un

    conjunto de medidas que representan las caractersticas de un objeto o

    comportamiento a ser clasificado y que son obtenidas a partir de imgenes o

    seales. En nuestro caso particular, debemos extraer, a partir de la imagen digital

    que contiene la firma a ser clasificada, un conjunto de medidas que cuantifiquen las

    caractersticas que permitan representar a la firma. Adicionalmente, los sistemas de

    RP pueden realizar algn tipo de procesamiento sobre los datos de entrada de

    manera que se facilite el proceso de clasificacin y por ltimo, realizan un proceso en

    el cul clasifican la entrada en una clase dada.

    Existen dos tipos de sistemas, los no supervisados y los supervisados; la diferencia

    entre ambos es que los supervisados, para poder realizar esta clasificacin, deben

    ser previamente entrenados mediante algn algoritmo de aprendizaje mientras que

    los no supervisados no requieren este entrenamiento previo siendo utilizados para

    descubrir relaciones entre los patrones no siempre evidentes a simple vista. Ya que

    los sistemas supervisados requieren ser entrenados previamente, es indispensable

    tener a la mano una serie de ejemplos con los cuales llevar a cabo dicho

    entrenamiento. En el caso de nuestro sistema, se obtuvo una base de datos de

    imgenes digitales de firmas autgrafas con la cual llevar a cabo el entrenamiento.

    Para realizar la clasificacin, los sistemas de RP pueden utilizar distintos mtodos

    como son Funciones Discriminantes Redes Neuronales Artificiales (RNA). Las RNA

    intentan simular el comportamiento de los sistemas nerviosos biolgicos y son

    particularmente tiles para problemas cuya solucin no puede ser expresada

    mediante una serie de pasos bien definidos. Ejemplos de aplicaciones en las que las

    RNA realizan un buen trabajo de acuerdo a [Heaton08] son las siguientes:

    Clasificacin

    Agrupamiento

    Optimizacin

    Prediccin

  • 5

    El sistema descrito en el presente proyecto, hace uso de tcnicas de RP para llevar a

    cabo la clasificacin de firmas autgrafas utilizando una RNA entrenada mediante

    tcnicas de Aprendizaje Supervisado.

    En cuanto a la representacin de las firmas, se ha optado por utilizar una

    combinacin no reportada en la literatura consultada de caractersticas ya existentes

    y adems, se propone una nueva caracterstica basada en el concepto de puntos

    iniciales y finales de trazos encontrada en la grafoscopa.

    Para la extraccin de las primeras, se hace uso de tcnicas de Procesamiento de

    Imgenes Digitales mientras que para la caracterstica nueva, se utiliza la

    Transformada Wavelet.

  • 6

    1.2 OBJETIVOS

    La diferencia en el avance que se ha dado entre los sistemas estticos y dinmicos

    es muy grande. Mientras que los sistemas dinmicos han logrado resultados con

    muy bajos porcentajes de error, los estticos siguen an obteniendo porcentajes de

    error ms grandes lo que los hace poco prcticos para aplicaciones reales

    [Leclerc94], sin embargo, son precisamente los sistemas estticos los que resultan

    ms atractivos para aplicaciones prcticas debido a que son ms fciles de

    implementar ya que no requieren dispositivos electrnicos especiales y slo

    necesitan como entrada, una imagen digital de la firma a analizar.

    De esta necesidad, surge el actual proyecto el cul se enfoca en un mtodo esttico

    para la verificacin de firmas explorando el uso de la Transformada Wavelet en

    conjunto con las caractersticas propias de los mtodos estticos a saber: altura,

    anchura y centro entre otras. Como clasificador se emplear una Red Neuronal

    Artificial.

    Los objetivos planteados para este proyecto son los siguientes:

    Proponer un sistema que permita clasificar una firma como autntica o falsa.

    Utilizar Wavelets en la Representacin del Patrn de una Firma.

    Proponer una combinacin de caractersticas existentes no reportada en la

    literatura consultada.

    Mezclar las caractersticas obtenidas mediante el uso de Wavelets con la

    combinacin propuesta de caractersticas ya existentes.

    Utilizar una Red Neuronal Artificial para llevar a cabo la clasificacin.

  • 7

    1.3 CONTRIBUCIN

    En esta investigacin se ha realizado lo siguiente:

    Se propuso encontrar los puntos borde de los diferentes trazos en la firma

    como una nueva caracterstica no encontrada en la literatura revisada.

    La representacin de la nueva caracterstica propuesta se realiz mediante el

    uso de la Transformada Wavelet.

    Se propuso una combinacin no reportada en la literatura consultada de

    caractersticas ya existentes.

    Se combin la nueva caracterstica con la combinacin propuesta de

    caractersticas tradicionales encontradas en la literatura revisada.

    Se hizo uso de una RNA para llevar a cabo la clasificacin utilizando, en

    concreto, una red de tipo Perceptron Multicapa entrenada mediante el

    algoritmo BackPropagation.

    En resumen, en este documento se describe cmo se consigui implementar la

    nueva caracterstica, utilizarla en conjunto con las dems caractersticas ya

    existentes en la literatura consultada para llevar a cabo la clasificacin de firmas

    autnticas o falsas mediante el uso de una Red Neuronal Artificial.

  • 8

    1.4 ORGANIZACIN

    En el captulo dos se encuentra la teora que soporta la presente investigacin la cual

    comienza con una breve introduccin a las wavelets, definiendo en particular, las

    wavelets de la familia de Daubechies. El captulo contina exponiendo de manera

    breve lo que es el Reconocimiento de Patrones seguido por la teora de las Redes

    Neuronales Artificiales donde se introduce la red ms sencilla conocida como

    Perceptron para dar paso al modelo ms complejo del Perceptron Multicapa. A

    continuacin se trata el Procesamiento de Imgenes Digitales explicando los

    conceptos de binarizacin, filtrado lineal por correlacin y esqueletizacin; en

    particular, describiendo el mtodo propuesto en [Zhang84] para obtener el esqueleto

    de una imagen. Al finalizar con el tema de Procesamiento de Imgenes Digitales, se

    describen los principios de la disciplina de la Grafoscopa y por ltimo, se da una

    introduccin a los Sistemas de Verificacin Automtica de Firmas.

    En el captulo tres y cuatro, se describe el mtodo seguido en la presente

    investigacin as como los resultados obtenidos y la descripcin del sistema

    desarrollado mientras que el captulo cinco, por su parte, presenta las conclusiones y

    sugiere una serie de propuestas para continuar con el proyecto.

    Al final se puede encontrar una serie de apndices donde se describe el software

    utilizado para la realizacin del sistema propuesto.

  • 9

    2 CAPTULO II

    2.1 MARCO TERICO

    En este captulo se expone la teora que fundamenta la presente investigacin

    comenzando con una breve introduccin a las wavelets seguida por la teora de RNA

    utilizada para llevar a cabo este proyecto. El resto del captulo est dedicado al

    Procesamiento de Imgenes Digitales, Grafoscopa y Sistemas Automticos de

    Verificacin de Firmas.

    2.2 WAVELETS

    Las expansiones trigonomtricas surgieron en el siglo 18 durante estudios de

    vibracin de cuerdas y otros fenmenos similares pero no fueron tratadas de una

    manera sistemtica sino hasta que, en 1808, Jospeh Fourier escribi "Thorie

    Analytique de la Chaleur" (Teora Analtica del Cal or) , donde realiz un estudio

    detallado de las series trigonomtricas las cuales utiliz para resolver varios

    problemas relacionados con la conduccin de calor. Su trabajo fue controversial en

    su momento y, an despus de dos siglos, las series de Fourier son importantes,

    tanto prctica como tericamente y siguen siendo objeto de investigacin.

    Una expansin trigonomtrica de una funcin f(x) est dada por una sumatoria o

    serie del tipo:

    )()cos()( 0 kxsenbkxaaxf kk k ++=

    Mediante la expansin de una seal en su serie trigonomtrica es posible

    manipularla llevando a cabo diversas tareas. Una tarea comn en el anlisis de

    seales es la eliminacin del ruido de alta frecuencia. Un enfoque para llevar esto a

    cabo es expresar la seal como una serie trigonomtrica y poner a cero los

    coeficientes de las frecuencias altas. Otra tarea es la compresin de datos. Aqu el

  • 10

    enfoque puede ser, expresar la funcin en trminos de una expansin trigonomtrica

    y conservar slo aquellos trminos cuyos coeficientes sean mayores que algn

    umbral de tolerancia.

    A pesar de que la transformada de Fourier ha sido el pilar del procesamiento de

    imgenes basado en transformadas desde la dcada de los aos 50, a finales de los

    aos 80's surgi otro tipo de Transformada llamada Transformada Wavelet con la

    cual es ms fcil realizar tareas de compresin, anlisis y transmisin de imgenes

    [Gonzles08].

    Una wavelet es una funcin en forma de "onda" con una duracin limitada y con un

    valor promedio de 0. A diferencia de las funciones sinusoidales que, tericamente se

    extienden de - a +, las wavelets tienen un principio y un fin [Fugal09]. La figura 2.1

    muestra la diferencia entre la funcin coseno y una wavelet Daubechies 20.

    FIGURA 2.1. GRFICA DE LA FUNCIN COSENO Y DE LA FUNCIN WAVELET MADRE

    DAUBECHIES 20

    A diferencia de la transformada de Fourier que slo provee informacin en el dominio

    frecuencial, la Transformada Wavelet proporciona informacin tanto en el dominio

    frecuencial como en el temporal, es decir, puede detectar anomalas o caractersticas

    de inters en la seal y, al mismo tiempo, indicar cundo suceden [Gonzles08].

  • 11

    Existen diversas familias de wavelets, cada una con diferentes caractersticas que las

    hacen ms o menos adecuadas para diferentes tareas. En general, la transformada

    Wavelet est dada por la siguiente ecuacin:

    =

    =kj

    jjk kxbxf

    ,

    )2()( (1)

    Siendo:

    b Coeficiente a calcular.

    Wavelet Madre.

    j y k Factores de escalamiento y traslacin respectivamente.

    Cada familia de wavelets cuenta con una wavelet madre la cual es aplicada a lo largo

    de la seal en diferentes posiciones y en diferentes escalas. La escala y la posicin

    de la seal donde ha de ser aplicada la wavelet vienen especificadas por los valores

    en j y k .

    2.2.1 Wavelet Daubechies

    La wavelet madre para la familia de wavelets de Daubechies se define mediante la

    siguiente ecuacin:

    )2/()( 2/2/ Ni

    Ni

    N ePe = (2)

    NP es un polinomio de grado N donde N indica el tipo de wavelet de Daubechies a

    utilizar, por ejemplo: Db2, Db3 Db50 y viene dado por:

    =12

    2

    1:)(

    N

    k

    kkN zpzP (3)

    kp , por su parte, toma valores de la Tabla 2.1.

  • 12

    N se encuentra definida por la siguiente ecuacin:

    =

    =1

    2/ )(2

    1)(

    j

    iNN

    j

    eP

    (4)

    TABLA 2.1. VALORES DE PK PARA LA WAVELET MADRE DAUBECHIES

    kp 1=N 2=N 3=N 4=N

    0p 1 0.683013 0.470467 0.325803

    1p 1 1.183013 1.141117 1.010946

    2p 0 0.316987 0.650365 0.892200

    3p 0 -0.183013 -0.190934 -0.039575

    4p 0 0 -0.120832 -0.264507

    5p 0 0 0.049817 0.043616

    6p 0 0 0 0.023252

    7p 0 0 0 -0.014987

    En la figura 2.2, se muestra la wavelet madre de Daubechies.

    FIGURA 2.2. WAVELET MADRE DAUBECHIES

  • 13

    2.3 RECONOCIMIENTO DE PATRONES

    Podemos definir el trmino patrn como la representacin de un objeto y el trmino

    Reconocimiento de Patrones, de acuerdo a [Tou74], como la tarea de detectar y

    extraer rasgos comunes que describen los objetos pertenecientes a una misma clase

    de patrones y reconocer este patrn en cualquier nuevo ambiente para clasificarlo

    como un miembro de dicha clase.

    Existen varios enfoques para el estudio de las tareas de RP siendo el estadstico y el

    sintctico los que mayor atencin han recibido.

    El enfoque sintctico intenta encontrar los elementos bsicos de los patrones para

    describirlos as como un conjunto de reglas sintcticas o gramtica que especifique

    la forma en la que estas primitivas se pueden combinar para dar lugar a un patrn

    legtimo dentro de una clase de inters [Gasca10].

    El enfoque estadstico, por su parte, reconoce la naturaleza probabilstica tanto de la

    informacin que se busca procesar como de la forma en la que los resultados se

    deberan representar [Bishop95] y se considera que el problema de decidir si un

    patrn pertenece o no a una clase puede ser tratado por la teora estadstica de la

    decisin.

    Este enfoque supone que los patrones se pueden representar mediante vectores y

    que en la mayora de los problemas reales, existe un solapamiento inevitable en la

    distribucin de las clases lo que subraya su naturaleza inherentemente probabilstica.

    Esto mismo hace que sea necesario tratar las variables medidas como cantidades

    aleatorias y obliga a aceptar que no siempre es posible una clasificacin perfecta de

    nuevos patrones.

    Los sistemas de RP tienen tres etapas fundamentales:

  • 14

    Preprocesamiento.- Durante esta etapa se trata la informacin original para

    mejorar su calidad.

    Seleccin de variables.- Aqu se trata de elegir las variables con mayor poder

    discriminatorio para reducir la dimensin del problema y mejorar la precisin

    del clasificador.

    Clasificacin.- Esta etapa se considera, en el enfoque estadstico, como un

    problema que, dado el carcter multidimensional de la informacin utilizada,

    se puede resolver utilizando mtodos de anlisis multivariado como lo es el

    anlisis discriminante.

    2.3.1 Enfoque estadstico

    De acuerdo a [Gasca10], se le atribuye por primera vez a Chow, en 1957, la

    formulacin rigurosa del problema de RP en trminos de la teora de decisin

    estadstica y su objetivo es encontrar un clasificador ptimo, es decir, aqul que

    tenga la menor probabilidad de cometer errores.

    Para este enfoque, el patrn se representa mediante un vector ),...,,,( 321 pxxxx=X

    de mediciones el cual se considera como un punto en un espacio p-dimensional y

    diferentes individuos pueden producir diferentes valores para una misma medicin

    sin importar que pertenezcan a la misma clase.

    Como ya se mencion en la Introduccin, el RP se puede formalizar

    matemticamente como una funcin, definida con dominio en el espacio de las

    mediciones o atributos y con imagen en el conjunto de clases presentes en el

    problema que se estudia por lo que la entrada al sistema de RP es un conjunto de p

    mediciones y la salida es la etiqueta o cdigo que identifica a una de las clases que

    se consideran. Por lo anterior, se acostumbra representar la entrada como un vector

    X conocido como vector patrn [Gasca10].

  • 15

    El mapeo entre el vector patrn y las clases dadas se lleva a cabo mediante una

    funcin de la forma:

    )(X=c (5)

    donde ),...,2,1( mc es la etiqueta correspondiente a una de las m clases

    consideradas en el problema y )(X es la funcin de decisin.

    Se trata entonces de poder dividir el espacio de variables en regiones de decisin,

    correspondiendo cada una de esas regiones a una clase dada. El borde o frontera

    entre cada regin se conoce como frontera de decisin y el objetivo de )(X , por lo

    tanto, es asignar X a la clase asociada a una regin dada. En la figura 2.3 se ilustra

    grficamente este concepto utilizando un espacio bidimensional:

    FIGURA 2.3. FRONTERA DE DECISIN

    Si no se conoce la clasificacin correcta de los patrones disponibles se utilizan

    mtodos no supervisados o algoritmos de clustering para encontrar relaciones no

    conocidas de antemano entre ellos. Si por el contrario, se conoce la clasificacin de

    un conjunto de patrones disponibles, se pueden utilizar mtodos supervisados y el

    conjunto de patrones disponibles previamente clasificados se conoce entonces como

    Muestra de Entrenamiento y es utilizada para entrenar el clasificador. Existen dos

    tipos de mtodos de entrenamiento supervisados:

  • 16

    Paramtricos.- Se conoce o se supone que se conoce la funcin de densidad

    del modelo y, mediante la muestra de entrenamiento, se busca ajustar los

    parmetros de la funcin para que se ajuste al modelo.

    No Paramtricos.- Estos son independientes de cualquier supuesto sobre la

    estructura probabilstica.

  • 17

    2.4 REDES NEURONALES ARTIFICIALES

    La importancia de las RNA en el contexto mencionado en la seccin anterior, es que

    ofrecen un mtodo muy poderoso y flexible de representar mapeos no lineales desde

    varias variables de entrada hacia varias variables de salida donde la forma del

    mapeo, como se ver ms adelante, se encuentra gobernada por un nmero de

    parmetros ajustables [Bishop05].

    Las RNA, son un paradigma de aprendizaje y procesamiento automtico inspirado en

    el sistema nervioso de los animales. Se puede ver como un sistema de interconexin

    de neuronas colaborando para producir un estmulo de salida el cual tiene diversas

    ventajas sobre mtodos de procesamiento de informacin convencionales como lo

    son:

    No linealidad.- La respuesta puede ser lineal o no lineal. Esto es importante ya

    que la mayora de los fenmenos en el mundo real no se comportan de

    manera lineal.

    Flexibilidad.- Maneja bien el ruido en la seal de entrada.

    Auto-organizacin.- Esta propiedad permite a la red distribuir el conocimiento

    en toda la estructura de la red permitiendo que no haya elementos con

    informacin especfica.

    Aprendizaje adaptativo.- Son capaces de aprender a travs de la presentacin

    repetitiva de una serie de ejemplos previamente clasificados sin requerir de un

    modelo previo.

    Tolerancia a Fallos.- Puede continuar funcionando an cuando partes de la

    red no funcionen correctamente debido a que la informacin se guarda de

    manera redundante.

    De acuerdo a [Gurney97], podemos definir el trmino de Red Neuronal Artificial

    como:

  • 18

    "Un ensamble interconectado de elementos simples de procesamiento, unidades o

    nodos, cuya funcionalidad est vagamente basada en la neurona animal. La

    habilidad de procesamiento de la red, se encuentra ubicada en la fuerza de la

    interconexin entre unidades, o pesos, obtenidos mediante un proceso de adaptacin

    hacia, o aprendizaje desde, un conjunto de patrones de entrenamiento."

    Las unidades o nodos se refieren a las neuronas artificiales o computacionales que

    se encuentran organizadas jerrquicamente en capas y se comunican entre ellas

    mediante conexiones ponderadas por pesos que definen la importancia de la

    conexin particular entre neuronas.

    La manera en la que se estructura la RNA, es decir, el nmero de capas, el nmero

    de neuronas por capa y sus conexiones, define su topologa o arquitectura

    permitiendo categorizar a las neuronas en tres tipos; de entrada, salida y ocultas. Las

    neuronas de entrada tienen como funcin principal obtener los valores del patrn de

    entrada con los que se alimenta la red para pasarlas a las neuronas de las siguientes

    capas. Una caracterstica de este tipo de neuronas es que no realizan procesamiento

    alguno sobre los valores de entrada y se limitan a pasar lo que reciben a las

    neuronas de las siguientes capas. Las neuronas ocultas se encuentran en capas

    intermedias, es decir, no tienen contacto con el ambiente externo a la red y por

    ltimo, las de salida, toman como entrada las salidas de las neuronas de las capas

    ocultas y se encargan de notificar la salida de la red al exterior [Gasca11].

    El conocimiento se guarda en los pesos de las conexiones entre neuronas los cuales

    son inicializados de manera aleatoria y, mediante un proceso de entrenamiento, se

    van modificando hasta que la red aprende la tarea para la que ser utilizada. A estos

    procesos de entrenamiento se les denomina Aprendizaje y puede ser Supervisado o

    No Supervisado.

    En el Aprendizaje Supervisado, un conjunto de patrones, previamente clasificados,

    es presentado a la red a lo largo de una serie de iteraciones a travs de las cuales,

    se modifican los pesos utilizando una regla de aprendizaje cuyo objetivo es minimizar

  • 19

    una funcin de error, por ejemplo, el error cometido en el valor real de salida de la

    red con respecto al valor deseado.

    2.4.1 Modelo Biolgico

    Las RNA se inspiran en el modelo biolgico del cerebro por lo cual, necesitamos

    tener un entendimiento del funcionamiento bsico del cerebro para poder

    comprender la formulacin de las RNA.

    Los sistemas nerviosos poseen diferentes arquitecturas de diversas complejidades

    pero todos ellos estn formados, de manera similar, por bloques bsicos de clulas

    llamadas neuronas. Existen varios tipos de neuronas, morfolgicamente distintas

    dependiendo de las funciones que realizan, sin embargo, todas ellas tienen en

    comn que poseen una gran capacidad de comunicacin [Rojas96].

    El funcionamiento bsico de las neuronas es recibir una seal de entrada y producir

    una seal de salida. En la figura 2.4, se muestra la estructura general de una

    neurona:

    FIGURA 2.4. NEURONA BIOLGICA

    Las Dendritas son los canales de transmisin a travs de los cuales, la neurona

    recibe informacin. En el Soma, o ncleo de la clula, se procesa produciendo o no,

  • 20

    una seal de salida que es enviada a travs del Axn mediante un impulso elctrico

    a otras Dendritas. Las Dendritas no tocan fsicamente el Axn, ms bien, se

    comunican por medio de una regin llamada sinapsis a travs de la cual se

    transmiten sustancias qumicas denominadas neurotransmisores [Gasca11].

    Nuestro cuerpo est formado de una gran cantidad de agua, encontrndose el 55%

    de ella dentro del cuerpo de las clulas y el restante 45% alrededor de ellas por lo

    que las clulas mantienen sus componentes biolgicos aislados del resto del cuerpo

    mediante una capa protectora o membrana. En el fluido extracelular e intracelular,

    existen especies inicas de sales como cloruro-, sodio+ y potasio+ que juegan un

    papel fundamental en el intercambio de informacin entre neuronas. Las membranas

    de las clulas cuentan con canales inicos que estn formados por macromolculas

    con formas y cargas especficas para dejar pasar determinadas cantidades de iones

    de un lado a otro de la membrana. Diferentes grados de permeabilidad a elementos

    especficos en la membrana, permiten que haya diferencias en la distribucin entre

    los elementos inicos que se encuentran dentro y fuera de la membrana haciendo

    que exista una diferencia de carga entre el fluido intracelular y el extracelular. A esta

    diferencia de carga se le conoce como potencial en reposo [Rojas96]. Cuando se

    transmite la informacin a travs de la sinapsis, se genera una variacin en este

    potencial conocida como potencial de accin el cual genera una variacin en la

    permeabilidad de la membrana permitiendo el intercambio de los neurotransmisores.

    Las sinapsis pueden ser excitadoras o inhibidoras. Las primeras producen

    disminuciones de potencial, ocasionando con esto la generacin de impulsos. Las

    segundas, por su parte, estabilizan el potencial inhibiendo la generacin de impulsos

    [Gasca11].

    Ya que la neurona, a travs de sus dendritas, recibe informacin de varias neuronas,

    la seal total de entrada es la suma ponderada de cada una de las seales recibidas.

    Si el total rebasa cierto umbral, la neurona se activa [Gasca11].

  • 21

    Es en base al modelo expuesto anteriormente, que surge dentro del rea de la IA la

    teora de las RNA.

    2.4.2 Neurona Artificial

    Una RNA, est formada por nodos que mantienen conexiones con otros nodos o con

    su ambiente externo. Cada uno de estos nodos es una neurona artificial y cada una,

    recibe una entrada y genera una salida [Russell96].

    Con base al modelo de la neurona biolgica, en la figura 2.5, se muestra el modelo

    tpico de una neurona artificial:

    FIGURA 2.5. NEURONA ARTIFICIAL.

    El modelo est formado por una serie de conexiones a travs de las cuales la

    neurona recibe una serie de valores de entradas, en especfico, n entradas ms una

    entrada fija con valor de uno llamada bias. Cada conexin se encuentra ponderada

    por un peso y, la entrada neta que recibe la neurona, es la sumatoria de la

    multiplicacin de cada peso por el valor de salida del nodo de la capa anterior como

    se muestra en la siguiente ecuacin:

  • siendo w el vector de pesos aumentado y

    anterior. Se dice que los vectores son aumentados por que incluyen los valores del

    bias.

    La neurona cuenta tambin con una funcin de activacin la cual recibe la

    neta de la neurona y decide si la neurona se activa o no. Por lo general, las funciones

    de activacin son funciones no lineales que producen valores de salida en el rango

    de 0 a 1, sin embargo, existen diversas funciones de activacin [Selene09].

    Algunas funciones de activacin son:

    Lineal.- yxf =)( (Figura

    Escaln.- 0=y si

    Sigmoide.- xf =)(

    FIGURA

    =

    =n

    iijij ownet

    0

    el vector de pesos aumentado y o el valor de salida del nodo de la capa

    anterior. Se dice que los vectores son aumentados por que incluyen los valores del

    La neurona cuenta tambin con una funcin de activacin la cual recibe la

    neta de la neurona y decide si la neurona se activa o no. Por lo general, las funciones

    de activacin son funciones no lineales que producen valores de salida en el rango

    de 0 a 1, sin embargo, existen diversas funciones de activacin [Selene09].

    Algunas funciones de activacin son:

    (Figura 2.6)

    si 0

  • FIGURA

    FIGURA

    2.4.3 Perceptron Simple

    El Perceptron Simple es la RNA ms sencilla que existe, creada por Rosenblat

    1958 [Russell96]. Su topologa est

    salida [Gasca11].

    FIGURA 2.7. FUNCIN DE ACTIVACIN ESCALN

    FIGURA 2.8. FUNCIN DE ACTIVACIN SIGMOIDE

    Perceptron Simple

    El Perceptron Simple es la RNA ms sencilla que existe, creada por Rosenblat

    96]. Su topologa est formada por dos capas, una de entrada y una de

    23

    ESCALN

    FUNCIN DE ACTIVACIN SIGMOIDE

    El Perceptron Simple es la RNA ms sencilla que existe, creada por Rosenblatt en

    formada por dos capas, una de entrada y una de

  • 24

    El Perceptron simple, separa los patrones de entrada en dos categoras.

    Geomtricamente, estas categoras se pueden ver como regiones en un espacio n-

    dimensional que son separadas por una lnea, plano o hiperplano [Gurney97]. Cada

    patrn, por lo tanto, se puede ver como un punto en ese espacio n-dimensional,

    usando sus valores como coordenadas, es decir, para n entradas, se tendr un

    espacio de n dimensiones.

    Como ya se mencion anteriormente, las neuronas de la capa de entrada no realizan

    ningn procesamiento sobre los valores de entrada por lo que su salida es la misma

    que su entrada. Para cualquier otro nodo, su entrada se determina mediante el

    clculo del valor neto descrito mediante la Ecuacin 6.

    Este valor neto de entrada, es en realidad una combinacin lineal de los elementos

    de entrada y los pesos de las conexiones como se muestra en la siguiente ecuacin:

    =

    ++=n

    jjjj wxwy

    11 1* (7)

    1+jw es el peso del elemento bias cuyo valor de salida siempre es 1 y corresponde en

    la interpretacin geomtrica del Perceptron al trmino constante de la ecuacin de la

    recta, plano o hiperplano, que separa el espacio de observacin en dos. Si no fuera

    por este trmino, la recta, plano o hiperplano, pasara siempre por el origen.

    Como ya se mencion, por razones de simplicidad podemos incluir el bias en los

    vectores de pesos y en el vector de entrada, generando as los vectores aumentados

    de pesos y de valores de entrada. Si definimos w como el vector de pesos

    aumentado, tendramos que:

    [ ]Tnn wwww 121 ,,..., +=w (8)

    Si definimos el vector aumentado de entrada como z tendramos que:

  • 25

    [ ]Tnxxx 1,,..., 21=z (9) Con estos dos vectores, podemos redefinir la funcin discriminante lineal como:

    zwT =y (10)

    El resultado es entonces evaluado por regla de decisin:

    es decir, cuando d= 1, el patrn pertenece a la clase A de lo contrario, pertenece a la

    clase B.

    La regla de aprendizaje para el Perceptron Simple, la cual ajusta los pesos, es la

    siguiente:

    iiiii dt zww )(1 += (11)

    donde t es la salida real de la red en la iteracin i ,

    d es la salida deseada en la

    iteracin i y es un constante llamada razn de aprendizaje.

    El principal problema del Perceptron Simple es que solamente es eficiente en

    problemas con dos clases que sean linealmente separables, lo que lo hace poco

    prctico para la mayora de aplicaciones reales las cuales tienden a ser de ms de

    dos clases y no linealmente separables.

  • 26

    2.4.4 Perceptron Multicapa

    El Perceptron Multicapa es la unin de varios perceptrones simples [Selene09].

    Mediante estas uniones, el Perceptron Multicapa es capaz de resolver los problemas

    con los que se enfrenta el Perceptron Simple pudiendo tratar con problemas no

    separables linealmente. La figura 2.9 ilustra la arquitectura del Perceptron Multicapa.

    FIGURA 2.9. ARQUITECTURA DEL PERCEPTRON MULTICAPA

    Adems de la diferencia en topologa entre el Perceptron Simple y el Multicapa, el

    algoritmo de aprendizaje es diferente. La diferencia radica en que, en este modelo,

    se deben ajustar los pesos de las conexiones de los nodos de las capas ocultas,

    tratando de determinar la influencia que tuvo cada uno, en el error total de la salida

    de la red [Gurney97]. A este problema se le conoce como el problema de la

    Asignacin de Crditos y se puede resolver si se cuenta con una funcin de error

    diferenciable con respecto a los pesos, pudiendo as, evaluar las derivadas del error

    con respecto a los pesos y utilizarlas para encontrar los valores de los pesos que

    minimicen el error con algn mtodo como el de gradiente descendente [Bishop95].

    Un algoritmo muy popular que implementa esta solucin es el algoritmo

    BackPropagation que pertenece tambin a la clase de mtodos supervisados, es

    decir, se requiere una muestra de entrenamiento previamente clasificada. Se llama

    as porque propaga el error de adelante hacia atrs a travs de los nodos de la red.

  • 27

    El algoritmo se lleva a cabo en dos fases: En la primera, se evala el error de la red y

    en la segunda, se calcula la derivada del error con respecto a los pesos para calcular

    su ajuste de manera que se minimice la funcin de error.

    Este algoritmo utiliza el error cuadrtico medio como funcin de error:

    2

    12

    1 )(=

    =S

    S

    N

    i

    piNE (12)

    siendop

    i :

    )( pip

    ip

    i sd = (13)

    es decir, el error cometido definido como la diferencia entre la salida deseada pid y la

    salida real de la red pis para el p-simo patrn en la i-simo nodo de la capa de salida.

    sN es la cantidad de nodos de la capa de salida.

    Una vez obtenido el error cuadrtico medio, los pesos se ajustan mediante el uso del

    algoritmo de gradiente descendente:

    )1()( += twEtw pw (14)

    Donde es la razn de aprendizaje, pwE es el gradiente de la funcin de error con

    respecto a los pesos, es el momento y t es el nmero de iteraciones.

  • 28

    2.5 PROCESAMIENTO DE IMGENES DIGITALES

    Ya que el sistema propuesto en este proyecto toma como entrada imgenes

    digitales, el procesamiento de stas juega un papel fundamental en el mismo. Una

    imagen se puede ver como una funcin de dos variables f(x,y) donde x y y son

    coordenadas espaciales y el valor de f, para cualquier par de coordenadas x y y es la

    intensidad o nivel de gris de la imagen en ese punto [Gonzles04].

    La imagen digital, en los sistemas computacionales, se puede representar y

    manipular a travs de una matriz de M x N donde cada elemento de la matriz

    representa un pixel y su posicin se conoce como coordenada del pixel. Las

    posiciones van de 0 a M-1 y a N-1. A continuacin se ilustra este concepto a travs

    de la siguiente matriz [Gonzles04]:

    (15)

    Un pixel p con coordenadas (x,y), puede tener hasta 8 pixeles vecinos como se

    muestra a continuacin:

    RELACIN DE UN PIXEL CON SUS PIXELES VECINOS

  • 29

    Estas relaciones son importantes, ya que muchas de las tareas de procesamiento de

    imgenes digitales se pueden llevar a cabo mediante mscaras o filtros que se

    aplican directamente sobre un pixel dado para encontrar cul es la relacin que

    existe entre el valor del pixel central con respecto al de sus vecinos.

    Existen muchas operaciones aplicables a las imgenes digitales para facilitar su

    posterior procesamiento o anlisis, sin embargo, para los fines de este proyecto, nos

    limitaremos a exponer la binarizacin, la obtencin del esqueleto de una imagen y la

    aplicacin de filtros a imgenes digitales conocida como Correlacin.

    2.5.1 Binarizacin

    La binarizacin es el proceso mediante el cual se asigna uno de dos posibles valores

    (blanco o negro) a cada pixel de la imagen de manera que un color sea usado para

    los pixeles que representen el fondo de la imagen y el otro para aquellos que sean

    parte del primer plano de la misma. Un mtodo comn para llevar esto a cabo es

    utilizar un umbral y considerar a todos los pixeles con valores iguales o mayores al

    umbral como parte del primer plano de la imagen y a todos aquellos con valores por

    debajo del umbral como parte del fondo. Los pixeles con color negro formaran parte

    del fondo de la imagen, mientras que aquellos con color blanco, formaran parte de

    las figuras contenidas en la imagen. La figura 2.10 muestra un ejemplo de una

    imagen y el resultado de su binarizacin.

    FIGURA 2.10. IMAGEN EN ESCALA DE GRISES E IMAGEN BINARIZADA

  • 30

    2.5.2 Esqueletizacin

    El anlisis de trazos es un mtodo efectivo para reconocer ciertos patrones digitales

    como caracteres alfanumricos o ideogrficos [Zhang84].

    La esqueletizacin de una imagen es un tipo de operacin morfolgica de

    adelgazamiento mediante la cual se pueden descubrir los pixeles fundamentales que

    forman la estructura bsica de una figura en una imagen digital [Gonzles08].

    Por lo regular los algoritmos de adelgazamiento se aplican a imgenes binarias,

    descritas en la seccin anterior, y funcionan a lo largo de una serie de iteraciones. En

    cada iteracin, se evala cada uno de los pixeles que no forman parte del fondo y,

    aquellos que se determina que no forman parte de la estructura fundamental de las

    figuras contenidas en la imagen son descartados. La imagen resultante es usada

    como entrada para la siguiente iteracin la cual aplica el mismo procedimiento para

    continuar descartando aquellos pixeles que no son fundamentales. El algoritmo

    finaliza cuando pasa una iteracin completa sin que se haya podido descartar ningn

    pixel. En la figura 2.11, se muestra un ejemplo tomado de [Zhang84] donde se aplica

    el proceso de esqueletizacin a una imagen que contiene una figura de una letra "H"

    a lo largo de tres iteraciones:

    FIGURA 2.11. ESQUELETO DE LA LETRA H.

  • 31

    La figura 2.11(c) es el resultado final donde ya se descartaron todos aquellos pixeles

    de los cuales se puede prescindir sin que se pierda la informacin esencial que

    transmite la imagen.

    [Zhang84] propone el siguiente algoritmo:

    1. Obtener Imagen Binaria I:

    2. Sub-iteracin 1: Para cada pixel p de la imagen I que no forma parte del fondo:

    2.1. Evaluar las siguientes condiciones:

    2.2. Si se cumplen las condiciones mencionadas anteriormente, marcarlo para ser

    borrado posteriormente.

    3. Si no existe ningn pixel qu borrar, finalizar el algoritmo.

    4. Borrar en I todos los pixeles marcados en el paso 2.2.

    5. Sub-iteracin 2: Para cada pixel p de la imagen I resultante del paso 4 que no

    formen parte del fondo:

    5.1. Evaluar las condiciones:

  • 32

    5.2. Si cumple con las condiciones mencionadas anteriormente, marcarlo para ser

    borrado posteriormente.

    6. Si no existe ningn pixel qu borrar, finalizar el algoritmo.

    7. Borrar en I todos los pixeles marcados en el paso 5.2.

    8. Repetir desde el paso 2 tomando como entrada la imagen I resultante del paso 7

    )( 1PB es el nmero de vecinos que forman parte de la imagen, es decir, que tienen

    como valor un 1. Esta condicin permite asegurar que no se borren pixeles que sean

    puntos finales o que sean parte central de las figuras contenidas en la imagen.

    )( 1PA es el nmero de ocurrencias del patrn "01" en el conjunto ordenado

    76,5432 ,,,, PPPPPP y 8P .

    nP , por su parte, se refiere a la ubicacin de los pixeles mostrados en la siguiente

    matriz:

    Dicha matriz da la relacin de pixeles usada para evaluar condiciones del algoritmo

    de Zhang Suen.

    Cabe destacar que el pixel 1P es el pixel p que se est evaluando.

  • 33

    A continuacin se ilustra un ejemplo donde )( 1PA dara como resultado 2 ya que el

    patrn "01" se presenta dos veces:

    EJEMPLO DE EVALUACIN DE CONDICIN A(P1)

    Esta condicin nos permite verificar que no borremos pixeles que se encuentren en

    medio de dos puntos finales.

    La figura 2.12 nos da tres ejemplos en los que las condiciones 1 y 2, nos ayudan a

    no eliminar pixeles de puntos finales o que son parte central del esqueleto:

    FIGURA 2.12. EJEMPLO DE PIXELES CENTRALES Y FINALES

    Las letras A y C indican pixeles finales que no deben ser borrados. La condicin 1

    nos impide borrarlos. La letra B indica un pixel central que es conservado gracias a la

    condicin 2.

  • 34

    Las condiciones 3 y 4, para ambas sub-iteraciones, nos permiten evaluar pixeles que

    forman parte de bordes en las esquinas noroeste, sureste, suroeste o noreste de

    acuerdo a la figura 2.13:

    FIGURA 2.13. FIGURA PARA EVALUACIN DE CONDICIONES 3 Y 4

    Contando con el esqueleto de una firma, se pueden obtener varias de las

    caractersticas utilizadas en este proyecto para la formacin del patrn de la firma de

    una manera sencilla.

    2.5.3 Correlacin

    La Correlacin es una tcnica de filtrado lineal de imgenes que consta en aplicar

    una mscara o filtro a cada pixel en conjunto con sus pixeles vecinos para obtener la

    suma ponderada de los valores de cada uno de los pixeles a ser evaluados. La

    matriz de pesos es precisamente la mscara o filtro aplicada y se conoce como

    kernel o filtro.

    A manera de ejemplo, la figura 2.14 muestra los valores de los pixeles de una

    imagen de 4x5 y la figura 2.15 los valores de una mscara de 3x3.

    FIGURA 2.14. IMAGEN DE 4x5

  • 35

    FIGURA 2.15. MSCARA DE 3x3

    La figura 2.16 muestra cmo se aplicara el kernel o mscara al pixel en la fila 2 y

    columna 4 con valor 14:

    FIGURA 2.16. APLICACIN KERNEL

    El resultado sera: 1*8 + 8*1 + 15*6 + 7*3 + 14*5 + 16*7 + 13*4 + 20*9 + 22*2=585.

  • 36

    2.6 GRAFOSCOPA

    La grafoscopa es la disciplina que estudia la autenticidad o autora de grafismos

    como la escritura o la firma. Surge desde 1776 pero no es sino hasta mediados del

    siglo pasado cuando comienza a tomar un carcter cientfico [Orellana75].

    La firma autgrafa es uno de los medios ms aceptados para la verificacin de la

    identidad personal y es utilizada en toda clase de documentos oficiales como licencia

    de conducir y credencial de elector entre otros. La firma es consecuencia de una

    accin grfica producto de un reflejo condicionado cuyo mecanismo se encuentra

    dirigido en gran medida por nuestro inconsciente [Orellana75], por ello, no slo se

    asocia con informacin relacionada con el nombre del firmante sino que a partir de

    ella, se pueden encontrar caractersticas psicolgicas del mismo las cuales estn

    relacionadas especficamente con el sistema psicomotor, motivo por el cual se

    considera como la representacin grfica de la identidad de un individuo y se acepta

    como elemento til para la validacin y autorizacin en diversos tipos de operaciones

    como lo son las financieras y legales entre otras [Baez06].

    Un acto reflejo se produce cada vez que se dan las condiciones de estmulo

    adecuadas, siendo stas para el caso de la firma, tctiles, visuales y fonticas. En

    cuanto se toma la decisin de firmar, se pone en marcha el proceso "signatriz" que

    desencadena un conjunto de desenvolvimientos grficos cuyo resultado es la firma.

    La figura 2.17 muestra el proceso signatriz.

    [CMGC08] define el proceso signatriz como la sucesin de eventos que se producen

    dentro y fuera de nosotros cuando deseamos ejecutar nuestra firma y que finaliza en

    la ejecucin propiamente dicha.

  • 37

    FIGURA 2.17. PROCESO SIGNATRIZ

    Existen seis etapas dentro del proceso signatriz [GMGC08]:

    1. Informacin del consciente al inconsciente del deseo de firmar.- Este proceso

    se desencadena con el simple hecho de querer firmar ocasionando que el

    inconsciente tome el mando y verifique que existan los elementos necesarios

    para pasar a la accin, por ejemplo, cuando la persona automticamente

    busca un lpiz y papel para firmar.

    2. Examen de estmulos materiales.- Los estmulos materiales son analizados a

    travs del tacto, por ejemplo, al tomar un lpiz, de manera inconsciente se

    examina el grosor, peso y talla del mismo y si se consideran aptos, el

    inconsciente transmite una sensacin de comodidad que permite seguir con el

    proceso normal de firmado.

    3. Examen de estmulos grficos.- En cuanto se tienen los elementos fsicos, el

    inconsciente ordena que se verifique si existen marcas grficas que den gua y

    orientacin a la firma como una lnea o un rectngulo en el rea de firmado.

    Los estmulos grficos ms importantes son los bordes del papel cuando est

    en blanco, lnea expresa para firmar, recuadros especficos para la firma, texto

  • 38

    que diga "firma" y marcas especiales como cruces, puntos y seales

    especficas.

    4. Ejecucin de los reflejos condicionados.- Cuando un estmulo grfico es

    conocido, se ejecuta el reflejo condicionado de manera inconsciente como

    cuando firmamos en un rectngulo reducido e inmediatamente se calcula y

    reduce la dimensin de la firma para ajustarse al espacio disponible. Por el

    contrario, cuando un estmulo grfico no es conocido, se requiere mayor

    informacin por lo que el control vuelve al consciente para conseguirla y

    continuar con el proceso. Un ejemplo de lo anterior es cuando no est claro

    dnde firmar y el firmante tiene que preguntar dnde hacerlo para poder

    continuar.

    5. Proceso motriz.- Los diseos de la firma estn grabados en la memoria motriz

    bajo impulsos sinpticos llamados imgenes motrices. Cuando las imgenes

    motrices se convierten en sus correspondientes movimientos fsicos, se

    produce la accin signatriz cuyo resultado da la firma. Las imgenes motrices

    contienen toda la informacin necesaria para producir la firma: movimiento de

    los msculos, presin sobre el lpiz o pluma, velocidad y tiempo en el que

    deben ejecutarse los movimientos entre otros. Esta informacin se usa para

    almacenar en la memoria motriz la actividad cintica y la cantidad exacta de

    energa que precisan los msculos para llevar a cabo los desenvolvimientos

    fsicos necesarios.

    6. Emplazamientos prefijados o colocacin.- Aqu se da la materializacin del

    reflejo grfico condicionado, es decir, la realizacin de la firma.

    La importancia de cada uno de los elementos grficos constitutivos de la firma se

    mide por el valor que estos adquieren cuando se quiere verificar si la firma es

    autntica o no. Los elementos fundamentales son rara vez percibidos por el

    falsificador por lo cual no los reproducir y, en caso de intentarlo, lo ms probable es

    que sean reproducidos de manera errnea ya que slo el titular de la firma tiene la

    capacidad de reproducirlos de manera espontnea y con las mismas caractersticas.

  • 39

    La particularidad ms importante de los elementos fundamentales es que son

    numerosos y aparecen todos casi en el mismo momento. Por ejemplo, al firmar, el

    lapicero se desplaza sobre el papel y la firma aparece, a simple vista se ve el

    lapicero recorriendo el papel, lo que no se ve es la cantidad de presin que imprime

    la mano sobre el lapicero o bien, los saltos en el aire del lapicero que generan trazos

    separados.

    Los elementos fundamentales se dividen en visibles e invisibles. Los elementos

    visibles son aquellos que de manera relativamente sencilla, pueden ser observados a

    partir de los trazos que quedan en el papel como son la proporcin, los enlaces, los

    desenvolvimientos (la direccin de los diferentes trazos que forman la firma), la

    velocidad y la presin.

    Cada uno de estos elementos, aporta informacin valiosa a la hora de determinar la

    autenticidad de una firma, por ejemplo, la velocidad rpida nos informa que su autor

    realiza la firma sin la participacin de su estado consciente y hace presumir su

    autenticad. La presin se encuentra inversamente relacionada con la velocidad, la

    presin intercalada en el desarrollo de los diferentes trazos es caracterstica de las

    firmas autnticas. Una firma con una presin constante a lo largo de todos sus trazos

    indica que es muy probable que la firma sea falsa.

    Los elementos invisibles son difciles de ver y se clasifican en puntos de referencia

    intrnsecos y extrnsecos.

    Los puntos de referencia extrnsecos son un conjunto de referencias exteriores a la

    firma en s, es decir, no forman parte de la firma y sin embargo, influencian la manera

    en la que la firma es llevada a cabo y se dividen en materiales y grficos; los

    materiales son generalmente percibidos a travs del tacto como por ejemplo la silla

    donde se debe sentar el firmante, la mesa o el papel donde se debe firmar. Ejemplos

    de puntos de referencia grficos son el formato del formulario, rectngulos

    destinados para la firma o inclusive el color del papel.

  • 40

    Los puntos de referencia intrnsecos son puntos de referencia que se les toma como

    indicadores fiables de la autenticidad o falsedad de la firma y que se encuentran

    escondidos dentro de los desenvolvimientos o trazos de una firma como son la

    configuracin y ubicacin de los puntos de ataque, la forma y direccin de los rasgos

    finales de cada trazo y caractersticas de los signos ortogrficos de puntuacin.

    Para los fines de este proyecto, nos limitaremos a exponer la importancia de los

    puntos de ataque y de los rasgos finales de cada trazo; segn sea el dinamismo del

    movimiento no graficado inicial, ser la configuracin que adopte el primer contacto

    del lapicero con el papel el cual es conocido como punto de ataque. De igual manera,

    cada vez que termina un movimiento graficado queda una marca del estilo de la

    finalizacin. La forma que adquieren los rasgos finales o de remate, dependen del

    tipo de movimiento no graficado final. Lo anterior quiere decir que la manera en la

    que el firmante mueve su brazo y mano en el aire antes y despus de hacer contacto

    con el papel para realizar un trazo determina la forma inicial y final del mismo.

    Ejemplos de puntos de ataque son los rectos, los cuales se denominan as porque su

    inicio es un segmento de recta como se muestra en la figura 2.18 :

    FIGURA 2.18. PUNTO DE ATAQUE RECTO

    Los puntos de ataque redondeados son aquellos en los cuales el movimiento inicial

    no graficado es lento. El detenimiento del lapicero en el papel no es tan prolongado y

    la presin no es fuerte. La figura 2.19 muestra un ejemplo de punto de ataque

    redondeado:

  • 41

    FIGURA 2.19. PUNTO DE ATAQUE REDONDEADO

    Otro ejemplo de punto de ataque son los imperceptibles en los cuales, el movimiento

    no graficado inicial es muy veloz y la punta del lapicero toca el papel muy

    suavemente haciendo difcil determinar dnde termina el movimiento no graficado

    inicial y dnde comienza el movimiento graficado. Este inicio es uno de los ms

    difciles de imitar por que el falsificador tendra que imitar el movimiento no graficado

    y el grado de velocidad y presin del movimiento graficado. La figura 2.20 muestra un

    ejemplo de punto de ataque imperceptible:

    FIGURA 2.20. PUNTO DE ATAQUE IMPERCEPTIBLE

    Aunque la escritura y la forma de la firma presentan caractersticas nicas y propias

    de cada persona, estas pueden cambiar tanto voluntaria como involuntariamente

    [Baez06]. Para cambios voluntarios, basta el deseo de la persona para modificar el

    diseo de la firma o de su escritura tanto parcial como totalmente mientras que para

    cambios involuntarios puede haber diversas causas como las naturales,

    determinadas por el proceso vital de la persona como decadencia fsica por ejemplo,

    o bien, causas afectivas como la depresin, emociones o pasiones.

  • 42

    Segn [Baez06], la grafoscopa cuenta con diversas tcnicas para llevar a cabo la

    verificacin de una firma:

    Mtodo morfolgico de comparacin.- Se trata de realizar cotejos o

    comparaciones entre las letras.

    Mtodo grafolgico.- La grafologa permite identificar en la escritura gestos

    idiosincrsicos personales llegando con ello al estudio psicolgico del hombre,

    es decir, consiste en trazar un retrato grafolgico para determinar el origen de

    una firma. Lo anterior quiere decir que a partir del anlisis grafolgico de una

    firma, se puede identificar las caractersticas psicolgicas de una persona

    como lo son su temperamento o sus cualidades intelectuales y artsticas,

    validando con base en ellas, la autenticidad de una firma o bien, la

    identificacin de su autor [Baez06].

    Mtodo grafomtrico.- Consiste en la medicin de diferentes caractersticas de

    los trazos como ngulos y espesores utilizando herramientas como reglillas

    micrmetros.

  • 43

    2.7 SISTEMAS AUTOMTICOS DE VERIFICACIN DE

    FIRMAS

    Los sistemas de reconocimiento o verificacin de firmas, en su forma general,

    presentan la estructura bsica de los sistemas de reconocimiento de patrones

    mostrada en la figura 2.21, esto es, un sensor o medio de entrada, un proceso de

    extraccin de caractersticas y un clasificador [Azzopardi06] [Blumenstein07]

    [Drouhard96] [Leclerc94] [Papamarkos01] [Plamondon94].

    FIGURA 2.21. ESTRUCTURA DE UN SISTEMA DE R.P.

    Actualmente los sistemas de reconocimiento de firmas tienen dos vertientes bien

    conocidas; la primera basada en la imagen esttica de la firma (el resultado de

    firmar) y la segunda en el proceso dinmico involucrado (el proceso de firmar en s

    mismo). A estos mtodos se les conoce como sistemas off-line o estticos y on-line o

    dinmicos respectivamente [Leclerc94].

    El enfoque esttico es considerado ms difcil debido a que los mtodos

    desarrollados con un enfoque dinmico han obtenido mejores resultados en trminos

    de errores de tipo I y tipo II. Los errores de tipo I, tambin conocidos por sus siglas

    en ingls FRR (False Rejection Rate), se refieren al porcentaje de firmas vlidas que

    son rechazadas por el sistema. Los errores de tipo II, tambin conocidos como FAR

    (False Acceptance Rate), se refieren al porcentaje de firmas falsas aceptadas por el

    sistema [Leclerc94].

  • 44

    El objetivo principal de estos sistemas es diferenciar las firmas originales de las

    falsificadas. Aunque son ya al menos dos dcadas de trabajo continuo en esta rea,

    no existe en realidad un estndar que defina y clasifique los tipos de falsificaciones

    pero, en general, de acuerdo al nivel de habilidad en la falsificacin bien, de

    acuerdo a la semejanza de las firmas, se aceptan las siguientes categoras [Babu06]:

    Falsificacin Aleatoria: Puede ser la firma genuina de cualquier persona, la

    intencin del firmante no es falsificar otra firma, simplemente, la firma contra la

    cual se compara no es la suya.

    Falsificacin Simple o Falsificacin Casual: Este tipo de falsificacin es

    producida sabiendo slo el nombre de la persona cuya firma se quiere

    falsificar.

    Falsificaciones especializadas.- stas son las firmas producidas por

    falsificadores profesionales con experiencia.

    Los artculos publicados sobre el tema mencionados a lo largo de este trabajo,

    expresan sus resultados en trminos de los errores tipo I y II sobre alguno o algunos

    de los diferentes tipos de falsificaciones mencionados anteriormente, siendo los

    peores resultados siempre aquellos relacionados con Falsificaciones especializadas

    [Plamondon94]. Cabe destacar que el presente proyecto se enfoca en distinguir

    firmas autnticas de falsificaciones especializadas dejando a un lado las

    falsificaciones simples y aleatorias.

    Los sistemas dinmicos, utilizan como medio de entrada tabletas digitales para

    capturar la informacin del proceso de la firma, por lo tanto, requieren de la presencia

    del firmante a diferencia de los sistemas estticos, los cuales tienen como entrada

    una imagen digital.

    En los sistemas dinmicos, se tienen las siguientes fases: adquisicin, pre-

    procesamiento, comparacin y evaluacin. El proceso de adquisicin es muy

    importante porque la calidad de las seales es crtica para la optimizacin del

  • 45

    proceso de comparacin, del mismo modo, si la seal es de buena calidad, el tiempo

    asociado para el pre-procesamiento ser minimizado ya que en los sistemas

    dinmicos, el pre-procesamiento por lo general est destinado a corregir fallas en el

    proceso de adquisicin. El conjunto de seales que pueden ser procesadas en los

    sistemas dinmicos es bastante grande: las coordenadas x y y del lapicero como

    funcin del tiempo, velocidad, aceleracin y presin entre otros y, por lo mismo,

    muchos investigadores se enfocan exclusivamente en este proceso y proponen

    equipos electrnicos especializados para el proceso de adquisicin.

    Como ya se mencion, los sistemas estticos, trabajan en base a imgenes

    digitalizadas de firmas. Su mayor ventaja es que requieren equipo ms econmico y

    no necesitan de la presencia del firmante. Su gran desventaja es que no tienen

    acceso a la informacin dinmica mencionada anteriormente, sin embargo, en los

    ltimos aos se han hecho intentos de obtener caractersticas dinmicas a partir de

    la imagen esttica [Blumenstein09] [Lalican00].

    2.7.1 Caractersticas

    Existen diversas caractersticas utilizadas segn el enfoque empleado (on-line y off-

    line). Algunas de ellas pueden aplicar a ambos. Se pueden categorizar en estticas y

    dinmicas y a su vez en globales y locales.

    Las estticas son las que se pueden extraer de una imagen mientras que las

    dinmicas son las que se pueden extraer durante el proceso de firmar y tienen que

    ver principalmente con la velocidad, el tiempo y la presin ejercida al momento de

    firmar [Plamondon94].

    Por globales se clasifica a las caractersticas que toman informacin de la firma como

    un todo, por ejemplo, la *altura de la firma en las estticas o el tiempo total del

    proceso de firmado en las dinmicas mientras que las locales, se enfocan en un

    punto dado de la firma, ya sea en la posicin (las estticas) o en el tiempo

    (dinmicas) [Leclerc94].

  • 46

    Las caractersticas existentes contempladas para ser usadas en este proyecto se

    listan a continuacin junto con una breve descripcin y se da una descripcin ms

    profunda y detalla en secciones subsecuentes:

    Relacin Altura-Anchura.- Es la proporcin entre la altura y la anchura de la

    firma.

    Entropa.- Es una medida de la variacin entre los niveles de grises de la

    imagen.

    Mxima.- Relacin entre la distancia de dos trazos principales verticales u

    horizontales con respecto a la altura y anchura.

    Energa.- Algoritmo propuesto por [Blumenstein09] para cuantificar la energa

    requerida para realizar los diferentes trazos de la firma a partir de una imagen

    esttica.

    rea de la firma.- Nmero de pixeles dentro de la imagen que pertenecen a la

    firma.

    Nmero de Puntos Borde.- Nmero de pixeles pertenecientes a la firma que

    representan el inicio o fin de un trazo.

    Nmero de Puntos de Interseccin.- Nmero de pixeles que representan la

    unin de dos o ms trazos.

    De igual forma, se propone la siguiente caracterstica no reportada en la bibliografa

    consultada hasta el momento:

    Wavelets de Puntos Borde.- Con esta caracterstica se pretende representar

    los puntos de ataque y de remate descritos en la seccin 2.6.

    Relacin Altura-Anchura

    Es una caracterstica global que considera la proporcin entre la altura y anchura de

    la firma [Karsligil10]. Se obtiene dividiendo la altura entre la anchura. Mientras que

    entre firma y firma la altura y anchura pueden variar, la relacin entre estas dos se

    mantiene proporcional. En las firmas digitalizadas, bsicamente se mide la relacin

  • 47

    entre la anchura y altura en pixeles de la firma. Se inspira la facultad homottica que

    tiene el ser humano de cambiar el tamao de la firma sin alterar de manera

    significativa dicha proporcin [Orellana75], este concepto se ilustra en la figura 2.22:

    FIGURA 2.22. FACULTAD HOMOTETICA

    A continuacin se muestra de manera grfica cmo se obtienen los valores de la

    altura y anchura de una firma en una imagen digital:

    FIGURA 2.23. VALORES DE ANCHURA Y ALTURA EN UNA FIRMA DIGITAL

    Entropa

    Corresponde a una medida de la variacin entre niveles de grises de la firma. El

    trmino Entropa proviene de la teora de la informacin de Shannon. En el

    procesamiento de imgenes digitales, se utiliza para medir la aleatoriedad o

  • 48

    incertidumbre en los niveles de grises. La frmula de la entropa est dada por la

    siguiente ecuacin:

    =

    =

    k

    i ii p

    pxH1

    2

    1log)( (16)

    El trmino ip es la probabilidad de que ocurra el evento i , en nuestro caso, de que

    ocurra el nivel de gris i , por lo tanto,

    ip

    1

    es conocido como "factor sorpresa" o

    simplemente como "sorpresa", es decir, a mayor probabilidad de un evento o nivel de

    gris, menor sorpresa y viceversa. Al resultado de la ecuacin anterior, se le conoce

    como bits de incertidumbre.

    Ejemplo 1:

    Suponiendo que tuviramos una imagen donde fuera posible encontrar 4 diferentes

    niveles de grises A,B,C y D y todos ellos tomaran el valor de B, tendramos la

    siguiente distribucin de probabilidad:

    TABLA 2.2. EJEMPLO 1: CLCULO ENTROPA

    Nivel de Gris A B C D

    Probabilidad 0 1 0 0

    Aplicando la frmula de la Entropa tendramos que:

    0)0

    1(