localizacion y reconocimiento de rostros en imagenes monoculares de frente con variacion en...

Upload: tuccp90

Post on 21-Feb-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    1/158

    LOCALIZACIN Y RECONOCIMIENTO DE ROSTROS EN

    IMGENES MONOCULARES DE FRENTE CON VARIACIN EN

    ESCALA

    Jorge Servn Prez

    2009

    1

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    2/158

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    3/158

    Dedicatoria

    A las familias: Servn, Prez y Servn Prez. Con mucho cario.

    3

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    4/158

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    5/158

    Agradecimientos

    Quiero expresar mi ms profundo agradecimiento a todas las personas de la Universidad Autno-

    ma Metropolitana, Unidad Cuajimalpa, que tuvieron a bien participar en este proyecto proporcio-

    nando los datos, fotografas y dems facilidades requeridas para el mismo.

    Quiero agradecer a la Universidad Autnoma Metropolitana, Unidad Azcapotzalco, por la opor-tunidad que me brind de estudiar el posgrado en sus aulas. As tambin, agradezco el apoyo y

    enseanza por parte de los profesores del posgrado.

    Agradecimiento especial al Consejo Nacional de Ciencia y Tecnologa por los apoyos econmicos

    prestados en los dos ltimos trimestres.

    5

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    6/158

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    7/158

    Resumen

    En este trabajo se presenta una nueva tcnica de localizacin y reconocimiento de rostros en

    imgenes monoculares de frente con variacin en escala. Se describe la construccin del sistema de

    adquisicin de imgenes para generar una base de datos de fotografas que permitan ser

    comparadas contra imgenes con cambio de escala. Adems, se presenta como crear la base dedatos de imgenes de prueba, as como los resultados en la localizacin de ojos, la extraccin de la

    regin elptica de la cara, la normalizacin, el suavizado con variacin total y la aplicacin de la

    tcnica de anlisis de componentes principales para la generacin del espacio de eigenfaces y

    obtencin del rostro promedio. Finalmente, se presentan resultados comparables en eficiencia de

    reconocimiento de rostros de tcnicas similares.

    7

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    8/158

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    9/158

    Abstract

    In this work we present a novel technique for face detection and recognition of front monocular

    images with scale variation. A data acquisition set was carefully assembled in order to complete a

    standardized face photograph database, for implementing the matching procedure with different

    scales photographs. Furthermore, we present how to create database test images, eyes localizationresults, elliptic face feature extraction, normalization, total variation deblurring, and principal

    components analysis applications for building the eigenface space, and mean face. Finally, we

    present results at the same level of efficiency of similar techniques for face recognition.

    9

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    10/158

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    11/158

    ndice General

    ndice General 11

    Lista de Figuras 15

    Lista de Tablas 18

    1 INTRODUCCIN 19

    1.1. Estado del Arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

    1.1.1. El rostro visual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

    1.1.2. Los cambios en el rostro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

    1.1.3. Automatizacin del reconocimiento facial . . . . . . . . . . . . . . . . . . . . 20

    1.2. Descripcin de Captulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

    2 PROBLEMA DE INVESTIGACIN 27

    2.1. Planteamiento del Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    2.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    2.2.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    2.2.2. Objetivos particulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    2.3. Justificacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    2.4. Metodologa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

    3 ANTECEDENTES TERICOS 31

    3.1. Conceptos Fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

    3.1.1. Procesamiento digital de imgenes . . . . . . . . . . . . . . . . . . . . . . . . 31

    3.1.2. Reconocimiento de patrones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

    3.1.2.1. Segmentacin de un objeto basado en el umbralizado . . . . . . . . 36

    11

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    12/158

    ndice General

    3.1.2.2. Etiquetado de regiones o componentes conectadas . . . . . . . . . . 39

    3.2. Anlisis de Componentes Principales . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    3.2.1. Conjunto de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    3.2.2. Vector promedio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

    3.2.3. Matriz de covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

    3.2.4. Componentes principales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

    3.3. La TcnicaEigenface. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

    3.3.1. Resolucin de las imgenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

    3.3.2. Clculo de eigenfaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    3.3.3. Cmo utilizar los eigenfaces para reconocimiento de rostros . . . . . . . . . . 45

    3.4. Normalizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

    3.5. Variacin Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

    3.5.1. Conceptos preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

    3.5.2. Restauracin de la imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    3.5.3. Discretizacin de la variacin total de una imagen . . . . . . . . . . . . . . . 49

    3.6. Procesamiento Multiresolucin (Pirmide de Imgenes) . . . . . . . . . . . . . . . . 52

    4 PROTOCOLO DE ADQUISICIN DE IMGENES 55

    4.1. Proceso de adquisicin de imgenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

    4.2. Resultados del proceso de adquisicin . . . . . . . . . . . . . . . . . . . . . . . . . . 57

    4.3. Observaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

    5 LOCALIZACIN Y RECONOCIMIENTO DE ROSTROS 63

    5.1. Imgenes de Entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

    5.2. Localizacin Facial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

    5.3. Extraccin de Caractersticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

    5.4. Reconocimiento de Rostros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    5.4.1. Imagen de prueba . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    5.4.2. Normalizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    5.4.3. Bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

    5.4.4. Selector de escala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

    5.4.5. Rostro promedio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

    5.4.6. Proyeccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

    12

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    13/158

    ndice General

    5.4.7. Prueba de similitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

    5.4.8. Sistema de Rechazo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

    5.5. Identificacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

    6 PRUEBAS Y RESULTADOS 73

    6.1. Inicializacin de la Base de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

    6.1.1. Localizacin y extraccin de caratersticas . . . . . . . . . . . . . . . . . . . . 73

    6.1.2. Normalizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

    6.1.3. Clculo de rostro promedio y eigenfaces . . . . . . . . . . . . . . . . . . . . . 74

    6.1.4. Generacin de la pirmide de imgenes . . . . . . . . . . . . . . . . . . . . . 81

    6.2. Pruebas de Reconocimiento de Rostros . . . . . . . . . . . . . . . . . . . . . . . . . . 82

    6.2.1. Pruebas de reconocimiento de la base de datos . . . . . . . . . . . . . . . . . 87

    6.2.2. Pruebas de reconocimiento de imgenes con variacin en escala . . . . . . . . 87

    7 CONCLUSIONES Y PERSPECTIVAS 97

    7.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

    7.2. Perspectivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

    Bibliografa 99

    A Aplicaciones 105

    B Hoja de registro 107

    C Artculos de Investigacin 109

    C.1. Modelo experimental que verifica la ley de cada libre usando una cmara de video . 110

    C.2. Imagen promedio de un conjunto de rostros de las carreras de Ingeniera en Com-

    putacin y Matemticas Aplicadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

    D Cdigos de programas en MATLAB 127

    D.1. Variacin total (programa) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

    D.2. Extraccin de la regin elptica del rostro (programa) . . . . . . . . . . . . . . . . . 131

    D.3. Normalizacin de las regiones elpticas en resolucin y suavizado con TV (programa) 140

    D.4. Clculo de eigenfaces (programa) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

    D.5. Generacin de la pirmide de imgenes (programa) . . . . . . . . . . . . . . . . . . . 148

    13

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    14/158

    ndice General

    D.6. Verificar imgenes que conforman las bases de datos (programa) . . . . . . . . . . . 150

    D.7. Reconcimiento de rostros, prueba de verificacin de cambios de escala . . . . . . . . 155

    14

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    15/158

    Lista de Figuras

    1.1. Problemas de investigacin en la automatizacin del reconocimiento facial. . . . . . . . . 21

    1.2. Configuracin de un sistema genrico de reconocimiento facial. . . . . . . . . . . . . . . 22

    1.3. Fotografa. a) Rostro original; b) Mapa de piel; c) Mapa de ojos. . . . . . . . . . . . . . 24

    1.4. Regin de la elipse. a) Figura geomtrica; b) Regin elptica en el rostro. . . . . . . . . . 24

    1.5. Sistema de reconocimiento facial basado en eigenspace estndar. . . . . . . . . . . . . . 25

    2.1. Fotografas superpuestas. Rostros con variacin en escala (ancho, alto y profundidad). . 28

    2.2. Etapas que componen la metodologa de este proyecto. . . . . . . . . . . . . . . . . . . . 29

    3.1. Vecindades. a)N4(p)y b)N8(p), del pxel p con coordenadas (m,n). . . . . . . . . . . . 32

    3.2. En mtrica 4, el puntop es adyacente al punto qy no al puntor. . . . . . . . . . . . . . 32

    3.3. Camino de longitd 4 en mtrica 8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.4. Bajo la mtrica 8, la regin se encuentra completamente conectada. Bajo mtrica 4, la

    regin debe ser vista como tres regiones 4-conectadas con 8, 4 y 2 elementos respectivamente. 33

    3.5. Regiones conectadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    3.6. Una imagen y su histograma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    3.7. Cubo de 24 bits RGB. a) Esquema, normalizado a valores entre [0,1]; b) Cubo de colores. 36

    3.8. Imagen en color (superior) convertida a escala de grises (media) y binarizada (inferior)

    con umbralizado por el mtodo de Otsu. . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    3.9. (a) Imagen binaria; (c-d) Secuencia de etiquetados. . . . . . . . . . . . . . . . . . . . . . 40

    3.10. Vector xformado con pxeles den imgenes. . . . . . . . . . . . . . . . . . . . . . . . . 41

    3.11. Resultado de la regularizacin por TV para una funcin con ruido (imagen superior) y

    para una imagen con un mandril (imagen inferior). Las imgenes de la izquierda son las

    originales, las siguientes muestran los resultados de la regularizacin para los valores de

    =0.0001, 0.001, 0.01, 0.1 y 1.0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

    15

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    16/158

    Lista de Figuras

    3.12. Estructura de imagen piramidal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    3.13. Filtro Gaussiano pasa bajas en el dominio del espacio. . . . . . . . . . . . . . . . . . . . 53

    4.1. Set fotogrfico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

    4.2. Diagrama esquemtico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

    4.3. Registro de datos por persona. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

    4.4. Imgenes faciales en color, adquiridas en el set fotogrfico e integrarn la base de datos

    del sistema de reconocimiento facial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

    4.5. Imgenes con cambio de escala y las fotos correspondientes al rostro. . . . . . . . . . . . 60

    4.6. Ejemplos de imgenes de prueba. Observese el cambio de escala en el rostro de cada imagen. 60

    4.7. Nuevo conjunto de imgenes para integrar la base de datos. . . . . . . . . . . . . . . . . 61

    5.1. Diagrama a bloques del sistema de reconocimiento automtico de rostros con variacin

    en escala. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

    5.2. Ejemplos de imgenes de entrada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

    5.3. Fases en la extraccin de caractersticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

    5.4. Componentes 8-conectadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

    5.5. Ejemplo de normalizacin y suavizado. a) Resolucin 274x198 pxeles; b) Resolucin

    241x175 pxeles; c) Suavizado con variacin total. . . . . . . . . . . . . . . . . . . . . . . 68

    5.6. Niveles 1-7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

    5.7. Rostros femeninos normalizados en tamao, iluminacin y con suavizado. . . . . . . . . 70

    5.8. Imagen promedio, rostros femeninos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

    5.9. Conjunto de eigenfaces para rostros femeninos. . . . . . . . . . . . . . . . . . . . . . . . 71

    5.10. Ejemplo de identificacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

    6.1. Imgenes faciales que integrarn la base de datos del sistema de reconocimiento de rostros. 75

    6.2. Extraccin de la regin de la elipse (imgenes en color) en el rostro. . . . . . . . . . . . 76

    6.3. Conjunto de imagenes normalizados en tamao y suavizado con TV. . . . . . . . . . . . 78

    6.4. Rostros masculinos normalizados en tamao, iluminacin y suavizados con TV. . . . . . 79

    6.5. Imagen promedio, rosotros masculinos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

    6.6. Conjunto de Eigenfaces para rostros masculinos. . . . . . . . . . . . . . . . . . . . . . . 80

    6.7. Rostros femeninos normalizados en tamao, iluminacin y suavizados con TV. . . . . . 80

    6.8. Imagen promedio, rostros femeninos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

    16

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    17/158

    6.9. Conjunto de eigenfaces para rostros femeninos. . . . . . . . . . . . . . . . . . . . . . . . 81

    6.10. Imagen promedio, para rostros mixtos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

    6.11. Conjunto de eigenfaces, para rostros mixtos. . . . . . . . . . . . . . . . . . . . . . . . . . 82

    6.12. Nivel 7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

    6.13. Nivel 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

    6.14. Nivel 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

    6.15. Nivel 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

    6.16. Nivel 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

    6.17. Nivel 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

    6.18. Nivel 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

    6.19. Niveles 1-7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

    6.20. Ejemplos de reconocimiento. a) Nivel 8; b) Nivel 7; c) Nivel 6; d) Nivel 5; y e) Nivel 4. . 88

    6.21. Ejemplos de imgenes de prueba. Observese el cambio de escala en el rostro de cada imagen. 89

    6.22. Imgenes con cambio de escala y las fotos correspondientes al rostro. . . . . . . . . . . . 89

    6.23. Elipses reducidas a la resolucin de 92 112. . . . . . . . . . . . . . . . . . . . . . . . . 90

    6.24. Imgenes de prueba con variacin en escala reducidas a, elipses con resolucin de 92112,

    con variacin en escala. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 906.25. Resultado de la prueba, identificacin de las cinco imgenes de prueba con variacin en

    escala en la resolucin ms baja, cinco aciertos. . . . . . . . . . . . . . . . . . . . . . . . 92

    6.26. Nuevo conjunto de imgenes para integrar la base de datos. . . . . . . . . . . . . . . . . 93

    6.27. Extraccin de la regin de la elipse (imgenes en color) del nuevo conjunto de rostros. . 94

    6.28. Conversin a niveles de grises de la regin de la elipse del nuevo conjunto de rostros. . . 95

    6.29. Imgenes normalizadas en resolucin y suavizado con TV del nuevo conjunto de rostros. 95

    B.1. Hoja de registro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

    C.1. Articulo presentado en la primera Semana de la Computacin y Matemticas Aplicadas

    2008, UAM Cuajimalpa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

    C.2. Articulo presentado en la primera Semana de la Computacin y Matemticas Aplicadas

    2008, UAM Cuajimalpa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

    17

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    18/158

    Lista de Tablas

    Lista de Tablas

    1.1. Tcnicas de reconocimiento facial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    1.2. Bases de datos pblicas de imgenes faciales. . . . . . . . . . . . . . . . . . . . . . . . . 24

    4.1. Lista de materiales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

    4.2. Adquisicin de imgenes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

    6.1. Parmetros del conjunto de elipses. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

    6.2. Niveles en la pirmide de imgenes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

    6.3. Resultados de Reconocimiento para 49 imgenes. . . . . . . . . . . . . . . . . . . . . . . 87

    6.4. Parmetros del nuevo conjunto de elipses. . . . . . . . . . . . . . . . . . . . . . . . . . . 91

    18

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    19/158

    Captulo 1

    INTRODUCCIN

    En esta seccin se presenta una aproximacin al estado actual de la investigacin en reconocimien-to de rostros y se mencionan algunos estudios que formarn parte del desarrollo de este proyecto,

    localizacin de ojos y extraccin elptica de la cara, as como reconocimiento de rostros basado en

    eigensapace, entre otros.

    1.1. Estado del Arte

    El problema de reconocimiento de rostros [1], no es un mero problema de reconocimiento de

    formas o patrones o imgenes estticas, considera tareas computacionales aun ms generales relativas

    a la percepcin de objetos tridimensionales proyectados en un plano fotogrfico en escenas dinmicas

    y con variabilidad en la iluminacin, escala, ruido, defectos naturales de las personas, envejecimiento,

    maquillaje, lentes y peinado.

    1.1.1. El rostro visual

    El rostro juega un papel vital en nuestra vida diaria por su amplia variedad de funciones. Al

    visualizar la expresin facial podemos determinar, en alguna medida, elementos tales como: el modo

    de juzgar, el carcter o las intenciones. Otras seales faciales, ms explicitas, nos permiten estimar

    factores como: la edad, gnero, origen tnico y la identidad. Esta ltima, como seal visual para

    reconocimiento, es una de las tareas principales de investigacin en el rea de reconocimiento de

    rostros o reconocimiento facial.

    19

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    20/158

    1. INTRODUCCIN

    1.1.2. Los cambios en el rostro

    El proceso de identificacin de una persona a partir de su apariencia facial tiene que ser realizada

    en la presencia de una serie de factores que entran en conflicto, alteran la apariencia y hacen la

    tarea aun ms difcil. El rostro puede cambiar su apariencia debido a factores ya sea intrnsecos o

    extrnsecos. Las variaciones intrnsecas toman lugar independientemente de cualquier observador y

    es debida a la naturaleza fsica del rostro. Por otro lado, las variaciones extrnsecas aparecen cuando

    el rostro es observado va la interaccin: luz, rostro y observador

    Generalmente la apariencia de un rostro se altera considerablemente dependiendo de las condi-

    ciones de iluminacin y, en particular, de la proyeccin de la sombra propia. Las caractersticas de la

    cmara (o lente) usadas para observar el rostro tambin afectan la calidad de la imagen. Otros ob-

    jetos en la escena pueden causar oclusin, y sombras, as como alteraciones en la luz incidente. Unade las fuentes de variacin ms significativas es el cambio en la posicin. Es de notar que, la posicin

    de un rostro est determinada por la orientacin y posicin tridimensional (3D) del observador. La

    causa principal del cambio en la posicin es relativa al movimiento rgido entre el observador y el

    sujeto. Un rostro sufre movimiento rgido cuando este cambia su posicin y orientacin en el espa-

    cio tridimensional relativo al observador. Un rostro tambin puede sufrir un movimiento no rgido

    cuando su forma tridimensional cambia debido, por ejemplo, al hablar o por su expresin facial.

    Esto resulta en una variacin intrnseca de la apariencia. Aunque estos tipos de movimiento ocurren

    juntos, en general se conviene en tratarlos de forma separada. En este trabajo se considera el rostro

    en forma rgida con una expresin neutra.

    1.1.3. Automatizacin del reconocimiento facial

    En la automatizacin del reconocimiento facial, el esfuerzo ha sido multidisciplinario y en esta

    tarea han participado reas tan variadas como las ciencias de la computacin, la ciencia cogniti-

    va, la matemtica, la fsica, la psicologa y la neurobiologa. Dentro de las aplicaciones deseables del

    reconocimiento de rostros basado en computadora, se incluyen interfaces hombre-mquina, multime-

    dia, vigilancia, seguridad, teleconferencia, comunicacin, animacin, etc. Por consiguiente, durante

    los aos recientes se han hecho grandes esfuerzos de investigacin en el estudio y desarrollo de

    modelos computacionales, algoritmos y sistemas de visin por computadora para el reconocimiento

    automtico de rostros.

    Grosset al. [2], menciona que han emergido sistemas capaces de alcanzar razones de reconocimien-

    20

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    21/158

    1.1. Estado del Arte

    Figura 1.1: Problemas de investigacin en la automatizacin del reconocimiento facial.

    to que exceden el 90 % de precisin bajo condiciones controladas. Por otro lado, la variacin en la

    escala de factores tales como la iluminacin, la oclusin y la expresin facial entre otras an no es

    muy bien entendida.

    Yanget al. [3], confirma que la deteccin de rostros desde una imagen es un reto dada la varia-

    bilidad en la escala, ubicacin, orientacin, y posicin (Fig. 1). Por otro lado, factores como: cambios

    en la expresin facial, oclusin, y diferentes condiciones de iluminacin, cambian la apariencia de los

    rostros.

    En la Fig. 1.1 se ilustran los problemas relacionados que componen un sistema general de re-

    conocimiento facial, estos se detallan a continuacin.

    Localizacin facial (face localization). Su objetivo es determinar la posicin de un nico rostro;

    este es un problema de deteccin que se simplifica asumiendo que una imagen de entrada slo

    tiene un rostro [4, 5].

    Deteccin de caractersticas faciales (facial feature detection). La meta es detectar la presencia

    y localizacin de caractersticas tales como: ojos, nariz, boca, etc., asumiendo que una imagen

    de entrada slo tiene un rostro [6].

    21

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    22/158

    1. INTRODUCCIN

    Figura 1.2: Configuracin de un sistema genrico de reconocimiento facial.

    Reconocimiento de rostros (face recognition). Compara una imagen de entrada (de prueba)

    contra una base de datos (galera) y reporta una identificacin (comparacin acertada) si hay

    alguna [7, 8, 9]. Con respecto al reconocimiento con variacin en escala Turk y Pentlad [7]

    presentan resultados del orden del 60 % de aciertos.

    Autentificacin facial (face authentication). El propsito es verificar el reclamo de un individuo

    en una imagen de entrada.

    Rastreo facial (face tracking). Mtodos que estiman de manera contina la ubicacin y posible

    orientacin de un rostro en una secuencia de imgenes en tiempo real.

    Reconocimiento de expresiones faciales (facial expresin recognition). Tiene que ver con la

    identificacin de estados afectivos (alegra, tristeza, disgusto, etc.) en rostros humanos.

    Zhao et al. [10], mencionan que un sistema automtico de reconocimiento facial genrico tiene que

    considerar las siguientes etapas (Fig. 1.2): a) Imagen de entrada; b) Deteccin y extraccin de

    caractersticas faciales; c) Reconocimiento facial e identificacin.

    As tambin, indican que los avances en tcnicas de reconocimiento facial (Tabla 1.1), se pueden

    clasificar en tres grupos amplios: en mtodos holsticos (holistic methods), en mtodos basados en

    caractersticas (feature-based methods) y en mtodos hbridos (hibrid methods). En el primer caso,

    las imgenes faciales son representadas como un arreglo bidimensional de pxeles y son comparados

    contra una o varias plantillas que representan el rostro completo. Este trabajo de tesis emplea la

    tcnica eigenface, ya que aqu se aplican algunos de los modelos matemticos ms utilizados en

    22

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    23/158

    1.1. Estado del Arte

    Tabla 1.1: Tcnicas de reconocimiento facial

    MtodosMtodos HolsticosHolsticos

    Anlisis de componentes principalesAnlisis de componentes principales (PCA)(PCA)

    EigenfacesEigenfacesEigenfacesEigenfaces probabilisticosprobabilisticos

    FisherfacesFisherfaces//subespaciosubespacio LDALDA

    SVMSVM

    EvolucinEvolucin

    Lneas caractersticasLneas caractersticas

    ICAICA

    Otras representacionesOtras representaciones

    LDA/FLDLDA/FLD

    PDBNNPDBNN

    Mtodos basados en caractersticasMtodos basados en caractersticas

    MtodosMtodos geometricosgeometricos

    Arquitectura de enlace dinmicoArquitectura de enlace dinmico

    Modelos deModelos de MarkovMarkovConvolucin de red neuronalConvolucin de red neuronal

    Mtodos hbridosMtodos hbridos

    EigenfacesEigenfaces modularesmodulares

    LFA hbridosLFA hbridos

    Forma normalizadaForma normalizada

    Basados en componentesBasados en componentes

    AproximacinAproximacin

    MtodosMtodos HolsticosHolsticos

    Anlisis de componentes principalesAnlisis de componentes principales (PCA)(PCA)

    EigenfacesEigenfacesEigenfacesEigenfaces probabilisticosprobabilisticos

    FisherfacesFisherfaces//subespaciosubespacio LDALDA

    SVMSVM

    EvolucinEvolucin

    Lneas caractersticasLneas caractersticas

    ICAICA

    Otras representacionesOtras representaciones

    LDA/FLDLDA/FLD

    PDBNNPDBNN

    Mtodos basados en caractersticasMtodos basados en caractersticas

    MtodosMtodos geometricosgeometricos

    Arquitectura de enlace dinmicoArquitectura de enlace dinmico

    Modelos deModelos de MarkovMarkovConvolucin de red neuronalConvolucin de red neuronal

    Mtodos hbridosMtodos hbridos

    EigenfacesEigenfaces modularesmodulares

    LFA hbridosLFA hbridos

    Forma normalizadaForma normalizada

    Basados en componentesBasados en componentes

    AproximacinAproximacin

    reconocimiento de rostros, en particular el mtodo de anlisis de componentes principales (PCA,

    Principal Component Analysis) que se emplea para reducir la dimensionalidad alcanzando buenosrendimientos en tiempo y complejidad computacional, este mtodo se describe ms adelante, en

    la seccin 3.2. En el segundo caso, se toman como base algunas caractersticas geomtricas del

    rostro como la distancia entre diferentes puntos faciales, para su comparacin. El tercer caso es una

    combinacin de los dos anteriores.

    Hajati et al. [11], introducen un mtodo para localizacin facial y reconocimiento en imgenes

    de color. El mtodo propuesto emplea la localizacin de o jos por cmputo y extraccin de la regin

    elptica de la cara (Figs. 1.3 y 1.4).

    Ruiz-del-Solar [12], presenta un estudio de reconocimiento de rostros basado en eigenspace, que

    corresponde a una de las metodologas ms utilizadas para el reconocimiento de rostros en im-

    genes digitales. Mencionan que se han propuesto diferentes aproximaciones basadas en eigenspace:

    estndar, differentialo kernel eigenspace. El estudio considera aspectos tericos as como simula-

    ciones empleando bases de datos pblicas Yale Face Database y FERET (Tabla 1.2). La Fig. 1.5

    muestra un ejemplo, diagrama a bloques, de un sistema de reconocimiento basado en eigenspace.

    23

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    24/158

    1. INTRODUCCIN

    (a) (b) (c)

    Figura 1.3: Fotografa. a) Rostro original; b) Mapa de piel; c) Mapa de ojos.

    (a) (b)

    Figura 1.4: Regin de la elipse. a) Figura geomtrica; b) Regin elptica en el rostro.

    Tabla 1.2: Bases de datos pblicas de imgenes faciales.

    MITMIT ftp://whitechapel.media.mit.edu/pub/images/ftp://whitechapel.media.mit.edu/pub/images/

    FERETFERET httphttp://://www.nist.govwww.nist.gov//humanidhumanid//feretferet

    YaleYale httphttp://://cvc.yale.educvc.yale.edu

    AT&TAT&T http://www.uk.research.att.comhttp://www.uk.research.att.com

    HarvardHarvard ftpftp://://ftp.hrl.harvard.eduftp.hrl.harvard.edu//pubpub//facesfaces//

    Bases de datos pblicasBases de datos pblicas

    MITMIT ftp://whitechapel.media.mit.edu/pub/images/ftp://whitechapel.media.mit.edu/pub/images/

    FERETFERET httphttp://://www.nist.govwww.nist.gov//humanidhumanid//feretferet

    YaleYale httphttp://://cvc.yale.educvc.yale.edu

    AT&TAT&T http://www.uk.research.att.comhttp://www.uk.research.att.com

    HarvardHarvard ftpftp://://ftp.hrl.harvard.eduftp.hrl.harvard.edu//pubpub//facesfaces//

    Bases de datos pblicasBases de datos pblicas

    24

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    25/158

    1.2. Descripcin de Captulos

    Figura 1.5: Sistema de reconocimiento facial basado en eigenspace estndar.

    1.2. Descripcin de Captulos

    En el estado del arte, no se ve claro que el reconocimiento de rostros con variacin en la escala de

    las imgenes sea un problema resuelto. Si el ser humano es capaz de hacer este reconocimiento, es de

    esperar que un sistema automtico artificial lo pueda hacer. Cules son los factores que dificultan

    este reconocimiento? Cmo se puede aproximar una mejor solucin a este problema? Para dar

    respuesta a esta y otras interrogantes se presentan en este proyecto las tcnicas que permiten hacer

    el estudio de este problema. A continuacin se describen los captulos siguientes que conforman este

    trabajo de investigacin.En el captulo 2, Problema de Investigacin, se describen el problema de investigacin, objetivos,

    justificacin y metodologa.

    En el captulo 3, Antecedentes Tericos, se presentan los Conceptos Fundamentales relativos a

    Procesamiento Digital de Imgenes y Reconocimiento de Patrones. Tambin se presentan las tcnicas

    propuestas para el desarrollo de este proyecto de tesis. Anlisis de Componentes Principales, se utiliza

    para reducir la dimensionalidad de los datos (imgenes en este proyecto). La Tcnica Eigenface, hace

    posible el reconocimiento de rostros. La Normalizacin, mejora la probabilidad de la identificacin

    y consiste en ajustar las imgenes en resolucin, suavizado e iluminacin. Variacin Total, se utiliza

    para suavizar las imgenes, se incluye, adems, una seccin que muestra cmo discretizar la variacin

    total de una imagen. Procesamiento Multiresolucin, con esta tcnica se puede cambiar la escala de

    las imgenes.

    En el captulo 4, Protocolo de Adquisicin de Imgenes, se presentan la construccin del set

    fotogrfico y la adquisicin de imgenes, para la creacin de la base de datos, as como de prueba.

    25

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    26/158

    1. INTRODUCCIN

    En el captulo 5, Sistema de Reconocimiento Automtico de Rostros, se estudia como se hace: la

    localizacin facial, la extraccin de caractersticas, la normalizacin, la obtencin del rostro promedio

    y eigenfaces, la generacin de la pirmide de imgenes, y el reconocimiento, que forman parte del

    sistema de reconocimiento automtico de rostros.

    En el captulo 6, Pruebas y Resultados, se muestran las pruebas de localizacin y reconocimiento

    de rostros as como los resultados de las mismas.

    Finalmente, en el captulo 7, Conclusiones, se presentan las observaciones finales que resultarn

    en este proyecto, as como, las recomendaciones de trabajo futuro.

    26

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    27/158

    Captulo 2

    PROBLEMA DE INVESTIGACIN

    En esta seccin se describe el problema de investigacin as como los objetivos del proyecto.Hay que hacer notar que los objetivos reflejan el estado actual de la investigacin, as como las

    sugerencias de los revisores del proyecto. Esto es, los objetivos se han afinado y, en particular, los

    objetivos especficos presentan la certidumbre natural que resulta despus de concluir las etapas que

    conforman este proyecto.

    2.1. Planteamiento del Problema

    Para el estudio del problema de variacin en escala en el reconocimiento de rostros se propone:aplicar un modelo matemtico e implementarlo en un programa computacional para la identificacin

    de personas en fotografas con la caraterstica de variacin en escala. Consideremos la imagen de la

    Fig. 2.1, esta consiste de dos fotografas superpuestas, imgenes monoculares, ambas contienen la

    imagen de un rostro pero con variacin en la escala (ancho, alto y profundidad). Es de inters, que el

    modelo y programa computacional propuesto sea capaz de analizar ambas imgenes y determinar si

    corresponden o no a la misma persona. Es decir, se pretende desarrollar un programa computacional

    que permita de forma automtica, por una parte, determinar la presencia de un rostro en la imagen

    bidimensional y localizar la posicin donde se encuentre, a continuacin, identificar el rostro detec-

    tado. Esto es, comparar el rostro detectado contra una base de datos y determinar si se encuentra

    dentro de la base de datos .

    Este proyecto busca hacer anlisis de imgenes bidimensionales (estticas), como las que corres-

    ponden a fotografas, esto es, el proyecto se acota al problema de reconocimiento de rostros, aunque se

    tomaran en cuenta elementos relativos a los problemas de localizacin y deteccin de caractersticas.

    27

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    28/158

    2. PROBLEMA DE INVESTIGACIN

    Figura 2.1: Fotografas superpuestas. Rostros con variacin en escala (ancho, alto y profundidad).

    Estn fuera del alcance de este trabajo las reas de autentificacin facial, anlisis de imgenes en

    movimiento, as como de reconocimiento de expresiones faciales.

    2.2. Objetivos

    2.2.1. Objetivo general

    Aplicar un modelo matemtico para la localizacin y reconocimiento de rostros en imgenes

    monoculares (imgenes bidimensionales adquiridas con un cmara con un solo lente) con variacin

    en escala en fotografas a color que contengan un solo rostro e implementarlo en un programa

    computacional.

    2.2.2. Objetivos particulares

    Modelar el reconocimiento de rostros a travs de las tcnicas: Anlisis de Componentes Prin-

    cipales yEigenfaces.

    Aplicar Variacin Total para el suavizado de imgenes.

    Localizar y extraer caractersticas, mapa de piel y mapa de ojos, en imgenes en color.

    Aplicar procesamiento multiresolucin, para obtener la pirmide de imgenes que permita elmanejo de cambios de escala en fotografas.

    2.3. Justificacin

    El reconocimiento de rostros con variacin en escala tiene aplicaciones potenciales en la identi-

    ficacin de una persona con propsitos de seguridad, salud o para algn tipo de registro o servicio,

    28

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    29/158

    2.4. Metodologa

    Inicializacin

    Evaluacin

    Reconocimiento

    Localizacin

    Inicializacin

    Evaluacin

    Reconocimiento

    Localizacin

    Figura 2.2: Etapas que componen la metodologa de este proyecto.

    por ejemplo, pasar lista en un saln de clases, as como para aplicaciones de teleconferencia, comu-

    nicacin, animacin, etc.

    2.4. Metodologa

    Para alcanzar los objetivos arriba planteados de manera que culminen en el dispositivo tecnolgico

    de inters, es necesario considerar las siguientes etapas: inicializacin, localizacin, reconocimiento

    y evaluacin (Fig. 2.2).

    En la etapa de inicializacin se recopilan los elementos materiales para crear un set fotogrfico

    que permita hacer la adquisicin de las imgenes de prueba y las imgenes que formarn parte de

    la base de datos. Las imgenes de prueba sern imgenes que contengan rostros en condicin de

    variacin en escala. Para las etapas siguientes se crea un programa computacional que implemente

    las tcnicas ms eficientes para localizacin y reconocimiento facial. En la etapa de localizacin

    se determina si existe un rostro en una imagen de prueba dada. En caso de que exista un rostro

    entonces se reescala para que pase a la etapa de reconocimiento en la cual se verifica si existe una

    imagen facial en la base de datos que empate con la imagen de prueba. Finalmente, en la etapa de

    evaluacin se verifica la eficiencia del sistema determinando la cantidad de aciertos y errores en el

    reconocimiento de rostros.

    29

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    30/158

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    31/158

    Captulo 3

    ANTECEDENTES TERICOS

    A continuacin se exponen las bases tericas sobre las que se sustenta este proyecto. Por suimportancia, se enfatizan las tcnicas de anlisis de componentes principales, la tcnica eigenface,

    normalizacin, variacin total y el procesamiento multiresolucin.

    3.1. Conceptos Fundamentales

    Los algoritmos computacionales de este proyecto se fundamentan en conceptos de las reas del

    procesamiento digital de imgenes y reconocimiento de patrones. En esta seccin se describen algunos

    de los conceptos de tratamiento de imgenes mayormente empleados en las tcnicas de localizacin

    y reconocimiento facial.

    3.1.1. Procesamiento digital de imgenes

    Una imagen se define [13, 14, 15], como una funcin bidimensional f(x, y), donde x y y son

    coordenadas espaciales (plano) y la amplitud de fen cualquier par de coordenadas(x, y)es llamado

    laintensidad o nivel de grisde la imagen en ese punto.

    Si los valores de los niveles de gris son cantidades discretas (enteros) entonces a la imagen se

    le llama imagen digital. Esta imagen digital se compone de elementos llamados pxeles (picture

    elements).

    El campo del procesamiento digital de imgenesse refiere al procesamiento de imgenes digitales

    por medio de una computadora.

    Unaimagen binariadenotada como b(x,y)es una imagen digital f(x,y)cuantizada a dos niveles

    de intensidad, 0 y 1.

    31

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    32/158

    3. ANTECEDENTES TERICOS

    (a) (b)

    Figura 3.1: Vecindades. a)N4(p)y b)N8(p), del pxel p con coordenadas (m,n).

    Figura 3.2: En mtrica 4, el punto p es adyacente al punto qy no al punto r.

    Funciones de distancia o mtricas d4y d8de basek. Seanp(m,n)y q(u,v)con m,n,u, v ZZy k={4,8}, entonces la distancia euclidiana entre p yqpara ambas mtricas estarn dadas por:

    d4(p, q) = |m u|+ |n v| =

    (m u)2 + (n v)2 (3.1)

    d8(p, q) = max(|m u|, |n v|) (3.2)

    VecindadesN4(p)yN8(p). Sea(A, )un espacio mtrico bidimensionaluna mtrica cualquiera,

    la vecindad de un pxel p denotada por N(p) es el conjunto de pxeles tales que 0 < (m, n) 1.En la Fig. 3.1 se muestran ambos tipos de vecindades N4(p)y N8(p).

    Puntos conectados. Dos puntos p y qse dicen estar conectados si qest en el conjunto N(p).

    Puntos adyacentes. Un punto p es adyacente al punto qsi ambos estn conectados (Fig. 3.2).

    Un camino entre dos puntos p y qen A es una secuencia de puntos distintos p1, p2, . . . , pn tales

    que p0 =p y pn =q, pi es adyacente a pi1, 1 i ny nes la longitud del camino. Puede haber

    32

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    33/158

    3.1. Conceptos Fundamentales

    Figura 3.3: Camino de longitd 4 en mtrica 8.

    Figura 3.4: Bajo la mtrica 8, la regin se encuentra completamente conectada. Bajo mtrica 4, laregin debe ser vista como tres regiones 4-conectadas con 8, 4 y 2 elementos respectivamente.

    dos tipos de caminos: 4 y 8 conectados. En la Fig. 3.3 se muestra un camino, en mtrica 8, entre los

    puntos p y q. La longitud del camino es de 4 pxeles.

    Una regin conectada Rb(m, n)es un conjunto de puntos p(m,n) tales que existe un caminoque comienza enp1y termina enp2para todop1y p2 R. Al igual que en el caso de caminos, puedehaber regiones 4 y 8 conectadas. En la Fig. 3.4 se muestra una regin 8-conectada de 14 elementos.

    La misma regin en mtrica 4 debe ser vista como tres regiones 4-conectadas con 8, 4 y 2 elementos

    respectivamente.

    Una regin puede ser simplemente conectada (sin hoyos) o mltiplemente conectada (con hoyos).

    En la Fig. 3.5 se muestra un objeto simplemente conectado, en forma de T, y otro multiplemente

    33

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    34/158

    3. ANTECEDENTES TERICOS

    Figura 3.5: Regiones conectadas.

    Figura 3.6: Una imagen y su histograma.

    conectado con un hoyo.

    El histogramade una imagen f(x,y) con L niveles de intensidad o de gris en el rango [0, L-1 ],

    denotado comoh(rk)es una funcin discreta:

    h(rk) =nkN

    (3.3)

    donderkes elk-simonivel de gris,nkes el nmero de pxeles en la imagen con el nivel de intensidad

    rky Nel nmero total de pxeles en la imagen. En la Fig. 3.6 se muestra una imagen y su histograma.

    La funcinh(rk)proporciona un estimado de la probabilidad de ocurrencia de un nivel de gris dado

    nk de igual forma, la funcin h(rk) tambin habla de manera global acerca de la apariencia de la

    imagen. Por ejemplo, un histograma de imagen sesgado a la izquierda nos habla de una imagen con

    poco contraste y obscura, mientras que un histograma con valores sesgados hacia la derecha nos

    habla tambin de una imagen con poco contraste pero con brillo.

    Fundamentos del color. Bsicamente, los colores que los seres humanos y algunos otros animales

    34

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    35/158

    3.1. Conceptos Fundamentales

    perciben en un objeto est determinada por la naturaleza de la luz reflejada sobre el objeto. La

    luz visible est compuesta por una estrecha banda de frecuencias en el espectro electromagntico.

    Un cuerpo que refleja la luz balanceada en todo el espacio visible de longitudes de onda aparece

    en color blanco para el observador. Si la luz es acromtica entonces el color que se percibe va del

    blanco al negro pasando por niveles de grises. La luz cromtica abarca desde los 400 a los 700

    nm aprximadamente en el espectro electromagntico. Se emplean tres cantidades para describir la

    calidad de una fuente de luz cromtica: radiancia, luminacia y brillo. La radianciaes la cantidad de

    energa que fluye desde la fuente de luz, y sus unidades de medidad son en Watts (W). Luminacia,

    medida en lumens (lm), es una medida de la cantidad de energa que un observador percibe de la

    fuente de luz. Elbrilloes un descriptor subjetivo imposible de medir e incorpora la nocin acromtica

    de intensidad y es un factor clave en la descripcin de la sensacin de color. Las caractersticas que

    generalmente se emplean para distinguir un color de otro son el brillo, el matiz y la saturacin. El

    matiz es un atributo asociado con la longitud de onda dominante en una mezcla de longitudes de

    onda. Representa el color dominante percibido por el observador. La saturacin se refiere a la pureza

    relativa o la cantidad de luz blanca mezclada con un matiz. Al matiz y a la saturacin juntas se les

    llamacromaticidad, y, por tanto, un color puede ser caracterizado por su brillo y su cromaticidad.

    Modelos de color. El propsito de un modelo de color (tambin llamado espacio de color o sistema

    de colores) es facilitar la especificacin de colores en alguna forma estndar de aceptacin general.

    En esencia, un modelo de color es una especificacin de un sistema coordenado y un subespacio

    dentro de ese sistema donde cada color se representa por un punto. Los modelos de color que existen

    son: RGB, NTSC, YCbCr, HSV, CMY, CMYK y HSI (ver [13, 16]). A continuacin se describen los

    espacios de color RGB y YCbCr.

    Una imagen de color RGB es una matriz de pxeles de tamao M N 3, donde cada pxeles una combinacin de colores rojo, verde y azul. Por convencin, cada matriz se referencia como

    componente rojo, verde y azul de la imagen RGB. Una imagen RGB es de 8 bits (uint8) si su rango

    de valores es de [0,255], o de 16 bits (uint16) para [0,65535], o double para [0,1]. El nmero de bits

    empleados para representar el pxel de las componentes de la imagen determinan la profundidad de

    bit (bit depth). Por ejemplo, si cada una de las componentes de la imagen es de 8 bits, entonces

    la imagen RGB correspondiente se dice que es de 24 bits de fondo. El nmero total de colores en

    una imagen RGB de 24 bits es de (28)3 = 16, 777, 216. El espacio de color RGB, generalmente se

    muestra como un cubo de colores como se muestra en la Fig. 3.7. Los vrtices del cubo son los colores

    primarios (rojo, verde y azul) y secundarios (cyan, magenta y amarillo) de la luz.

    35

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    36/158

    3. ANTECEDENTES TERICOS

    (a) (b)

    Figura 3.7: Cubo de 24 bits RGB. a) Esquema, normalizado a valores entre [0,1]; b) Cubo de colores.

    El termino nivel de gris (gray level) se emplea para referirse a la intensidad de las imgenes

    monocromticas.

    El espacio de color YCbCr. En este espacio, la informacin de luminancia se representa por una

    componente nica, Y, y la informacin de color se almacena como dos componentes diferencia de

    color, Cb y Cr. La componente Cb es la diferencia entre la componente azul y un valor de referencia, y

    la componente Cr es la diferencia entre la componete roja y un valor de referencia. La transformacin

    empleada para convertir imgenes de RGB a YCbCr es atravs de la siguiente ecuacin:

    Y

    Cb

    Cr

    =

    16

    128

    128

    +

    65.481 128.553 24.966

    37.797 74.203 112.00112.000 93.786 18.214

    +

    R

    G

    B

    (3.4)

    3.1.2. Reconocimiento de patrones

    El reconocimiento de patrones [17], o reconocimiento de formas, se define como la disciplina

    cientfica cuya meta es la clasificacin de objetos en un nmero de categoras o clases. Al proceso

    que permite extraer la regin de inters de una imagen se le denomina segmentacin.

    3.1.2.1. Segmentacin de un objeto basado en el umbralizado

    La segmentacin automtica de imgenes es, en general, una de las tareas ms dficiles de realizar

    en anlisis de imgenes. Tiene una influencia determinante en el correcto desempeo de un sistema

    36

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    37/158

    3.1. Conceptos Fundamentales

    Figura 3.8: Imagen en color (superior) convertida a escala de grises (media) y binarizada (inferior)con umbralizado por el mtodo de Otsu.

    de reconocimiento automtico de objetos (SRAO). En aplicaciones donde muchas de las condiciones

    pueden ser controladas, por ejemplo la iluminacin, el que los objetos no se toquen o traslapen entre

    ellos facilita el proceso de segmentacin.

    La idea bsica de las tcnicas basadas en el umbralizado [14, Cap. 2], es convertir las imgenes

    f(x,y) en niveles de gris en una imagen binaria b(x,y), buscando que los objetos de inters de la

    imagen queden separadas del fondo.

    El mtodo de Otsu [18], es un mtodo de umbralizado automtico. Para su correcto funcionamien-

    to el mtodo de Otsu supone que los pxeles de la imagen f(x,y)a binarizar pueden ser separados a

    travs de un umbral u(a determinar) en dos clases: C1, la clase del objeto u objetos de inters y

    C2, la clase de los pxeles del fondo.

    Para el anlisis que sigue se hace uso de la siguiente notacin:

    rel nivel de gris de un pxel con coordenadas (x,y).

    Lel nmero de niveles de gris de la imagen f(x,y)con0 r L 1.

    pr es el nmero de pxeles con el nivel de gris r.

    37

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    38/158

    3. ANTECEDENTES TERICOS

    NT =p0+p1+ . . . +pr+ pL1 es el nmero total de pxeles.

    p(r) = prNT

    el histograma normalizado de niveles de gris de f(x,y), tal queL1

    p(r) = 1.0r=0

    uel umbral a determinar. El objetivo consiste en encontrar el valor ptimo de u, u

    al maxi-mizar o minimizar una funcin criterio.

    El mtodo de Otsu se basa en la tcnica del anlisis discriminante al maximizar alguna medida que

    permita separar clases: la de los objetos y las del fondo. Una de estas medidas es la siguiente:

    J1(u) =P1(u)P2(u)[1(u) 2(u)]2

    P121(u) + P2(u)22(u)

    (3.5)

    donde:

    P1(u) = Pr(C1) =

    ur=0

    p(r)

    P2(u) = Pr(C2) =

    L1r=u+1

    1p1(u)

    1(u) =

    ur=0

    p(r | C1) = 1p1(u)

    ur=0

    rp(r)

    2(u) =L1

    r=u+1

    rPr(r | C2) = 1p2(u)

    L1r=u+1

    rp(r)

    21(u) =L1

    r=0

    (r1(u))2Pr(r | C1) = 1

    p1(u)

    ur=0

    (r 1(u))2p(r)

    22(u) =L1

    r=0

    (r2(u))2Pr(r | C2) = 1

    p2(u)

    ur=0

    (r 2(u))2p(r)

    para poder maximizar el criterio dado por la ecuacin (3.5) las medidas de las dos clases deberan

    estar bastante bien separadas y las varianzas deberan ser lo ms pequeas posibles. Si esto no

    sucede, el valor del umbral obtenido simplemente no producir el resultado deseado. Una imagen

    con un fondo muy grande comparado con el objeto u objetos en la imagen puede tambin dar lugar

    a valores de umbral que produzcan resultados indeseados.

    El valor ptimo u puede encontrarse al buscar en el rango [0,L-1 ] el valor de uque maximice

    (3.5). Esto es:

    38

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    39/158

    3.2. Anlisis de Componentes Principales

    u =arg max0uL1

    J1(r) (3.6)

    En la Fig. 3.8 se muestra una imagen binarizada por el mtodo de Otsu.En el apndice C.1, se ilustra como ejemplo la segmentacin de un objeto en cada libre.

    3.1.2.2. Etiquetado de regiones o componentes conectadas

    Una vez que una imagen ha sido umbralizada a travs de algunos de los mtodos, sus componentes

    conectadas pueden ser etiquetadas. Los pxeles en una regin conectada forman una regin que puede

    representar un objeto dado a reconocer. El etiquetado de componentes conectadas (ECC) puede ser

    visto como una segunda etapa en el proceso de segmentado de una imagen. Se emplea un algoritmo

    recursivo que consiste de los cuatro pasos siguientes, dada una imagen binaria b(x,y):

    1. Barrer b(x,y)hasta encontrar un pxel de tipo objeto (con valor 1 o L-1) an no etiquetado y

    asignarle una nueva etiqueta E.

    2. Asignar en forma recursiva la etiqueta Ea todos sus vecinos, segun la mtrica elegida.

    3. Detener si durante el recorrido no se encuentran ms pxeles de tipo objeto.

    4. Regresar al paso 1.

    En la Fig. 3.9a se muestra una imagen binaria. En las Figs. 3.9b-d se muestra la secuencia de

    etiquetados hasta obtener la imagen etiquetada final. En la Fig. 3.9a las etiquetas son la unidad. En

    la Fig. 3.9b se distingue la segunda regin con la etiqueta 2 y as sucesivamente para las regiones 3

    y 4. Una de las ventajas de este algoritmo es que en una sola pasada se puede obtener el resultado

    final.

    La tcnica de umbralizado y la tcnica de etiquetado de componentes conectadas pueden ser

    combinadas para separar las regiones de cada objeto en una imagen. Cada una de las regiones

    etiquetadas pueden ser utilizadas para entrenar clasificadores para el reconocimiento de objetos.

    3.2. Anlisis de Componentes Principales

    La tcnica Anlisis de Componentes Principales (PCA,Principal Components Analysis) [19, 20]

    es una tcnica matemtica til que ha encontrado aplicacin en los campos del reconocimiento de

    rostros y en la compresin de imgenes ya que es una tcnica comn para encontrar patrones o

    rasgos principales finitos en problemas de dimensin infinita.

    39

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    40/158

    3. ANTECEDENTES TERICOS

    Figura 3.9: (a) Imagen binaria; (c-d) Secuencia de etiquetados.

    La tcnica consiste de los siguientes pasos: (1) Recopilar el conjunto de datos; (2) Obtener el

    conjunto promedio de los datos; (3) Calcular la matriz de covarianza; (4) Seleccionar los componentes,

    formar un vector caracterstico y calcular los eigenvectores y eigenvalores de la matriz de covarianza.

    3.2.1. Conjunto de datos

    Seanun conjunto de imgenes de tamao MN, dondeMes el nmero de pxeles por renglny Nes el nmero de pxeles por columna. Entonces, un vector:

    x= x1, x2,...,xn (3.7)

    Se compone de npxeles, donde cada elemento es un pxel localizado en la misma posicin de

    cada imagen (Fig. 3.10). Esto implica que se puede tener una matriz Xde vectores xk tales que:

    X= x1,x2, ...,xk (3.8)

    40

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    41/158

    3.2. Anlisis de Componentes Principales

    Figura 3.10: Vector xformado con pxeles de nimgenes.

    donde k=1,2,...,MNy

    xk = x1, x2,...,xn (3.9)

    Esta matriz, X, de vectores representa al conjunto de datos.

    3.2.2. Vector promedio

    El vector promedio del conjunto de datos estar dado por la relacin:

    mX= 1MN

    MNk=1

    xk (3.10)

    3.2.3. Matriz de covarianza

    La matriz de covarianza CX es una medida de la dispersin entre diferentes variables (ms de

    una dimensin). Para el caso de un vector xk y el vector promedio mX tenemos que la matriz de

    covarianza est dada por:

    CX= 1

    MN

    MNk=1

    (xk mX)(xk mX)T

    (3.11)

    Sean ei y i, i=1, 2, ..., n, los eigenvectores y eigenvalores correspondientes de la matriz CX,

    ordenados por conveniencia en orden descendente, de modo que j = j+1, paraj = 1, 2, . . . , n 1.Por definicin, los eigenvectores y eigenvalores de una matriz de dimensinnnsatisfacen la relacin:

    CXei = iei (3.12)

    41

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    42/158

    3. ANTECEDENTES TERICOS

    parai = 1, 2,...,n.

    3.2.4. Componentes principales

    La transformacin en componentes principales [13] est dado por:

    Y= A(xk mX) (3.13)

    donde Arepresenta el vector caracterstico o vector propio (eigenvector, del alemn eigenpropio).

    Los renglones de A representan los eigenvectores de CX. Los eigenvalores, son los elementos a lo

    largo de la diagonal de CY, donde:

    CY= ACXAT (3.14)

    Los eigenvectores [21], son vectores unitarios, es decir su longitud es 1 y forman un conjunto

    ortonormal de vectores en la norma inducida por la matriz de covarianza (son perpendiculares entre

    ellos respecto a CX) y aportan informacin acerca de los patrones en los datos. Seleccionando los

    eigenvalores de mayor valor se consigue la reduccin de dimensionalidad y la compresin de datos, en

    el sentido de que con estos vectores se cubre el espacio de los datos. Hay reduccin de dimensionalidad

    en la medida en que la dispersin de los datos se alinean a un eigenvector en particular de manera

    que se pueden omitir aquellos eigenvectores en los cuales no sea relevante tal alineacin, es decir,

    su eigenvalor sea pequeo. Hay compresin de datos en la medida en que se pueden seleccionarslo aquellos eigenvalores, que sean ms representativos en peso (de mayor valor) de manera que

    es posible recuperar la informacin original sin gran perdida de datos, o sea, con error cuadrtico

    medio pequeo. Esto es, sea:

    X= ATY + mX (3.15)

    el conjunto de datos original. Entonces, para un conjunto qreducido de eigenvectores tenemos que

    Ase hace una matriz de tamao q n, Aq, de manera que la reconstruccin estar dada por:

    X= ATqY + mX (3.16)

    El error cuadrtico medio ecm estar dado por:

    ecm=nj=1

    jq

    j=1

    j =n

    j=q+1

    i (3.17)

    Si q=nel error es cero.

    42

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    43/158

    3.3. La TcnicaEigenface

    3.3. La Tcnica Eigenface

    La tcnica eigenface [7, 22], es el PCA aplicado en imgenes faciales (rostros) sobre un espacio

    representado por un conjunto de rostros grande. Los caractersticos significativos son conocidos

    comoeigenfacesporque son los eigenvectores (componentes principales) del conjunto de rostros; que

    asemejan, aunque no necesariamente, a caractersticas tales como los ojos, odos o nariz. La operacin

    de proyeccin caracteriza a un rostro individual por la suma de pesos de los eigenfaces caractersticos,

    de manera que para reconocer un rostro particular solo es necesario comparar estos pesos contra

    aquellos de los rostros conocidos. En trminos matemticos se requiere encontrar los componentes

    principales de la distribucin de rostros, o los eigenvectores de la matriz de covarianza del conjunto de

    imgenes faciales, tratando una imagen como un punto (vector) en un espacio dimensional infinito.

    Posteriormente, se ordenan los eigenvectores de acuerdo a una cantidad relativa a la variacin entrelas imgenes faciales, seleccionando un nmero finito de estos, los ms representativos en peso de

    acuerdo a su eigenvalor y que contribuyen a recuperar la imagen.

    Podemos ver, a cada uno de los eigenvectores, como un pequeo espectro o "fantasma", del

    rostro original, al cual se le llamaeigenface. Cada rostro individual se puede representar en trminos

    de una combinacin lineal de los eigenfaces. Por lo que, un rostro individual se puede aproximar

    empleando solo los "mejores" eigenfaces, aquellos que tienen los eigenvalores ms largos o pesados,

    y que ms contribuyen en la variacin del conjunto de imgenes faciales. Los mejores M eigenfaces

    se extienden sobre un subespacio M-dimensional,espacio facial, de todas las imgenes posibles (se

    tiene la reduccin a Mdimensiones del espacio de rostros de dimensin infinita).

    3.3.1. Resolucin de las imgenes

    Sea Fun conjunto de M imgenes o fotografas de tamao m n,donde:

    F= f1, f2, ..., fM (3.18)

    Las operaciones de clculo que se proponen en la seccion siguiente, se reducen si cada imagen se

    reordena de manera que el tamao o resolucin de las mismas se lleven a la resolucin N1 (todaslas columnas de la imagen se reagrupan en una sola) donde N=mn. De esta forma se obtendr:

    = 1, 2,...,M (3.19)

    que es un conjunto de M imgenes de resolucin N1.

    43

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    44/158

    3. ANTECEDENTES TERICOS

    3.3.2. Clculo de eigenfaces

    El rostro promedio, , del conjunto de fotografas estar dado por:

    = 1M

    Mk=1

    k (3.20)

    Sea:

    i= i

    la diferencia entre la i-esima imagen o fotografa y el rostro promedio. Entonces la matriz de cova-

    rianza estar dada por la relacin:

    C= 1

    M

    Mk=1

    kTk = AA

    T (3.21)

    donde

    A= [12...M]

    es una matriz de tamaoNM. A partir de la matriz de covarianza se pueden obtener los eigenfaces(eigenvectores) y los eigenvalores. Aplicando:

    AATvi = ivi

    donde vi es el vector de eigenfaces y i el conjunto de eigenvalores. Notemos que la resolucin de

    esta operacin estar dada por:

    AAT (NM)(NM)T = (NN)

    Para hacer este clculo es necesario hacer computacionales las operaciones reduciendo la re-

    solucin de las mismas. Aplicando propiedades del lgebra lineal se puede reducir el cmputo de las

    operaciones a un valor dado por MM. Esto es:

    ATA (NM)T(NM) = (MM)

    De esta forma el procedimiento para calcular los eigenvectores y eigenvalores ser el siguiente.

    Consideremos la ecuacin:

    ATAui = iui

    De esta ecuacin obtener los eigenvectores uiy eigenvaloresi. A continuacin ajustar el eigenvector

    ui obtenido multiplicandolo por Aya que:

    AAT(Aui) = i(Aui) (3.22)

    44

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    45/158

    3.3. La TcnicaEigenface

    donde

    vi= Aui (3.23)

    nos da el conjunto de eigenfaces buscado.

    En el apndice C.2, se ilustra como ejemplo el clculo de la imgen promedio as como de los

    eigenfaces correspondientes para un conjunto de doce fotografas.

    3.3.3. Cmo utilizar los eigenfaces para reconocimiento de rostros

    Los eigenfaces son adecuados para describir imgenes faciales bajo condiciones controladas. Un

    valor pequeo M (M

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    46/158

    3. ANTECEDENTES TERICOS

    2 = f (3.27)

    donde

    =

    y

    f=M

    i=1 iui

    De lo anterior hay cuatro posibilidades para una imagen de entrada y su vector patrn: (1)

    espacio facial cercano y clase facial cercana, (2) espacio facial cercano pero ninguna clase facial

    cercana conocida, (3) lejana del espacio facial y clase facial cercana, y (4) lejana del espacio facial y

    ninguna clase facial cercana conocida. En el primer caso, un individuo es reconocido e identificado.En el segundo caso, un individuo desconocido est presente. Los dos ltimos casos indican que la

    imagen no es un rostro. El caso tres muestra un caso tpico de falso positivo que es detectado dada

    la distancia significativa entre la imagen de entrada y el espacio facial. Es decir, un falso positivo

    corresponde a una imagen detectada como si fuera un rostro o siendo un rostro como si formara

    parte de la base de datos. Un falso negativo corresponde a un rostro que no es detectado y que s

    forma parte de la base de datos.

    3.4. Normalizacin

    La normalizacin [1, pag. 93][23], es un proceso que permite mejorar el reconocimiento y con-

    siste en alinear tanto como sea posible las imgenes faciales. La alineacin puede ser en traslacin,

    orientacin y escala.

    Para eliminar la influencia del cabello y del ruido de fondo se puede extraer solo la regin

    elptica de la cara. Para reducir los efectos de los cambios en la iluminacin global y direccional, se

    pueden aplicar sombreado lineal y ecualizacin a las imgenes faciales. Sin embargo, estas operaciones

    pueden ser muy costosas, especialmente en escenas dinmicas. Una alternativa, consiste en aplicaruna correccin en intensidad a cada pxel aplicando la relacin:

    CI(xn) =xn

    (3.28)

    dondeC Irepresenta la correccin en intensidad, xn representa al pxel, representa la intensidad

    media y representa la desviacin estndar de la imagen.

    46

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    47/158

    3.5. Variacin Total

    3.5. Variacin Total

    Variacin total (TV,Total Variation) es una tcnica matemtica que permite suavizar una imagen

    (quitar ruido). En esta seccin se describe su formulacin, sin restriccin y con restriccin a ruido,

    as como su discretizacin.

    3.5.1. Conceptos preliminares

    Cantidades variables llamadas funcionales [24], juegan un papel importante en diferentes pro-

    blemas que se presentan en el anlisis, mecnica, geometra, etc. Unfuncionales una correspondencia

    que asigna un nmero (real) definido a cada funcin (o curva) que pertenece a alguna clase. Por

    tanto, se puede decir que un funcional es una clase de funcin donde la variable es en s misma una

    funcin (o curva). La rama ms desarrollada del clculo de funciones est interesada en la bsqueda

    de mximos y mnimos de funcionales y se le conoce con el nombre de clculo de variaciones.

    SeaJ[y]un funcional de la forma

    J[y] =

    ba

    F(x, y, y)dx (3.29)

    definida en el conjunto de funcionesy(x)la cual tiene primeras derivadas continuas en [a,b] y satisface

    las condiciones de frontera y(a)=A, y(b)=B. Entonces una condicin necesaria para que J[y]tenga

    un extremo para una funcin dada y(x)es que satisfaga la ecuacin de Euler:

    Fy ddx

    Fy = 0 (3.30)

    Las curvas de la ecuacin de Euler se conocen como extremos. La ecuacin de Euler es una

    ecuacin diferencial de segundo orden, su solucin dependera, en general, de las condiciones de

    frontera.

    El problema variacional ms simple consiste en encontrar un extremo dbil de un funcional de la

    forma (3.29), donde la clase de funciones admisibles consisten en todas las curvas suaves que unen

    dos puntos.

    El mtodo de diferencias finitases de amplio uso para resolver problemas variacionales. Con-

    siderando un funcional de la forma (3.29) para encontrar una funcin relacionada de la forma ms

    corta que considera el anlisis clsico procedemos como sigue. Emplear los puntos:

    a= x0, x1, . . . , xn, xn+1= b

    47

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    48/158

    3. ANTECEDENTES TERICOS

    se divide el intervalo [a,b] enn+1 partes iguales. Entonces se reemplaza la curvay=y(x)por la lnea

    poligonal con vrtices

    (x0, A), (x1, y(x1)), . . . , (xn, y(xn), (xn+1, B)),

    y se aproxima la funcional J[y]por la suma:

    J(y1, . . . , yn) =n+1i=1

    F(xi, yi,yi yi1

    h )h, (3.31)

    donde

    yi= y(xi), h= xi xi1

    y0= A yn+1= B

    cada lnea poligonal est determinada por la ordenacin y1, . . . , yn de sus vrtices y la suma (3.31)

    es por tanto, una funcin de n variables y1, . . . , yn.

    3.5.2. Restauracin de la imagen

    Consideremos el problema de restaurar una imagen contaminada con ruido o degradada. Sea

    u0= K utrue+la imagen adquirida dondeKes un operador de nivel borroso y es el nivel de ruido

    o degradacin de la imagen. Encontrar una aproximacinu(x )a la imagen verdaderautrue(x ). TVes un mtodo [25] para recuperar la imagen verdadera, lo ms exacta posible y encontrar una nueva

    imagen en la cual la informacin de inters sea ms obvia y ms fcil de extraer.

    Se puede modificar una imagen disminuyendo la variacin total

    T V(u) |u(x )| dx (3.32)

    en la imagen, mientras se preserva algn ajuste a los datos originales u0. A la ecuacin (3.32) se

    le conoce como variacin total de u. Al resolver la ecuacin siguiente, la nitidez o suavizado de la

    imagen (Fig. 3.11) lo determinanu0y . Esta ecuacin se conoce como la formulacin no restringida

    de Tikhonov.

    minu

    1

    2u u02 + T V(u) (3.33)

    48

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    49/158

    3.5. Variacin Total

    Figura 3.11: Resultado de la regularizacin por TV para una funcin con ruido (imagen superior) ypara una imagen con un mandril (imagen inferior). Las imgenes de la izquierda son las originales,las siguientes muestran los resultados de la regularizacin para los valores de =0.0001, 0.001, 0.01,0.1 y 1.0.

    La formulacin restringida a ruido est dada por:

    minu

    T V(u)sujeta a u u02 =2 (3.34)

    Computacionalmente este modelo generalmente se resuelve a travs de su ecuacin de Euler-

    Lagrange [26, pag. 179]. Adoptando el mtodo de pendiente descendente ( steepest descendent march-

    ing) con tiempo tartifical, propuesto por Rudin, Osher and Fatemi [27], tenemos que para:

    Etv[u | u0] =

    |u| dx + 2

    (u0(x) u(x))2dx (3.35)

    La ecuacin de Euler-Lagrange estar dada por

    ut(x, t) = Etvu

    = u|u|

    2(u(x, t) u0(x)) (3.36)

    Para procesamiento de imgenes, estos mecnismos de difusin son necesarios y una ventaja en

    tcnicas de suavizado.

    3.5.3. Discretizacin de la variacin total de una imagen

    Consideremos una imagen u definida en {0, . . . , N 1}2, dondeNes un entero positivo, extendidaen Z2. La forma clsica de discretizar (3.32) es de la siguiente forma [28, 30, 31, 32]:

    T Vd(u) =

    |u|d(k, l)0k,l

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    50/158

    3. ANTECEDENTES TERICOS

    donde

    |u

    |d(k, l) = (u (k+ 1, l) u (k, l))

    2+ (u (k, l+ 1)

    u (k, l))

    2 (3.38)

    Hay otras formas de discretizar la variacin total, por medio de diferencias finitas o con valores

    absolutos, sin embargo la ecuacin (3.37) es la forma ms simple y tiene la ventaja de ser euclidiana.

    Para los casos de las ecuaciones (3.33) y (3.34) la discretizacin se realiza como sigue[27]. Sea

    u0(x, y)una funcin de intensidad que representa los pxeles de una imagen con ruido dondex, y .Seau (x, y)la imagen libre de ruido, entonces:

    u0(x, y) = u (x, y) + n (x, y) (3.39)

    dondenes el ruido aditivo. Se quiere reconstruirudesdeu0. El problema de mnimizacin restringida

    es:

    min

    u2x+ u

    2ydxdy (3.40)

    sujeta a

    udxdy =

    u0dxdy (3.41)

    La restriccin significa que el ruido n (x, y)en (3.39) es de promedio cero y

    1

    2(u u0)2 dxdy = 2 (3.42)

    donde >0. La segunda restriccin considera que la desviacin estndard del ruido n (x, y)es .

    As se tiene una restriccin lineal y otra no lineal. Sus ecuaciones de Euler-Lagrange son:

    0 =

    x

    uxu2x+ u

    2y

    + y

    uyu2x+ u

    2y

    1 2(u u0) (3.43)en,con u

    n= 0 sobre la frontera de =.

    El procedimiento de solucin emplea una ecuacin parablica con el tiempo como un parmetro en

    evolucin, o de manera equivalente, se aplica el mtodo de gradiente descendente. Esto significa que

    resolvemos:

    50

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    51/158

    3.5. Variacin Total

    ut =

    x

    ux

    u2x+ u2y

    +

    y

    uy

    u2x+ u2y

    (u u0) (3.44)

    parat>0, x , y , u (x,y, 0)dado, un = 0 sobre.

    Se ha suprimido la primera restriccin porque es automticamente forzada por el procedimiento

    en evolucin si la media de u (x,y, 0) es la misma de u0(x, y). Cuando t se incrementa esto se

    aprovecha para quitar ruido a la imagen. Se debe calcular (t). Al multiplicar la ecuacin (3.44)por

    (u u0)e integrar por partes sobre , una vez que se alcanza el estado permanete, el lado izquierdode la ecuacin (3.44)se desvanece, entonces tenemos que:

    =

    1

    22 u2x+ u2y

    (u0)x uxu2x+ u2y

    +(u0)yuy

    u2x+ u2y dxdy (3.45)

    El mtodo nmerico en dos dimensiones est dado como sigue, sea:

    xi = ih, yj =jh, i, j = 0, 1,...,N, con N h= 1,

    tn= nt, n= 0, 1, ...,unij =u (xi, yj , tn),

    u0ij =u0(ih,jh) + (ih,jh)

    Los datos iniciales se eligen de manera que las restricciones se satisfagan inicialmente, es decir,

    que promedien cero.

    un+1ij = unij +

    th

    (x

    x+unij

    (x+unij)2+(m(y+unij,

    yunij))

    21/2

    +y

    y+unij

    (x+unij)2+(m(x+unij,xunij))

    21/2

    )

    tn unij u0(ih,jh)parai, j = 1,...,N, con condiciones de frontera:

    un0j =un1j , u

    nNj =u

    nN1,j, u

    ni0= u

    niN=u

    ni,N1

    donde

    xuij = (ui1,j uij)

    yuij = (ui1,j uij)

    51

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    52/158

    3. ANTECEDENTES TERICOS

    m(a, b) = minmod(a, b) =

    sgna + sgnb

    2

    min (|a| , |b|)

    As tambien paran tenemos:

    n = h22

    [i,j

    (x+unij2 + y+unij2

    (x+u

    0ij)(

    x+u

    nij)

    (x+unij)2+(y+unij)

    2

    (y+u0ij)(

    y+kunij)

    (x+unij)2+(y+unij)

    2 )]

    Para estabilidad se impone una restriccin para el tamao del paso, dado por:

    th2 c

    3.6. Procesamiento Multiresolucin (Pirmide de Imgenes)

    Una herramienta importante, conceptualmente simple en estructura para representar imgenes

    a ms de una resolucin es la pirmide de imgenes [13, pag. 351]. Una pirmide de imgenes es

    un conjunto de imgenes con resolucin decreciente dispuestas en forma de una pirmide. Como se

    puede observar en la Fig. 3.12a la base de la pirmide tiene una representacin de resolucin alta de

    la imagen que se quiere procesar (Fig. 3.12b); la cima contiene una resolucin baja. Al subir desde

    la base de la pirmide tanto el tamao como la resolucin decrecen. Como la base de la pirmide es

    de tamao NNentonces esta en el nivel J, dada por:

    J=log2N (3.46)

    y el siguiente nivel, (N/2) (N/2),en J-1=(log2N)-1. Por ejemplo, sea N=512entonces el nivel Jestar dado porJ=log2(512)=9. Por tanto, J-1=9-1=8donde N/2=512/2=256=2J1 = 28. Esto

    quiere decir, que la imagen con resolucin de 512x512pxeles se podr reducir desde el nivel 9 al

    nivel 1. En la Fig. 3.12b se muestra una pirmide Gaussiana con filtrado en el dominio del espacio,

    empleando un kernel de convolucin Gaussiano de 5 5pasa bajas (Fig. 3.13).

    h(x) =

    2Ae222x2

    52

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    53/158

    3.6. Procesamiento Multiresolucin (Pirmide de Imgenes)

    (a) (b)

    Figura 3.12: Estructura de imagen piramidal.

    Figura 3.13: Filtro Gaussiano pasa bajas en el dominio del espacio.

    53

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    54/158

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    55/158

    Captulo 4

    PROTOCOLO DE ADQUISICIN DE

    IMGENES

    El protocolo de adquisicin de imgenes se compone de dos partes. En la primera parte se

    crea el set fotogrfico en el cual se har la adquisicin de las imgenes que integrarn la base de

    datos del sistema de reconocimiento de rostros. En este set fotogrfico se busca mantener las mejores

    condiciones de iluminacin, el mismo fondo y distancia similar entre el rostro y la cmara fotogrfica.

    De manera complementaria, se obtienen diez fotografas con cambio de escala, fondo e iluminacin

    diferentes, que se integrarn a la base de datos con objeto de que permitan el reconocimiento facial

    con cambios de escala. En la segunda parte, se hace la adquisicin de las imgenes que se utilizarn

    como imgenes de prueba con cambios de escala, en un set alterno (saln de clase) donde cambian

    las condiciones de iluminacin y escala de los rostros.

    4.1. Proceso de adquisicin de imgenes

    El proceso de adquisicin consite en: (1) Construccin del set fotogrfico; (2) Promover la colabo-

    racin de la comunidad academica en el proyecto; (3) Registrar al participante; y finalmente (4) Hacer

    la adquisicin del rostro de frente en fotografas a color y con alta resolucin (con fondo azul para

    crear la base de datos).

    Para poder hacer la adquisicin de las imgenes para crear la base de datos es necesario configurar

    el set fotogrfico que se ilustra en la Fig. 4.1. El set fotogrfico consta de la lista de materiales que

    se indica en la Tabla 4.1.

    El diagrama esquemtico de la Fig. 4.2 ilustra la disposicin de los materiales en el set fotogrfico.

    55

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    56/158

    4. PROTOCOLO DE ADQUISICIN DE IMGENES

    Tabla 4.1: Lista de materiales.

    1. Lmparas reguladoras 500 w (2 unidades)2. Paneles reflectores (2 unidades)3. Banquillo (1 unidad)4. Fondo azul (1 unidad)5. Cmara profesional Nikon d80 (1 unidad)6. Tripie profesional (1 unidad)

    Figura 4.1: Set fotogrfico.

    Figura 4.2: Diagrama esquemtico

    Dos lamparas reguladoras (1) iluminan a la persona a travs de su panel reflector (2). El panel

    reflector evita que la intensidad de la luz moleste la retina de los ojos. El banquillo (3) estibiliza la

    posicin de la persona. El fondo azul (4) facilitar el proceso de segmentacin. La cmara profesional

    (5) permite capturas de imgenes en alta resolucin 10.2 Mpxeles (3872x2592 resolucin mxima y

    1936x1296 resolucin mnima). La alta resolucin permitir cambiar la escala de las imgenes.

    56

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    57/158

    4.2. Resultados del proceso de adquisicin

    Figura 4.3: Registro de datos por persona.

    La colaboracin fue faborable no solo de la comunidad academica sino de las autoridades, quienes

    nos dieron la autorizacin as como todas las facilidades para el desarrollo de este protocolo de

    adquisicin. Para este proceso colaborarn ms de 50 personas entre alumnos y personal de la

    Universidad Autnoma Metropolitana, Unidad Cuajimalpa.

    Durante el proceso de adquisicin, cada persona registr sus datos personales (Fig. 4.3), en

    particular: nombre, edad, fecha y lugar de nacimiento, color de pelo, entre otros. Adems, autoriz

    el uso de su imagen con propositos de investigacin como se ilustra en la hoja de registro del apndice

    B.

    Las fotografas en color son imgenes monoculares de frente, con fondo azul. El proyecto se acota

    a este tipo de imgenes y no a imgenes de perfil debido a la complejidad de estas ltimas. El

    fondo azul permite mejorar la segmentacin de las imgenes para la creacin de la base de datos del

    sistema. La alta resolucin es una caracterstica que facilita los cambios de escala (reduccin) de las

    imgenes sin gran perdida de datos.

    4.2. Resultados del proceso de adquisicin

    Como resultado del proceso de adquisicin, en una primera etapa se obtuvieron las imgenes

    que se ilustran en la Fig. 4.4. Sin embargo, no fueron suficientes y se requiri una segunda etapa de

    adquisicin de la cual se obtuvieron 488 fotografas (Figs. 4.7 y 4.5). Se integrarn 400 imgenes en

    la base de datos del sistema. Se utilizarn 48 fotografas como imgenes de prueba con variacin en

    escala (Fig. 4.6).

    57

  • 7/24/2019 Localizacion y Reconocimiento de Rostros en Imagenes Monoculares de Frente Con Variacion en Escala-mexico

    58/158

    4. PROTOCOLO DE ADQUISICIN DE