la mecatrónica en méxico - mecamex.net · prologo estimados lectores, de nueva cuenta es un honor...

La Mecatrónica en México

Comité Editorial de la Revista

Diseño Gráfico Mónica Vázquez Guerrero

Kikey Stephanie Méndez Sánchez Alejandra Miguel Vargas Mandujano

Vinculación Luis Alberto Aguilar Bautista Luis Antonio Salazar Licea

Miguel Ángel Bacilio Rodríguez

Revisión de Formato Rodrigo Escobar Díaz-Guerrero

Conrado Vargas Cabrera Alejandro de León Cuevas Ángel Juárez Buenrostro

Soporte Técnico Gonzálo Elías Blanco Silva

Carlos Alberto Ramos Arreguín Juan Carlos Moya Morales

© DERECHOS DE AUTOR Y DERECHOS CONEXOS. La Mecatrónica en México, Año 6, No. 1, Enero - Abril 2017, es una publicación cuatrimestral editada por la Asociación Mexicana de Mecatrónica A. C., Calle Fonología No. 116, Col. Tecnológico C.P. 76158, Querétaro Qro. Tel.(01- 442) 224 0257. www.mecamex.net/revistas/LMEM/ , Editores responsables: Juan Manuel Ramos Arreguín y José Emilio Vargas Soto. Reserva de Derechos al Uso Exclusivo No. 2012-092010534100-102, ISSN: 2448-7031. Las opiniones que en los artículos aparecen son exclusivas de los autores, y no representan la postura de la Asociación Mexicana de Mecatrónica A.C. La revista cuenta con el Certificado de Reserva de Derechos al Uso Exclusivo No. 04-2012-092010534100-102, ISSN 2448-7031, ambos otorgados por el Instituto Nacional de Derechos de Autor. Responsables de la última actualización este número: Juan Manuel Ramos Arreguín y José Emilio Vargas Soto. Este número se terminó de imprimir el 31 de Marzo del 2017. Las opiniones expresadas por los autores de los artículos no reflejan la postura de la Asociación Mexicana de Mecatrónica A.C. Esta revista es una publicación de acceso abierto, distribuido bajo los términos de la Asociación Mexicana de Mecatrónica A. C., la cual permite el uso, distribución y reproducción sin restricciones por cualquier medio, siempre y cuando los trabajos estén apropiadamente citados, respetando la autoría de las personas que realizaron los artículos.

PROLOGO Estimados lectores,

De nueva cuenta es un honor presentar la edición 2017 de la revista La Mecatrónica en México. En esta ocasión se han seleccionado tres interesantes artículos que espero sean del agrado de ustedes.

Como siempre, reconozco y agradezco el trabajo del comité editorial y del comité técnico de revisores. Su importante esfuerzo hace posible que la Asociación Mexicana de Mecatrónica A.C. continúe realizando una labor que impulsa en el estudio y la difusión de los trabajos originales que se presentan en esta edición, y así contribuir en la formación intelectual de la comunidad académica interesada en la Ingeniería Mecatrónica.

Me permito recordar que el objetivo de la revista es lograr un acercamiento

constante con la comunidad académica: estudiantes, profesores, profesionistas e investigadores que de alguna manera realizan proyectos y trabajos afines a la Ingeniería Mecatrónica. Los cambios tecnológicos y los nuevos proyectos de investigación que se llevan en curso en diversos lugares de nuestro País nos llevan a rediseñar productos, procesos y servicios a fin de mejorar su desempeño. Es por ello, que ante las diversas opciones de mejoramiento asumo una relevancia en lograr una certidumbre educativa y tecnológica que nos permita mejorar la calidad de vida de nuestra sociedad.

Dr. José Emilio Vargas Soto Fundador Asociación Mexicana de Mecatrónica A.C.

ÍNDICE Medición del error de un haz de luz reflejado por un heliostato utilizando procesamiento de imágenes en Matlab. Salgado Plasencia Eugenio, Femat Díaz Aurora y Hernández Gutiérrez Alicia.

1

Propuesta para la detección y corrección de discontinuidades generadas en la digitalización 3D. Moya-Morales Juan Carlos, Pedraza-Ortega Jesús Carlos, Rodríguez-Reséndiz Juvenal y Ramos-Arreguín Juan Manuel.

9

Método para Autenticación Facial basado en SURF e implementado en dispositivos móviles. Mendoza Martínez Cyntia, Pedraza Ortega Jesús Carlos, Sotomayor Olmedo Artemio, Rodríguez Reséndiz Juvenal, Carrillo Serrano Roberto Valentín y Aceves Fernández Marco Antonio.

21

La Mecatrónica en México, Enero 2017, Vol. 6, No. 1, páginas 1 – 8. Disponible en línea en www.mecamex.net/revistas/LMEM ISSN: 2448-7031, Asociación Mexicana de Mecatrónica A.C.

1

Medición del error de un haz de luz reflejado por un heliostato utilizando procesamiento de imágenes en

Matlab Salgado Plasencia Eugenio, Femat Díaz Aurora, Hernández Gutiérrez Alicia

Facultad de Ingeniería, Universidad Autónoma de Querétaro, Cerro de Las Campanas, s/n, Las

Campanas, 76010 Santiago de Querétaro, Querétaro, México

Resumen En las plantas termosolares de torre central, se genera energía eléctrica utilizando espejos

llamados heliostatos para reflejar y concentrar la radiación solar hacia un colector ubicado en la parte alta de una torre. Debido a que esta reflexión se realiza a través de un lazo abierto, no existe ningún tipo de verificación de que la radiación solar incida en el objetivo deseado, por lo que los errores ocasionados por las aproximaciones realizadas en el cálculo de la posición solar pueden acumularse durante el funcionamiento del sistema y producir errores en la incidencia de la radiación solar. Utilizando procesamiento de imágenes se puede determinar el error en la incidencia de radiación solar sobre el objetivo, obteniendo la distancia entre el centroide de la mancha solar reflejada y el centro del objetivo. En este artículo se describe el uso de un algoritmo que carga la imagen de una mancha solar reflejada sobre un objetivo fijo y determina el error en la incidencia por medio de la obtención del centroide utilizando el software Matlab.

Palabras clave: energía solar, planta solar, helióstato, centroide, procesamiento de imágenes.

1. Introducción Las centrales termosolares de torre central (STP, por sus siglas en inglés) tienen una serie de

reflectores llamados helióstatos, que son capaces de seguir el movimiento del sol y concentrar la radiación solar en un receptor central montado en la parte superior de una torre, generando energía eléctrica mediante un ciclo termodinámico [1].

Los sistemas de seguimiento solar precisos tienen un papel importante en el rendimiento de las

tecnologías de captación solar, ya que la cantidad de radiación solar absorbida por el colector determina la potencia de salida [2]. A pesar de la precisión de los algoritmos de seguimiento solar, el sistema de control se realiza a través de un lazo abierto, sin ningún tipo de verificación de que la radiación solar incida en el objetivo. Por lo que los errores debidos a las aproximaciones realizadas en el cálculo de la posición solar pueden acumularse durante el funcionamiento del sistema y producir errores en la incidencia de la radiación solar reflejada en el objetivo [3]. También existen errores en la reflexión de radiación solar en el objetivo, producidos por los helióstatos, debido a: tolerancias en la fabricación e instalación, errores en la alineación debido a cargas de viento y a fuerzas de gravedad que inciden sobre la estructura, ubicación dentro del campo, resolución y tipo de encoder, mala alineación en las facetas y el backlash del mecanismo [4].

Se ha utilizado procesamiento de imágenes para retroalimentar al sistema y determinar

periódicamente el error acumulado en la incidencia de radiación solar sobre el objetivo, comparando el haz de incidencia con respecto a una referencia y reorientando el helióstato para reducir el error [5, 6].


2

En este documento se plantea la obtención del error en la incidencia de la radiación solar

reflejada sobre un objetivo, utilizando procesamiento de imágenes para obtener el centroide del haz de luz reflejado por medio de momentos simples y determinar el valor del error.

2. Metodología 2.1 Descripción del problema El problema que producen los errores sistemáticos en la operación de una STP, se manifiesta

en una desviación de la mancha solar reflejada sobre el objetivo (Figura 1). La corrección de este desplazamiento consiste en comparar la posición del centroide del haz de luz reflejado sobre un objetivo con una posición de referencia, y así determinar el error en la incidencia de la radiación solar sobre el objetivo [5].

Figura 1. Haz de luz reflejado centrado (izquierda) y no centrado (derecha) [5]. Para determinar el error en la incidencia, se orienta un helióstato a la vez para reflejar la

radiación solar sobre un objetivo dedicado a la tarea de corrección de desplazamiento y se captura una imagen (Figura 2).

Figura 2. Obtención de la imagen de la mancha solar reflejada [5].


3

Las imágenes obtenidas sirven como información de retroalimentación que permite el cálculo

automático de la distancia entre el centro del objetivo y el centroide de la mancha solar utilizando algoritmos de visión artificial, de tal manera que esta señal de error se puede utilizar para fines de ajuste [1].

2.2 Algoritmo para obtener el centroide La metodología utilizada para obtener el error en la incidencia solar consiste en obtener el

centroide de la mancha solar sobre un objetivo, siguiendo la metodología de Femat-Diaz, Vargas-Vazquez, Huerta-Manzanilla, Rico-Garcia and Herrera-Ruiz [7] ilustrada en la Figura 3.

Figura 3. Diagrama de flujo del algoritmo

2.2.1 Imagen a escala de grises Si la imagen cargada es una imagen RGB, entonces se obtiene una imagen en escala de

grises, calculando el nivel de gris de cada pixel (GL) a partir de sumar el valor de las tres bandas de color del pixel (R=rojo, G=verde y B=azul), multiplicadas por tres coeficientes de distinto valor que simulan la detección del brillo de colores del sistema visual humano, la cual detecta mejor el color verde que el color rojo y el color azul.

El valor en escala de grises se obtiene de la siguiente ecuación [8]:

(x,y)(x,y)(x,y)(x,y) B.G.R.GL 114058702990 ++= (1)

2.2.2 Imagen binaria A partir de la imagen en escala de grises se obtiene una imagen binaria (BI), utilizando el

método de umbralización de Otsu [9], el cual maximiza la varianza entre dos clases c1 y c2 para establecer un umbral óptimo T, donde todos los pixeles con valores menores a T tomarán un valor 0 (negro) y un valor de 255 (blanco) en caso contrario.

îíì

<®

³®=

TGL

TGLBI

(x,y)

(x,y)

(x,y)

0

255 (2)

2.2.3 Filtrar imagen


4

Para eliminar el ruido de la imagen binaria se utiliza un filtro de mediana, el cual consiste en

obtener la mediana de cada pixel, aplicando una matriz de filtrado de tamaño 3x3 que genera un nuevo valor mediante una función del valor original y los de los pixeles circundantes Pratt [10]. En el caso del filtro de mediana se obtiene la mediana de los 9 valores que envuelve la matriz y este valor se sustituye en la imagen en la misma posición del pixel central de la matriz (Figura 4).

Figura 4. Filtro de mediana con mascara de 3x3.

2.2.4 Obtención del centroide El centroide la imagen binaria se obtiene a partir de los momentos simples [10]. Los cuales

están dados por:

åå=x y

f(x,y)qypxM(p,q) (3)

Dónde: x & y son las coordenadas del pixel, y f(x,y) es el valor en binario del pixel. Para calcular

las coordenadas del centroide, se utilizan los momentos simples de orden cero y uno, con p=0 y q=0, p=1 y q=0, y p=0 y q=0, para obtener el área, la coordenada x y la coordenada y respectivamente.

åå==x y

BI(x,y)),M(area 00 (4)

åå

åå

==

x y

BI(x,y)

x y

xf(x,y)

),M(

),M(x

00

01 (5)

åå

åå

==

x y

BI(x,y)

x y

yf(x,y)

),M(

),M(y

00

10 (6)

2.2.5 Imágenes resultantes Para visualizar la posición de la mancha solar sobre el objetivo, se agrega una marca de color

rojo en las coordenadas del centroide de la mancha solar y dos ejes coordinados en color azul para marcar el centro de la imagen (Figura 5).


5

Figura 5. Imagen resultante. 2.3 Cálculo del error en la incidencia Para determinar el valor del error en la incidencia, primero se calcula la distancia del centroide

del haz de luz reflejado con respecto al centro de la imagen (D), tomando en cuenta la resolución de la imagen en pixeles (R) y las dimensiones del objetivo (l) en metros.

lx

RxDx = (7)

ly

RyDy = (8)

Finalmente se determina el ángulo de corrección del helióstato, a partir de la distancia de este

con el objetivo (vector T) y la distancia del error en la incidencia.

÷÷ø

öççè

æ-=

T

Dxsenθx

1 (9)

÷÷ø

öççè

æ-=

T

Dysenθy

1 (10)

3. RESULTADOS El algoritmo se implementó en Matlab y se aplicó a dos tipos de imágenes, la primera imagen se

obtuvo con una cámara CCD y la segunda con una cámara digital a color. En las imágenes solo se calculó la distancia del centroide con respecto al centro de la imagen, debido a que no se contó con los valores del tamaño del objetivo y de la distancia del helióstato con respecto al objetivo. Los resultados se muestran a continuación.


6

3.1 Imagen con cámara CCD La imagen fue tomada en la Planta Solar de Hermosillo (PSH) utilizando una cámara CCD, en

este caso, de la marca ALLIED Vision Technologies modelo Pike F-032, equipada con un sensor Kodak KAI-0340 CCD, que opera a una velocidad de 208 cuadros por segundo (Figura 6) [11]. La imagen tiene un tamaño de 725X601 pixeles y el centroide se ubicó en (-8,12) a una distancia de 14.4 pixeles (Figura 7).

Figura 6. Cámara Pike F-032.

Figura 7. Imagen tomada con cámara CCD original (izquierda) e imagen con centroide (derecha). 3.2 Fotografía con cámara digital La imagen es una fotografía digital tomada por la compañía Schlaich Bergermann und Partner,

como parte de las pruebas de desarrollo del heliostato Stellio [12]. La imagen tiene un tamaño de 910x762 pixeles y el centroide se ubicó en (23,12) a una distancia de 25.9 pixeles (Figura 8).


7

Figura 8. Fotografía digital a color original (izquierda) e imagen con centroide (derecha).

4. CONCLUSIONES Los resultados muestran el valor del error en la incidencia solar por medio del cálculo del

centroide de una imagen, a partir del algoritmo propuesto. El algoritmo funciona tanto para imágenes tomadas con una cámara CCD como con imágenes

digitales a color. Se tiene la restricción de que estas últimas deben estar enfocadas sobre el objetivo buscando evitar un error en el cálculo del centroide. Este error es debido al contraste que existe entre el objetivo y la imagen que lo rodea, tal y como se muestra en la Figura 9.

Figura 9. Imagen digital amplia (izquierda) e imagen digital enfocada (derecha). También se debe tomar en cuenta que el error se mide desde el centro de la imagen y no

necesariamente desde el centro del objetivo, por lo que se debe enfocar la cámara sobre la dimensión total del objetivo para tener un valor más preciso.


8

La siguiente parte de la investigación es desarrollar un algoritmo que ejerza la acción de control

para corregir el error en la incidencia.

5. AGRADECIMIENTOS Se agradece a CONACYT por el apoyo recibido, a la Planta Solar de Hermosillo (PSH) de la

Universidad de Sonora y a la Facultad de Ingeniería de la Universidad Autónoma de Querétaro por las facilidades otorgadas.

REFERENCIAS

[1] Camacho E.F., Berenguel M., Rubio F.R., and Martínez D., Control of Solar Energy Systems. Springer. 2012

[2] Ruelas A., Velázquez N., González L., Villa-Angulo C., and García O., Design, Implementation

and Evaluation of a Solar Tracking System Based on a Video Processing Sensor. International Journal of Advanced Research in Computer Science and Software Engineering. 3(10): p. 172-178. 2013

[3] Kribus A., Vishnevetsky I., Yogev A., and Rubinov T., Closed loop control of heliostats. Energy. 29(5-6): p. 905-913. 2004

[4] Blanco-Muriel M., Alarcón-Padilla D.C., López-Moratalla T., and Lara-Coira M., Computing the

solar vector. Solar Energy. 70(5): p. 431-441. 2001 [5] Berenguel M., Rubio F.R., Valverde A., Lara P.J., Arahal M.R., Camacho E.F., and López M., An

artificial vision-based control system for automatic heliostat positioning offset correction in a

central receiver solar power plant. Solar Energy. 76(5): p. 563-575. 2003 [6] Malan K. and Gauché P., Model based Open-loop Correction of Heliostat Tracking Errors. Energy

Procedia. 49: p. 2118-2124. 2014 [7] Femat-Diaz A., Vargas-Vazquez D., Huerta-Manzanilla E., Rico-Garcia E., and Herrera-Ruiz G.,

Scanner image methodology (SIM) to measure dimensions of leaves for agronomical applications. African Journal of Biotechnology. 10(10): p. 1840-1847. 2011

[8] Baxes G.A., Digital Image Processing. Principles and Applications. Wiley. 1994 [9] Otsu N., A Threshold Selection Method from Gray-Level Histograms. IEEE transactions on

systems, man, and cybernetics. 9(1): p. 62-66. 1979 [10] Pratt W.K., Digital Image Processing: PIKS Inside. 3 ed.: John Wiley & Sons, Inc. 2001 [11] Iriarte-Cornejo C., Automatización de sistema de control para campo de Helióstatos, in División

de Estudios de Posgrado e Investigación. Instituto Tecnológico de Chihuahua. 2013 [12] SBP, Point-focusing Solar Energy Technology. Stellio Heliostat confirms unprecedented optical

and economic Stellio Heliostat confirms unprecedented optical and economic. Schlaich Bergermann und Partner. 2015


9

Propuesta para la detección y corrección de discontinuidades generadas en la digitalización 3D.

Moya-Morales Juan Carlos1, Pedraza-Ortega Jesús Carlos2, Rodríguez-Reséndiz Juvenal2, Ramos-Arreguín Juan Manuel2.

Universidad Autónoma de Querétaro

1Facultad de Informática. 2Facultad de Ingeniería.

Resumen

En el presente artículo se describe una propuesta para la detección de discontinuidades que se generan en el proceso de digitalización de objetos 3D, utilizando como fundamento la Perfilometría por Transformada de Fourier (FTP), incluido el uso de un algoritmo de desdoblamiento de fase simple. A partir de la información de zonas de discontinuidad de la fase obtenida posterior al uso del algoritmo de desdoblamiento de fase, se determina la región donde comienza cada discontinuidad y se propone el aislamiento de esta zona para la detección de bordes que permitan identificar los límites de las zonas a corregir. Esta propuesta permite reducir el error y se muestran los resultados realizando comparaciones entre la digitalización sin corrección y la corregida utilizando la propuesta. Palabras clave: Digitalización, FTP, Fourier 3D, Detección de discontinuidades.

1. Introducción

La digitalización de objetos se puede definir como: proceso por el cual, las características físicas de un objeto son almacenadas en la memoria de una computadora. Dicho proceso se ha estudiado y realizado por diversos investigadores, y para lograr este propósito existen diversas técnicas que se han implementado en las últimas décadas dentro de las cuales se encuentran las técnicas perfilométricas que se originan en los años 80’s cuando Takeda et, al. presentaron su metodología basada en la Transformada de Fourier para topografía, donde mostraron que era posible identificar entre una elevación y depresión de superficies a partir de la deformación de una franja con características senoidales, la cual es proyectada y deformada por las características morfológicas del objeto analizado, tal como se menciona en [1], un año más tarde Takeda et, al, en [2] presentaron una nueva técnica para mediciones automáticas basadas en la perfilometría por medio de la Transformada de Fourier. A partir de estas publicaciones muchos investigadores han presentado sus trabajos tratando de mejorar el método, tal es el caso de Jiang Yi y Shanglian Huang en 1997, quienes proponen realiza cambios en la fase con lo cual analizan 4 imágenes para posteriormente realizar la obtención de la fase, siguiendo el proceso tradicional de perfilometría por transformada de Fourier tal como se menciona en [3].

Esteve realiza su tesis de maestría donde enfoca su propuesta en el desdoblamiento de fase simple, el cual es una de las etapas más importantes dentro de la perfilometría de Fourier [4].

Tavares presenta una técnica para la eliminación de la componente DC del espectro espacial de Fourier en 2D, la cual consiste en la adquisición de dos patrones deformados por el mismo objeto, uno de estos patrones utiliza franjas verticales y el otro patrón utiliza franjas horizontales, al obtener los espectros espaciales y sumarlos se puede identificar los límites de la componente DC para su posterior extracción, tal como lo menciona en [5], dentro de la propuesta se tendría que verificar que sucede cuando los armónicos se encuentran muy cerca de la componente DC.


10

En [6], Pedraza, et al presentan una modificación del método de Perfilometría por Transformada de Fourier Modificada (MFTP) utilizando el análisis de discontinuidad local. En el año del 2007 también se presenta la tesis doctoral de Abdul-Rahman, donde muestra el desarrollo de un interesante algoritmo para el análisis de franjas de Fourier y el desdoblamiento de fase [7].

Hussein S, et al en el 2008, presentan 3D-FFA un algoritmo para el Análisis de Franjas de Fourier en 3D, realizando también una comparación en el tiempo de procesamiento con el algoritmo 2D-FFA (Análisis de Franjas de Fourier en 2D), los cuales fueron aplicados para la medición de la forma del cuerpo de pacientes en el hospital Christie en Manchester [8].

En los últimos años autores como Feng S, Feng L, Miguel A. Hai L, han realizado investigaciones donde proponen mejoras a los algoritmos, tanto del proceso general de digitalización 3D tal como se menciona en [9][10][11][12], así como del proceso de desdoblamiento de fase mencionado en [13][14][15][16]. Las investigaciones han tenido avances significativos, siguiendo las diferentes técnicas propuestas, aunque en algunos casos principalmente en aquellos donde se ocupan objetos reales, al finalizar el proceso se presentan algunas zonas de discontinuidades en el objeto 3D, provocadas principalmente por la presencia de valores de alta frecuencia dentro de la fase en el proceso de Perfilometría de Fourier.

2. Perfilometría de Fourier (FTP) La FTP propuesta por Takeda, en [1], ha sido utilizada para realizar reconstrucción de objetos 3D, desde que su autor la presento hasta los últimos años se han publicado diversas propuestas con el fin de mejorar los resultados obtenidos. Tal como se menciona anteriormente y de manera particular en [6] en donde el autor presenta una modificación del método de perfilometría de Fourier (MFTP), utilizando el análisis de discontinuidad local. También en [7] la tesis doctoral de Hussein Abdul-Rahman, presenta el desarrollo de un algoritmo para el análisis de franjas de Fourier y el desdoblamiento de fase, aplicado a objetos en movimiento. En [17] realiza un análisis, del número de franjas que se deben proyectar sobre un objeto, para obtener una mejor reconstrucción 3D, aplicado tanto a objetos virtuales como a objetos reales, y algunos otros trabajos mencionados [6-12]. La FTP se basa en la proyección de un patrón de franjas sobre el objeto, la cual produce una escena de franjas distorsionadas que, al ser capturada por medio de una cámara, se obtiene una imagen que lleva consigo toda la información 3D del objeto en cuestión, tal como se aprecia en figura 1. En la cual se observa en a) el objeto a escanear, en b) el patrón uniforme a proyectar y en c) el objeto con las franjas deformadas.

a) Vaso unicel. b) Patrón de franjas a proyectar.

c) Patrón de franjas distorsionado.

Figura 1. Proceso de proyección de franjas.


11

Para el proceso de adquisición de la escena deformada se utiliza, la geometría de los ejes ópticos cruzados como se muestra en la figura 2.

Figura 2. Geometría de ejes ópticos cruzados utilizada para en el proceso de adquisición de escenas.

Se toma como referencia un plano ficticio R tal como se muestra en la figura 2, con el cual se

puede medir la altura (!, ") del objeto en particular, la lente del proyector forma su imagen conjugada en el plano R, la lente de la cámara forma una imagen de este plano de referencia; de tal forma que cuando el objeto es uniforme, (!, ") = 0.

La escena capturada con el patrón de franjas deformadas se puede expresar como: #(!, ") = $(!, ") + %(!, ") & cos'[2 & *-.! + '/(!, ")] (1)

Donde #(!, ")'es la intensidad de la imagen en el punto (!, "), $(!, ") es la iluminación del fondo, %(!, ") es el contraste entre las franjas, f0 es la frecuencia fundamental del patrón de franjas, y /(!, ") es la fase que corresponde a la distorsión de las franjas, estos valores de se encuentran en el rango de -π a π. El eje ! es la línea que representa el plano R en la figura 2, siendo el eje " perpendicular a éste; Para un objeto genérico con variaciones de altura descritas por la función (!, "), el patrón de franjas capturado será un patrón de franjas distorsionado que contendrá la información 3D del objeto considerado.

Utilizando la identidad de Euler para los valores complejos la ecuación 1 puede ser expresada mediante la siguiente ecuación:

(!, ") = #(!, ") + $(!, ")%(&'*-./) + $ 0 (!, ")%(1&'*-./)

Donde,

(2)

$(!, ") =2

345(!, ")% 4[*6(/,7)]

(3)

Y, el símbolo * denota el complejo conjugado. Al aplicar la transformada rápida de Fourier con respecto al eje x la ecuación 2 queda expresada como:

8(9, ") = :(9, ") + ;(9 < 9>, ") + ; 0 (9 + 9>, ") (4)

Donde el espectro de Fourier es denotado por las mayúsculas, y la frecuencia espacial en dirección del eje x está representado por 9, como las variaciones entre #(!, "), 5(!, "), ?(!, "),


12

son muy lentas en comparación con la frecuencia espacial !como se muestra en la figura 3 a), se realiza un filtro pasa banda sobre ! y se traslada al origen, de esta manera se obtiene "( , #), tal como se muestra en la figura 3 b).

Figura 3. a) Espectro espacial de Fourier. b) Frecuencia espacial f! en el origen

Aplicando la transformada inversa de Fourier (IFFT) a "( , #) con respecto a se obtiene

$(%, #), definido en la ecuación 3, a esta ecuación se aplica el logaritmo complejo de la siguiente forma:

log[$(%, #)] = log[ &12' *(%, #)] + -.(%, #) (5)

De tal manera que, se tiene la fase .(%, #) en la parte imaginaria, la fase obtenida en una

fase envuelta en un rango de –/ a /, por lo cual es necesario realizar un desdoblamiento de fase, que proporcione una onda continua y permita recuperar la información correctamente, este proceso es complejo y existen diversas técnicas que abordan el problema por lo que en secciones posteriores se mostrará un par de ellas. Entonces, la fase envuelta obtenida de la ecuación 5 se puede expresar como:

.(%, #) = .!(%, #) +0.3(%, #) (6)

Donde .!(%, #) es la fase producida por el ángulo de proyección correspondiente al plano de referencia, y .3(%, #) es generada por la distribución de la altura del objeto analizado. Si se considera la equivalencia de loa triángulos formados por los puntos PHC y PrHCr en la figura 2, se puede expresar:

450"567 = 8

9 (7)

Por lo tanto, se tiene:

.3(%, #) = 7(%, #)2/ !87(%, #) 6 9

(8)

Expresando la ecuación anterior en función de la fase de distribución se puede obtener la

altura del objeto de la siguiente forma:

7(%, #) = 9.3(%, #).3(%, #) 6 2/ !8

(9)


13

De tal manera en h se tendrá la información de la altura y por consiguiente la información 3D del objeto en cuestión.

Durante el proceso de digitalización se encuentra la obtención de la fase, mediante técnicas de desdoblamiento de fase que permiten recuperar la información de una fase envuelta entre los valores de – y , extrayendo los valores en una onda continua, existen diversos algoritmos para realizar el desdoblamiento de fase tanto de manera unidimensional, como bidimensionales, tales como [13][14[15][16], en el caso de los unidimensionales el procesos se realiza pixel a pixel y renglón por renglón, obteniendo el valor de pixel presente y el pixel subsecuente, para determinar si excede a un umbral pre-establecido, el valor promedio de este umbral es de 0.9*2 , con lo cual identificar los brincos que pasan de – a o de a – , estos brincos se pueden apreciar en la figura 4.

Figura 4. Fase envuelta con brincos.

Cuando se detecta el primer brinco se determina si el valor pasa de positivo a negativo o

viceversa, los valores subsecuentes tendrán un valor igual al valor del pixel previo al brinco + 2 (en el caso de que pasara de lo negativo a lo positivo se realizaría una suma con el valor de -2 ), El proceso prosigue hasta terminar de analizar cada pixel del renglón y corrigiendo los diferentes saltos. al realizar las correcciones el resultado de la señal se observa en la figura 5.

Figura 5 Corrección de fase.

Al terminar el proceso renglón por renglón de la imagen, se obtiene una matriz con la fase

desenvuelta. El algoritmo ejecutado línea por línea asegura que no existen brincos mayores a 0.9*2 , a lo largo de cada renglón, pero no asegura que las discontinuidades no se presenten entre una línea y otra, tal como se aprecia en la figura 4. Cabe resaltar que estas discontinuidades se deben principalmente a ruido de alta frecuencia que puede ser producido por varios factores, entre ellos las sombras, el traslape entre franjas proyectadas, ruido de los sistemas de captura de imágenes, etc. Para establecer una solución a este problema de discontinuidades en el algoritmo es el desdoblamiento de fase, primero se trabaja en el sentido de los renglones y posteriormente en el sentido de las columnas mediante una técnica de detección y corrección de esas discontinuidades.

A pesar de que existen diversos algoritmos de desdoblamiento de fase, algunos realizando un procesamiento sencillo como lo mencionan en [1][2], otros utilizan algoritmos más robustos como los


14

que se mencionan en [14][17][18][19], sin embargo en todos los algoritmos se pueden presentar algunas discontinuidades o inconsistencias en su forma aun después de realizar el desdoblamiento de fase. En la figura 6 se observa una línea continua hasta al pixel 310 y seguida de una brecha de 10 pixeles, propiciando que el objeto no tenga la forma original pretendida, para reducir estas brechas existen diversos algoritmos que atacan el problema utilizando métodos numéricos para obtener la tendencia de la línea digitalizada y de esa forma sustituir los valores digitalizados por los valores de la tendencia obtenida tal como se menciona en [20].

Figura 6. brecha en una señal después de realizar el desdoblamiento de fase.

Dentro del proceso de digitalización 3D se pueden obtener resultados como los mostrados en la figura 7 donde se aprecia que los errores pueden comenzar en cualquier lugar pero el error se propaga hasta el final de la figura, la detección del origen del error es una tarea compleja, por ello se propone identificar el final de la zona de error, y generar un recorrido inverso para detectar los orígenes de la misma, siguiendo esta propuesta es posible obtener una ventana que cubre toda la zona de error y al procesarla mediante algoritmos de detección de bordes por umbral, lo cual permitirá su posterior ajuste, tal como se menciona en la sección de pruebas y resultados.

Figura 7, Discontinuidades en digitalización de un vaso.

3. Metodología propuesta

La metodología propuesta se presenta en la figura 8. Donde se considera como primera etapa la adquisición de una escena con franjas deformadas, en este proyecto la escena es capturada por medio de una cámara web de la marca Logitech modelo c300, la escena lleva consigo la información 3D mediante las franjas deformadas por sus características físicas, posteriormente se aplica la transformada de Fourier Bidimensional con el objetivo de conocer la ubicación de la frecuencia espacial 0. Al conocer esta ubicación es posible determinar el número de franjas que se tienen proyectadas sobre el objeto, así como la zona donde se aplicara el filtrado espacial, el cual es el siguiente paso dentro de la metodología. El filtro espacial de la frecuencia 0 elimina la mayoría de la información no relevante sobre el objeto 3D, sin embargo también puede eliminar información


15

importante para lograr una digitalización precisa, al terminar de realizar el filtrado espacial, se procesa utilizando la Inversa de la transformada de Fourier bidimensional, propiciando que se obtenga una escena con reducción de ruido externo al objeto, al tener una escena libre de ruido se utilizan algunas de las líneas para generar un patrón uniforme. Tanto el patrón de franjas deformadas como el uniforme se procede a encontrar el ángulo de fase, el cual tendrá que ser sometido a un proceso de desdoblamiento de fase tal como se muestra en la siguiente etapa de la metodología, posteriormente se procede a realizar la diferencia de las fases, con lo que se obtiene la información 3D del objeto, en la etapa de post-filtrado se analiza si los resultados del desdoblamiento de fase presentan algunas inconsistencias, las cuales se propagan desde un punto inicial hasta el final de la escena digitalizada, es aquí donde el algoritmo de identificación y corrección de discontinuidades tiene participación, finalizando los algoritmos propuestos se obtendrá la información 3D del objeto y se presenta como resultado final.

Figura 8 Metodología propuesta

Algoritmo de Identificación de discontinuidades Identifiacion_discontinuidades(UnwrapePhase) //Esta función requiere del mapa de fase desenvuelto, y determina la ubicación del comienzo de las discontinuidades, así como el ancho de la brecha: 1 Obtener línea a analizar // se propone 5 lineas antes del final dela matriz line1= UnwrapePhase(507,:); 2 Generar línea desplazada en un pixel // line2= zeros(1,512); line2(1,1:511)=line1(1,2:512); 3 Obtener la diferencia pixel a pixel // linre=lin2-lin1; 4 Obtener el promedio de las diferencias obtenidas. 5 Identificar los valores (picos positvos) mayores a 1 picos_P=find(linre>1); 6 Identificar los valores (picos Negativos) menores a 1 picos_N=find(linre<1); //busca picos positivos 7 Identifiar la cantidad de picos // lP=length(picos_P); // cantidad de picos encontrados 8 Obtener el ancho de la zona de error //brecha=abs(picos_P(número de pico)-picos_N(número de pico)); 9 Obtener la diferencia que existe entre el comienzo de la brecha y un pixel anterior

Algoritmo de corrección de discontinuidades corrección_d (atemp,dif) //atemp recibe la matriz a analizar, dif la diferencia de los valores de inicio de la brecha y el valor anterior. 1 Determinar el ancho de la matriz que se analizará. // [ra ca]=size(atemp); 2 Realizar copia de la matriz;// atemp2=atemp; 3 Trasladar los renglones uno hacia arriba, eliminando el primer renglón original// 4 Obtener las diferencias absolutas de las matrices// matdif=abs(atemp2-atemp); 5 Encontrar la máxima diferencia;// [dind vind]=max((max(max(matdif))==matdif)); pmaxima=max(vind); 6 encontrar los máximos cercanos a la posición del máximo del paso anterior. [maxL ind] = max (matdif ssssssss(pmaxima - 20 : pmaxima+5,:)); 7 Ajuste de posición por análisis de los 20 pixeles // ind=ind+pmaxima-20; 8 Generar una matriz de zeros, los cuales se modificaran acorde las distancias encontradas mediante el sssssssssiguiente ciclo. // matc=zeros(ra,ca);


16

9 Ciclo para cada renglón de la matriz de error 10 for col=1:ca { 11 Llenar de 1 los valores desde el valor de la brecha hasta el fianl de la zona //matc(ind(1,col):ra,col)=1; 12 } 13 Multiplicar la matriz de error por la diferencia del algoritmo anterior matc=matc*dif; 14 // sumar la matriz corregida con la matriz inicial //atemp=atemp+matc; corrigiendo de esta forma el error.

4. Pruebas y Resultados Se realiza la prueba de digitalización de un vaso en donde al utilizar un desdoblamiento de fase simple, se obtengan discontinuidades tal como se muestra en la figura 9 a), a partir de esta figura se procede con la identificación de las zonas de error, con lo cual se considera la línea 507 tal como se aprecia en la figura 9 b), en la figura 9 c) se muestra la diferencia de la línea 507 y su desplazamiento, de la cual se obtiene las brechas de cada una de las zonas de error, identificando entre el comienzo y el final de cada zona por los brincos positivos y negativos presentes.

a) Imagen a analizar b) Línea 507 a analizar

c) Diferencia de línea y su desplazamiento

Figura 9 Proceso de Identificación de zonas de error

En la figura 10 se muestra el proceso de corrección de la zona de error, para ello primero se separa la zona de error, se realiza un desplazamiento de toda la zona un pixel hacia adelante y con lo cual se realiza un diferencia obteniendo como resultado el que se observa en la figura 10 b), al generar una matriz de unos y ceros donde la zona roja de la figura 10 c) indica la zona a corregir a esta matriz se multiplica por el valor de la diferencia que llega al algoritmo y posteriormente se suma con la zona original, obteniendo el resultado mostrado en la figura 10 d). Este proceso se repite con cada una de las zonas detectadas.


17

a) Primer zona segmentada b)Diferencia de la zona y su desplazamiento

c) Identificación de zona a corregir d) Primer zona corregida

Figura 10. Proceso de corrección de zonas

En la figura 11 se muestra la corrección de la digitalización realizada a un balón, en donde se aprecian

algunas discontinuidades posteriores al desdoblamiento de fase sencillo, al presentar zonas de error se procede a

ejecutar los algoritmos de identificación y corrección de errores, dando como resultados el mostrado en la figura

11 d).

a) Escena Inicial b) Objeto 3D con discontinuidades

c) Corrección de discontinuidades d) Objeto 3D

Figura 11. Corrección de balón


18

Se realizó el proceso de digitalización de un vaso, la escena de las franjas de formadas de este objeto se muestra en la figura 12 a), y en la figura 12 b) se aprecia el resultado obtenido posterior a la aplicación del algoritmo de desdoblamiento de fase simple, así mismo en esta figura se aprecian las discontinuidades, en la figura 12 c) se muestra el resultado obtenido posterior a la aplicación de los algoritmos de detección y corrección discontinuidades, y en la figura 12 d) se muestra una perspectiva 3D del objeto digitalizado después de la aplicación de los algoritmos propuestos.



Figura 12 corrección de vaso Se realizó la digitalización de un objeto denominado pirámide el cual se muestra en la figura 13, así mismo en la figura 13 b) se muestra las discontinuidades que se obtuvieron posterior a la digitalización del objeto, utilizando el desdoblamiento de fase simple en la figura 13 c) se muestra la corrección de la digitalización realizada a la pirámide, como resultado de la aplicación de los algoritmos de identificación y corrección de errores, y una perspectiva en 3D de los resultados obtenidos se puede apreciar la figura 13 d).


19



Figura 13 Corrección de Pirámide

5. Conclusiones Se presentó un algoritmo para la detección y corrección de discontinuidades dentro del proceso de digitalización 3D, cabe resaltar que las discontinuidades se generan al utilizar un desdoblamiento de fase simple, el algoritmo de identificación de zonas de error funciona correctamente y detecta con precisión la ubicación de donde comienza y termina cada una de las diferentes zonas, tal como se muestran en la pruebas y resultados. El algoritmo para corrección del error presenta áreas de oportunidad para mejorar ya que en ocasiones no se determina correctamente el límite de donde debe corregir de una manera automática, sin embargo si detecta diferentes límites con los cuales se puede identificar de manera manual la zona de error a corregir o realizar una inspección que lleve a determinar los límites de manera adecuada y automatizada, se logró corregir de manera significativa las discontinuidades presentes dentro del proceso de digitalización 3D por perfilometría de Fourier, se deja como trabajo futuro la automatización del algoritmo de corrección donde se pueda corregir la zona limite y se propone la detección de bordes como primer acercamiento a la solución.

Referencias [1] Takeda M, Hideki I, and Seiji K, "Fourier-transform method of fringe-pattern analysis for computer-

based topography and interferometry", J. Opt. Soc. Am. 72, 156-160,1982. [2] Takeda M.; Mutoh K. “Fourier transform profilometry for the automatic measurement of 3-D object

shapes”, Appl. Opt, 22, pp. 3977-3982, 1983.


20

[3] Jiang Y, Shanglian H, “Modified fourier transform profilometry for the measurement of 3-D steep shapes”, 0pfic.s und Laser.s in Engineerrng 27 pp.493-505, 1997.

[4] Jose Esteve-T;Javier G;Carlos F. “Application of Fourier transform profilometry to the recognition of 3-D objects”. Proceedings of Spie, S227:59-66, 2003.

[5] Paulo J. Tavares, Mario A. V, “Orthogonal projection technique for resolution enhancement of the Fourier transform fringe analysis method”, Optics Communications 266 pp. 465–468, 2006.

[6] Pedraza J. C.; José Wilfrido R.; Leonardo B.; Efrén G.; Tomas S.; Juan Manuel R., ÁngelR “Image Processing for 3D Reconstruction Using a Modified Fourier Transform Profilometry Method”. Springer Berlin / Heidelberg, MICAI: Advances in Artificial Intelligence, 705-712 ISBN 3-540-76630-8 978-3-540-76630-8, 2007.

[7] Hussein Abdul-Rahman. “Three-Dimensional Fourier Fringe Analysis and Phase Unwrapping”. Tesis Doctoral General Engineering Research Institute (GERI), Liverpool John Moores University, 2007.

[8] Hussein S. Abdul-Rahman, Munther A. Gdeisat, David R. Burton, Michael J. Lalor, Francis Lilley, Abdulbasit Abid. “Three-dimensional Fourier Fringe Analysis”. Optics and Lasers in Engineering 46, pp. 446-455, ISSN: 0143-8166 2008.

[9] Feng S, Qian C, Chao Z, Jiasong Sun, Tianyang T, et al. “A carrier removal technique for Fourier transform profilometry based on principal component analysis”, Optics and Lasers in Engineering 74 pp 80–86, 2015.

[10] Feng L, Wenjing C, Xianyu S. “Eliminating zero spectra in Fourier transform profilometry by application of Hilbert transform”, Optics Communications 365, pp. 76–85, 2016

[11] Miguel A, Munther G, Francis L, David R. “A spatial algorithm to reduce phase wraps from two dimensional signals in fringe projection profilometry”. Optics and Lasers in Engineering 82 pp 70–78, 2016.

[12] Hai L, Xin-yu C, Fei W, Xiao-Tang H, Xiao-Dong H, “A novel algorithm based on histogram processing of reliability for two-dimensional phase unwrapping”. Optik 126, pp 1640–1644, 2015.

[13] Guangliang D, Chaorui Z, Canlin Z, Shuchun S, Hui L, Yanjie L., “Iterative two-step temporal phase-unwrapping applied to high sensitivity three-dimensional profilometry”, Optics and Lasers in Engineering 79, pp.22–28, 2016.

[14] Yuan G, Xiaotian C, Tao Z., “Robust phase unwrapping algorithm based on least squares”, Optics and Lasers in Engineering 63, pp 25–29, 2014.

[15] Mariano R, Francisco J. H, Adonai G, “Phase unwrapping by accumulation of residual maps”, Optics and Lasers in Engineering 64 pp. 51–58, 2015.

[16] Feng C, Xianyu S, “Phase-unwrapping algorithm for the measurement of 3D object” Optik 123, pp 2272–2275, 2012.

[17] Moya J.C, Gonzalez Z. Y, Pedraza J.C., Sotomayor A, Delgado M, Canchola S, “Caracterización de un sistema reconstrucción de objetos”, 6to congreso internacional de ingeniería UAQ, Querétaro, ISBN: 978-607-7740-39-1, 2010.

[18] C. Quan, W. Chen, C. J. Tay “Phase-retrieval techniques in fringe-projection profilometry”, Optics and Lasers in Engineering 48 pp. 235–243.

[19] Limei S, Xiaoxiao D, Jiangtao X, Yanguang Y, Chaokui Y, “A new phase unwrapping algorithm based on Three Wavelength Phase Shift Profilometry method”, Optics & Laser Technology 45, pp. 319–329, 2013.

[20] Moya J.C.; Ramos C. A.; Sotomayor A.; Gorrostieta E; Ramos J.M.; Pedraza J.C, Tovar S, Vargas J, “A strategy for 3d object digitalization using pre-filtering and post-filtering stages”, The 2012 Electronic Engineering and Computer Science Latin American Conference, ISSN: 2212-0173, pp: 273-281, Zapopan Jalisco, México, 2012.

La Mecatrónica en México, Enero 2017, Vol. 6, No. 1, páginas 21 –35. Disponible en línea en www.mecamex.net/revistas/LMEM ISSN: 2448-7031, Asociación Mexicana de Mecatrónica A.C.

21

Método para Autenticación Facial basado en SURF e implementado en dispositivos móviles.

Mendoza Martínez Cyntia, Pedraza Ortega Jesús Carlos, Sotomayor Olmedo

Artemio, Rodríguez Reséndiz Juvenal, Carrillo Serrano Roberto Valentín, Aceves Fernández Marco Antonio.

Facultad de Ingeniería, Universidad Autónoma de Querétaro

Resumen En el presente artículo se propone una metodología para el proceso de autenticación facial, el cual incluye una etapa de preprocesamiento de imágenes así como del uso del algoritmo SURF (Speeded Up Robust Features) dentro de la etapa de extracción de características. Se implementó este algoritmo robusto en la computadora y posteriormente en diferentes dispositivos móviles como Smartphones y Tablets con sistema operativo Android. La metodología propuesta consta de los las siguientes seis etapas principales: imágenes del rostro, normalización, detección del rostro, extracción de características (preprocesamiento), coincidencias y decisión, donde a partir de la definición de un umbral se podrá determinar si la autenticación fue exitosa o errónea. Se requirió del uso de una etapa de preprocesamiento mediante el uso de técnicas de ecualización de histograma con el fin de que cada imagen tenga una distribución uniforme de sus niveles de gris, y que como resultado se pueda obtener una imagen mejorada para posteriormente pasar al siguiente paso de la metodología. Dentro de la implementación se utilizaron bases de datos públicas, por ejemplo; The Extended Cohn-Kanade Dataset (CK+), Caltech Faces y FERET. Finalmente, los resultados obtenidos se implementaron en diferentes dispositivos móviles. Los resultados que se pretendan alcanzar deberán de tener un promedio de aciertos arriba del 75%. Palabras clave: Face authentication, SURF, dispositivos móviles.

1. Introducción La biometría se refiere a la identificación de una persona en base a sus características físicas y de comportamiento. Incluye el estudio de los métodos para reconocer únicamente los seres humanos basados en uno o más rasgos físicos. La biometría se puede dividir en tres clases: 1) Biometría fisiológica, relacionada con la forma del cuerpo (Reconocimiento facial, huella digital, escaneo del iris, escaneo de retina, escaneo de la mano). 2) Biometría del comportamiento, relacionada con el comportamiento de una persona (Escaneo de la voz, escaneo de la firma, pulsación de teclas). 3) Biometría química, ésta involucra la medición de parámetros químicos tales como el olor, la composición química de la transpiración, etc. Dentro de la biometría fisiológica, el reconocimiento facial destaca como una de las aplicaciones más utilizadas y de mayor éxito durante los últimos años. El reconocimiento de rostros humanos, es un campo de investigación multidisciplinario donde convergen diferentes áreas de estudio como: procesamiento de imágenes, reconocimiento de patrones, redes neuronales, lógica difusa, clustering, máquina de soporte de vectores, y psicología entre otros. El reconocimiento facial puede operar de dos modos: reconocimiento o identificación y autenticación o verificación. Llevar a cabo un reconocimiento o identificación facial significa dar una imagen de la cara y se requiere que el sistema diga quién (si él o ella) es la más probable identificación. En este procedimiento se dice que la


22

coincidencia es de 1:K, donde K representa el número de clases, es decir, se compara la imagen de entrada con las K existentes en la base de datos para concluir si se trata de una coincidencia o no [1]. Mientras que en la autenticación o verificación facial, dada una imagen del rostro y una estimación de la identificación, se requiere que el sistema diga si es verdadera o falsa la estimación que se realizó. En este caso la coincidencia es de 1:1 ya que dada una imagen de entrada se compara con una sola clase de imágenes (la cual representa un conjunto de imágenes de la misma persona). Todos los mecanismos de reconocimiento y autenticación que existen siguen un proceso general que incluye los siguientes pasos [2]: 1) El usuario pide acceso a un recurso (por ejemplo a un dispositivo móvil). 2) El sistema le solicita al usuario su medio de autenticación (rostro, iris, etc.). 3) El usuario entrega sus credenciales (características) de autenticación. 4) El sistema verifica las credenciales del usuario. 5) El sistema niega o proporciona al usuario el acceso al recurso. Una vez concluido este proceso el siguiente paso es llevar a cabo la evaluación general del sistema para medir su desempeño, por lo cual diversos trabajos de investigación [3], [4], [5], toman en cuenta los siguientes parámetros; • Verdaderos positivos (True positive, TP): El sistema reconoce las credenciales de un usuario conocido (los datos del usuario se encuentran almacenados en una base de datos) y le permite el acceso a un recurso o dispositivo. • Falsos positivos (False positive, FP): El sistema reconoce las credenciales de un usuario no conocido (los datos del usuario no se encuentran almacenados en una base de datos) y le permite el acceso a un recurso o dispositivo. • Verdaderos negativos (True negative, TN): El sistema no reconoce las credenciales de un usuario no conocido (los datos del usuario no se encuentran almacenados en una base de datos) y no permite el acceso a un recurso o dispositivo. • Falsos negativos (False negative, FN): El sistema no reconoce las credenciales de un usuario conocido (los datos del usuario se encuentran almacenados en una base de datos) y no le permite el acceso a un recurso o dispositivo. Durante la última década se han propuesto diversos algoritmos de autenticación y reconocimiento facial, los más usados en este campo son LDA, PCA, SIFT y SURF, sin embargo las principales limitantes de los sistemas que usan estos algoritmos es su dependencia a las condiciones de iluminación, posición, forma y tamaño del rostro [6]. Durante la última década se han propuesto diversos algoritmos de autenticación y reconocimiento facial, los más usados en este campo son LDA, PCA, SIFT y SURF. En el 2011, Fedias y Saigaa, propusieron un metodo de autenticación facial basado en características estadísticas de primer orden, el cual fue implementado en computadora [7]. En el 2012, Bairagi et al. propuso un Sistema de reconocimiento facial utilizando carácterísticas de SURF y Gabor [8]. Ren et al., en el 2013 desarrolló una metodología para un Sistema de verificación facial en dispositivos móviles [9]. Y en el 2015, Stokkenes et al., propuso un Sistema multi-modal para Smart phonesutilizando reonocimiento de rostro e iris, basado en el algoritmo SURF [10][11] En resumen, reconocimiento o autenticación facial presenta una problemática, pues el promedio de aciertos en la estimación de la identificación es bajo, en particular, se estima que se encuentra entre un 35% y un 65% de efectividad, dependiendo de las condiciones de iluminación, tamaño de la imagen, etc. por lo que el sistema de autenticación facial mediante procesamiento digital de imágenes debe realizar los ajustes necesarios para aumentar el porcentaje de reconocimiento en más de un 80%.


23

La mayoría de sistemas autenticación utilizan como medio de procesamiento de las imágenes una computadora personal y una cámara que captura el rostro y no indican que tipo de procesamiento llevan a cabo, es decir, que algoritmo se implementó. En la mayoría de los sistemas trabajan con uno o máximo dos algoritmos, sin que se pueda modificar.

2. Características Robustas y Rápidas (Spedded Up Robust Features SURF) Características Robustas y Rápidas (SURF ó Speeded Up Robust Features), fue desarrollado por Herbert Bay et al. (Bay et al., 2006) como un detector de puntos de interés y descriptor robusto. De forma general, SURF es un algoritmo de visión por computador, capaz de obtener una representación visual de una imagen y extraer información detallada y específica del contenido. Esta información es tratada para realizar operaciones como por ejemplo la localización y reconocimiento de determinados objetos, personas o caras, realización de escenas 3D, seguimiento de objetos y extracción de puntos de interés. Este algoritmo forma parte de la inteligencia artificial, la cual es capaz de entrenar un sistema para que interprete imágenes y determine su contenido. Cabe mencionar que SURF está basado en su predecesor SIFT [11], aunque presenta notables diferencias. Los autores afirman que este detector y descriptor presenta principalmente dos mejoras resumidas en los siguientes conceptos [12]: Velocidad de cálculo considerablemente superior sin ocasionar perdida del rendimiento. Mayor robustez ante posibles transformaciones de la imagen. Estas mejoras se consiguen mediante la reducción de la dimensionalidad y complejidad en el cálculo de los vectores de características de los puntos de interés obtenidos. SURF se compone de tres pasos consecutivos [13], los cuales son: 1) Detección de los puntos de interés. 2) Descripción de los puntos de interés. 3) Correspondencia entre puntos de interés. 2.1 Detección de puntos de interés SURF hace uso de la matriz Hessiana, más concretamente, del valor del determinante de la matriz, para la localización y la escala de puntos de interés en una imagen. Ahora bien, el motivo para la utilización de dicha matriz Hessiana es respaldado por su rendimiento en cuanto a la velocidad de cálculo y a la precisión. Lo realmente novedoso del detector incluido en el descriptor SURF respecto de otros detectores es que no utiliza diferentes medidas para el cálculo de la posición y la escala de los puntos de interés individualmente, sino que utiliza el valor del determinante de la matriz Hessiana en ambos casos. Por lo tanto, dado un punto p=(x,y) de la imagen I, la matriz Hessiana definida como (!, ")del punto p y perteneciente a la escala σ se define como se puede observar en la ecuación 1.

(!, ") = #$%%(!, ") $%&(!, ")$%&(!, ") $&&(!, ")' (1)

Donde $%%(!, ") representa la convolución de la derivada parcial de segundo orden de la Gaussiana *+*%+ -(") con la imagen I en el punto p. De manera análoga ocurre con los términos !"(#, $), ""(#, $) de la matriz. A pesar de que los filtros gaussianos son óptimos para el análisis del espacio-escala, se ha implementado una alternativa a los filtros gaussianos en el detector SURF debido a una serie de limitaciones de estos filtros (como la necesidad de ser discretizados, la falta de prevención total del indeseado efecto aliasing, etc.), esta alternativa son los filtros tipo caja (box-filters). Estos nuevos filtros aproximan las derivadas parciales de segundo orden de las gaussianas y pueden ser evaluados de manera muy rápida usando imágenes integrales, independientemente del tamaño de éstas. Las imágenes integrales, cuya definición se encuentra ampliamente detallada en [14](Derpanis, 2007) y [15] (Viola y Jones, 2002) son calculadas mediante la ecuación 2.

%&'(*, +) = --%(&, .)/0"

/12

30!

312 (2)


24

Donde (x,y) representa la posición del punto en la imagen y Ii(x,y) representa la intensidad de la imagen en el punto. Una vez que la imagen integral ha sido creada, se puede calcular la suma de las intensidades de una región por medio de la ecuación 3.

! = !"# + !"$ + !"% + !"& (3)

De esta forma, el tiempo necesario para el cálculo de las operaciones de convolución es independiente del tamaño de la imagen. De este modo resulta que el espacio escala es analizado mediante la elevación del tamaño del filtro, en vez de reducir el tamaño de la imagen como es el caso del detector SIFT. Ésta diferencia se puede apreciar en la Figura 1.

Figura 1 Representación de la intensidad de una región respecto de la imagen integral. Las aproximaciones de las derivadas parciales se denotan como '((, '() y ')). En cuanto al determinante de la matriz Hessiana, éste queda definido por la ecuación 4.

det*,-./0(12 = '((')) 3 4519'()67 (4)

Donde el valor de 0.9 está relacionado con la aproximación del filtro gaussiano. En la práctica este valor es constante y no tiene un impacto significante en los resultados de los experimentos [16]. En la Figura 2 se puede observar la representación de la derivada parcial de segundo orden de un filtro gaussiano discretizado y la aproximación de la derivada implementada en el caso del descriptor SURF.

Figura 2. Derivadas parciales de segundo orden (Bay et al., 2006).

De izquierda a derecha de la Figura 4 se aprecian las derivadas parciales de segundo orden discretizadas y recortadas en las direcciones y así como xy, así como las aproximaciones de las mismas mediante los filtros tipo caja. La imagen de salida obtenida tras la convolución de la imagen original con un filtro de dimensiones 9 x 9, que corresponde a la derivada parcial de segundo orden de una gaussiana con 8 = :1;, es considerada como la escala inicial o también como la máxima resolución espacial (s=1.2, correspondiente a una gaussiana con 8 = :1;). Las capas sucesivas se obtienen mediante la aplicación gradual de filtros de mayores dimensiones, evitando así los efectos de aliasing (curvas) en la imagen. El espacio escala para SURF, al igual que en el caso de SIFT, está divido en octavas. Sin embargo, en SURF las octavas están compuestas por un número fijo de imágenes como resultado de la convolución de la misma imagen original con una serie de filtros tipo caja más grandes. El incremento o paso de los filtros dentro de una misma octava es el doble respecto del paso de la octava anterior, al mismo tiempo que el primero de los filtros de cada octava es el segundo de la octava predecesora, como se muestra en la Figura 3.


25

Figura 3 Representación de la longitud de los filtros de diferentes octavas [12].

De esta manera se obtienen las siguientes series de octavas con sus respectivos filtros:

· Octava inicial: 9 9 !

" 15 15 !

" 21 21 !

" 27 27 · Octava siguiente: 15 15

#$

" 27 27 #$

" 39 39 #$

" 51 51 · Octava siguiente: 27 27

$%

" 51 51 $%

" 75 75 $%

" 99 99 · Y así sucesivamente…

Finalmente para calcular la localización de todos los puntos de interés en todas las escalas, se procede mediante la eliminación de los puntos que no cumplan la condición de máximo en un vecindario de 3 3 3. De esta manera, el máximo determinante de la matriz Hessiana es interpolado en la escala y posición de la imagen. En este punto se da por concluida la etapa de detección de los puntos de interés. 2.2 Descripción de puntos de interés Antes de pasar a la creación del descriptor, la siguiente etapa corresponde a la asignación de la orientación de cada uno de los puntos de interés obtenidos en el paso anterior. Es en esta etapa donde se otorga al descriptor de cada punto la invarianza ante la rotación mediante la orientación del mismo. Primero hay que realizar el cálculo de la respuesta de Haar en ambas direcciones tanto en x como en y, esto se lleva a cabo mediante las funciones representadas en la Figura 4, donde el color negro tiene el peso de -1 y el color blanco tiene el peso de +1. Además, El área de interés para el cálculo de las respuestas de Haar es el área circular centrada en el punto de interés y de radio 6s, siendo s (donde s ≥1) la escala en la que el punto de interés ha sido detectado. De la misma manera, la etapa de muestreo depende de la escala, tomándose como valor a s. Respecto de las funciones onduladas de Haar, se toma el valor 4s, por tanto dependiente también de la escala, como referencia, donde a mayor valor de escala mayor es la dimensión de las funciones onduladas.

Figura 4 Respuestas de Haar en x (izquierda) e y (derecha) [12].

Tras haber realizado todos estos cálculos, se utilizan imágenes integrales nuevamente para proceder al filtrado mediante las máscaras de Haar y obtener así las respuestas en ambas direcciones. Asimismo, son necesarias únicamente seis operaciones para obtener la respuesta en la dirección x e y. Una vez que las respuestas onduladas han sido calculadas, son ponderadas por una gaussiana de valor σ=2.5s centrada en el punto de interés. Las respuestas son representadas como vectores en el espacio colocando la respuesta horizontal y vertical en el eje de abscisas y ordenadas respectivamente. Después, se obtiene una orientación dominante por cada sector mediante la suma de todas las respuestas dentro de una ventana de orientación móvil cubriendo un ángulo de π/3 siguiendo las especificaciones recomendadas por Bay [16]. La orientación final del punto de interés será finalmente aquella cuyo vector sea el más grande


26

dentro de los seis sectores en los que ha sido dividida el área circular alrededor del punto de interés. Esta orientación se puede observar en la Figura 5.

Figura 5 Asignación de la orientación de un punto de interés [12].

Ahora bien, se procede con la creación del descriptor SURF para cada punto de interés. Como primer paso se construye una región cuadrada de tamaño 20s alrededor del punto de interés con la orientación calculada en la etapa anterior. Esta región es a su vez dividida en 4x4 sub-regiones dentro de cada una de las cuales se calculan las respuestas de Haar de los puntos con una separación de muestreo de 5x5 en ambas direcciones. Por simplicidad, se consideran !y "las respuestas de Haar en las direcciones horizontal y vertical respectivamente relativas a la orientación del punto de interés. En la Figura 6 están representadas tanto las respuestas de Haar en cada una de las sub-regiones alrededor del punto de interés así como las componentes !y "de uno de los vectores.

Figura 6 Respuestas de Haar en las sub-regiones del punto de interés [12].

Para dotar a las respuestas ! y "de una mayor robustez ante deformaciones geométricas y errores de posición, éstas son ponderadas por una gaussiana de valor # = 3.3$ centrada en el punto de interés. En cada una de las sub-regiones se suman las respuestas ! y "obteniendo así un valor de ! y "representativo por cada una de las sub-regiones.

Al mismo tiempo se realiza la suma de los valores absolutos de las respuestas | !| y % "% en cada una de las sub-regiones, obteniendo de esta manera, información de la polaridad sobre los cambios de intensidad. En resumen, cada una de las sub-regiones queda representada por un vector v de componentes !, ", | !| y % "%, la representación matemática de este vector se puede apreciar en la ecuación 5.

& = '( ! ,( " ,(| !| ,(% "%) (5)

Por lo tanto, englobando las 4x4 sub-regiones, resulta un descriptor SURF con una longitud de 64 valores para cada uno de los puntos de interés identificados.


27

2.3 Correspondencia entre puntos de interés A este último paso del algoritmo SURF también se le conoce como matching (coincidencia), ya que tiene como finalidad el cálculo de un valor que represente el grado de similitud entre dos imágenes, y que a continuación se puedan establecer las diferentes conclusiones. El cálculo de este valor, representado como distancia y conocido también como score, se realiza mediante la aplicación de una métrica o fórmula de la distancia entre ambas imágenes. Previo al cálculo del score, es necesario establecer las correspondencias entre los puntos clave. Dicha correspondencia se lleva a cabo mediante el cálculo de la distancia euclidiana entre los vectores de características pertenecientes a diferentes puntos de interés. Este cálculo genera a su vez otro valor que será utilizado para determinar cuál de los puntos de la imagen comparada se corresponde con su homólogo, en el caso de existir, de la primera de las imágenes. Suponiendo que se quiere realizar el matching de puntos entre dos imágenes representadas por !"e #. Para cada uno de los puntos clave pertenecientes a !, se seleccionan los dos mejores candidatos de entre todos los puntos clave pertenecientes a #"mediante el criterio de máxima similitud. Este criterio establece que los mejores candidatos para realizar el matching con el punto clave ! perteneciente a !"cuyo vector de características es $!, son los puntos clave %&! y %&#pertenecientes a #"cuyos vectores de características $&! y $&#representan las distancias euclidianas mínimas '! y '#respectivamente, en relación con $!. Si la relación '!/'#entre las distancias mencionadas es suficientemente pequeña, entonces se establece el matching entre los puntos %! y %&!pertenecientes a cada una de las imágenes. De acuerdo con Bay [16], se establece un umbral de 0.7 para el ratio '!/'#. Esta estrategia de matching recibe el nombre de “el vecino más próximo”. Finalmente la puntuación o score entre las dos imágenes se obtiene mediante una relación que tiene en cuenta el número total de puntos correspondientes entre ambas imágenes. La Figura 7 muestra un ejemplo de matching entre ! e ".

Figura 7 Correspondencia (matching) entre dos imágenes.

A pesar del buen desempeño del algoritmo SURF en diferentes aplicaciones como las realizadas por [17] a [22], en este trabajo se propone la implementación de una etapa adicional de preprocesamiento antes de emplear el algoritmo SURF, todo ello con el fin de obtener mejores resultados dentro de un sistema de autenticación facial.

3. Metodología propuesta La incorporación de algoritmos de autenticación facial, en particular en dispositivos móviles ha ido desempeñando un papel muy relevante en los últimos 10 años. Esto ha sido posible gracias a la continua investigación y desarrollo de nuevos algoritmos que permiten hacer más eficiente la autenticación, así como al avance de la tecnología móvil, hoy en día es posible fusionar ambos


28

elementos de tal manera que puedan brindar una medida de seguridad que sirva para proteger su contenido. En este trabajo se propone la implementación de una etapa de preprocesamiento dentro del proceso de autenticación facial. Como se puede observar en la Figura 8, esta metodología consta de cinco pasos: 1) Imágenes del rostro. 2) Detección del rostro. 3) Extracción de características. 4) Coincidencia de características (matching). 5) Decisión.

Figura 8 Metodología propuesta 1) Imágenes del rostro. Se deben de adquirir al menos 10 imágenes del rostro de una persona con el propósito de tener la información mínima requerida para el proceso de autenticación facial. Las imágenes se deben tomar con perfil frontal a la cámara del dispositivo móvil, bajo diferentes condiciones de iluminación, expresiones faciales mínimas y poca variación en la posición de la cabeza. 2) Detección del rostro. Una vez seleccionadas las dos imágenes, cada una de ellas se normaliza a 320x240 pixeles y se le aplica el algoritmo Haar como método de detección de rostro, este es considerado como el paso previo al procesamiento de cada una de las imágenes. Información más detallada sobre este método puede ser consultada en [15]. 3) Extracción de características. En este paso se implementa una fase de preprocesamiento a las imágenes de entrada que fueron seleccionadas previamente (la imagen del dispositivo y la de la base de datos). Por lo tanto, el objetivo de la extracción de características es obtener sólo las imágenes del rostro (sin el fondo de la imagen, ya que esto facilitará su tiempo de procesamiento) y posteriormente


29

implementar el algoritmo SURF para la detección y descripción de características en las imágenes del rostro. De esta manera se busca la obtención de un mejor resultado de todo el proceso de autenticación facial. Dentro de la etapa de extracción de características, se definen cinco sub-etapas: selección de la región de interés, recorte de la región de interés, preprocesamiento de imágenes, normalización de imágenes, finalmente la detección y descripción de puntos de interés. Una vez que ya se ha recortado la región de interés, la sub-etapa posterior consiste en aplicar a las imágenes de entrada una técnica denominada ecualización de histograma (HE), este proceso en particular se considera como la principal aportación de este trabajo ya que la HE es uno de los métodos más usados para realzar efectivamente el contraste de una imagen [23].

Figura 9 Descriptores de las imágenes de entrada 1 y 2.

Además, la HE modifica el valor de los pixeles de tan manera que la intensidad del histograma de la imagen resultante llegar a ser uniforme, además esta imagen hace uso de todos valores de brillantez posible por lo tanto resulta una imagen realzada en su contaste [24]. 4) Coincidencia de características (matching). Una vez extraídas las características (descriptores) de las imágenes de entrada, se continúa con el proceso de coincidencia entre imágenes (en la literatura también se le conoce como match) donde de acuerdo a los descriptores localizados en las imágenes de entrada, se comparan los vectores de la imagen 1 con los vectores de la imagen 2 para determinar cuántos de ellos son similares en ambas imágenes. Para que un descriptor de una imagen sea considerado como similar en otra imagen, es necesario encontrar la distancia Euclidiana menor entre ellos. Información más detallada sobre este proceso se puede encontrar en (Deza y Deza, 2009). Después, todas las coincidencias que fueron encontradas en ambas imágenes son contadas para determinar su número extracto y de esta manera poder continuar con el paso final de la metodología. Este proceso puede ser apreciado en la Figura 4-10 donde cada descriptor de la imagen 1 que coincide con el descriptor de la imagen 2 es unido por una línea de color verde para representar dicha coincidencia.

Figura 10 Coincidencias entre las imágenes de entrada.

5) Decisión. Dado el número total de coincidencias entre las imágenes, el siguiente paso es la decisión donde se ha propuesto un umbral heurístico con valor de 30, esto quiere decir que si el número de coincidencias


30

es mayor o igual a 30, el proceso de autenticación facial se considerará como exitoso (Match). Por el contrario, si es menor a dicho umbral el proceso se considerará como erróneo (Not match). Con el fin de evaluar esta metodología, los voluntarios, diferentes dispositivos móviles (Smartphones y Tablets), considerando algunas de las imágenes de bases de datos públicas (The Extended Cohn-Kanade Dataset (CK+), Caltech Faces y FERET) fueron sometidos a diferentes pruebas. Los resultados obtenidos se presentan en la siguiente sección.

4. Pruebas y Resultados

Empleando el diagrama de la metodología propuesta en la Figura 8 se realizaron diferentes pruebas en dispositivos móviles, donde en conjunto con Eclipse se instaló la aplicación de autenticación facial en cada uno de ellos, así todo el procesamiento se realiza de forma independiente en cada dispositivo. Las versiones de Android utilizadas fueron distintas para cada dispositivo móvil, variando desde la versión 4.0, hasta la 5.1, dependiendo de la versión que soportaba el dispositivo móvil de acuerdo a sus características internas. A continuación se presentan los resultados de dicha metodología usando las bases de datos públicas The Extended Cohn-Kanade Dataset (CK+), Caltech Faces y FERET en las Tablets Samsung Galaxy Tab 4 y Note 10.1.

Imágenes del rostro: Se seleccionaron las mismas 40 imágenes de cada base de datos que habían sido empleadas en pruebas anteriores, las cuales fueron usadas en escala de grises y normalizadas a 320x240 pixeles.

Detección del rostro: La Figura 11 presenta algunos de los rostros que fueron detectados correcta (95%) e incorrectamente (5%). En ambos dispositivos se obtuvieron los mismos resultados de este proceso.

Figura 11 Detección del rostro correcta (C) e incorrecta (I).

Extracción de características: La Figura 12 muestra un ejemplo del proceso de extracción de características en las imágenes de entrada, la cual se considera desde el recorte de la región de interés hasta la detección y descripción de puntos de interés tanto para una detección de rostro correcta como incorrecta.


31

Figura 12 Extracción de características en dispositivos móviles (parte 1). La Tabla 1 despliega los resultados obtenidos en este proceso además del número de características en promedio por cada base de datos. Cabe resaltar que se adquirieron los mismos resultados en ambos dispositivos. Coincidencias: La Tabla 2 presenta los resultados obtenidos en este proceso además del número de coincidencias en promedio por cada base de datos. Estos resultados fueron los mismos en ambos dispositivos. Por otro lado, la Figura 13 despliega algunos de los resultados tanto exitosos como erróneos del proceso de autenticación facial en las imágenes de las bases de datos The Extended Cohn-Kanade Dataset (CK+), Caltech Faces y FERET, respectivamente.


32

CK+ Caltech Faces FERET Prueba FImg1 FImg2 FImg1 FImg2 FImg1 FImg2

1 103 107 125 122 110 114 2 121 104 129 129 142 134 3 091 107 93 113 144 152 4 110 142 125 136 113 130 5 111 105 137 126 121 127 6 127 129 112 137 101 094 7 106 120 111 107 113 106 8 125 124 130 120 107 092 9 115 107 102 088 099 092 10 086 080 119 115 112 130 11 120 140 098 110 104 106 12 103 098 128 134 139 130 13 093 094 130 120 138 134 14 102 097 115 123 125 111 15 119 116 132 154 141 142 16 134 142 100 105 099 114 17 111 106 129 132 125 130 18 119 117 133 112 125 117 19 124 115 111 099 116 096 20 117 137 128 114 108 106

Promedio 111 114 119 119 119 117

Tabla 1 Número de características en dispositivos móviles (parte 1).

Prueba CK+ Caltech Faces FERET 1 49 31 16 2 62 16 63 3 40 37 51 4 44 37 44 5 45 06 15 6 32 21 33 7 59 08 34 8 31 39 29 9 61 07 31 10 49 05 02 11 78 33 63 12 49 04 57 13 65 31 89 14 55 51 57 15 62 37 97 16 62 31 33 17 65 39 04 18 71 06 54 19 47 53 54 20 51 41 35

Promedio 53 26 43

Tabla 2 Número de coincidencias en dispositivos móviles (parte 1).


33

Figura 13 Autenticación facial exitosa y errónea en dispositivos móviles.

Decisión: Los resultados se presentan en la Tabla 3 donde se muestran los verdaderos positivos (TP), falsos negativos (FN) y el porcentaje de autenticidad de las imágenes evaluadas, con el cual se determina si esta fue exitosa o errónea. Estos resultados fueron los mismos para ambos dispositivos.

Base de datos TP FN Autenticidad CK+ 100% 0% 100% Caltech Faces 60% 40% 60% FERET 75% 25% 75% Promedio 78% 22% 78%

Tabla 3 TP y FN en imágenes evaluadas en dispositivos móviles (parte 1).

En las Figuras 14 y 15 se puede observar un ejemplo de la implementación de la metodología propuesta, la cual fue ejecutada en las Tablets Samsung Galaxy Tab 4 y Galaxy Note 10.1, respectivamente.

Figura 14 Autenticación facial en Tablet Samsung Galaxy Tab 4.


34

Figura 15 Autenticación facial en Tablet Samsung Galaxy Note 10.1.

5. Conclusiones

En el presente proyecto se presentó una metodología de autenticación facial. Esta metodología incluye el uso del algoritmo SURF y adicional a éste se desarrolló una etapa de preprocesamiento basada en la ecualización de histograma, con el propósito de aumentar el porcentaje de autenticación facial, haciendo con esto que el sistema sea capaz de identificar a la persona que está utilizando este dispositivo y que no le permita a otra persona ingresar a él. Para validar este trabajo se implementó la metodología en dispositivos móviles que cuentan con el sistema operativo Android y se llevaron a cabo pruebas del desempeño de esta metodología en algunos dispositivos móviles. Los resultados obtenidos mejoran el porcentaje de autenticación utilizando técnicas similares, e inclusive aumentan ese porcentaje en algoritmos que utilizan exclusivamente el algoritmo SURF. El número de coincidencias reportado hasta antes de este trabajo era de veinte para identificar que se trata de la misma persona, y con el método propuesto se aumentó ese número de coincidencias a 30, lo cual es una mejora significativa con respecto a trabajos similares en el área.

Referencias [1] Chao, W.-L. 2010. Face Recognition. GICE, National Taiwan University, Taiwan. [2] Iglesias, G. 2007. Sistema de Autenticación para Dispositivos Móviles basado en Biometría de

comportamiento de Tecleo. Tesis de grado de Ingeniería en Sistemas Computacionales. Instituto Tecnológico de Morelia. México, D.F.

[3] Yin, Q., Tang, X., and Sun, J. 2011. An associate-predict model for face recognition. In Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on. IEEE, p. 497–504

[4] Ruiz, S., S. Lee, S. R. Soekadar, A. Caria, R. Veit, T. Kircher, and R. Sitaram. 2013. Acquired self-control of insula cortex modulates emotion recognition and brain network connectivity in schizophrenia. Human brain mapping, 34(1), p. 200–212.

[5] Valstar, M., J. Girard, T. Almaev, G. McKeown, M. Mehu, L. Yin, and J. Cohn. 2015. Fera 2015-second facial expression recognition and analysis challenge. Proc. IEEE ICFG.


35

[6] Mendoza-Martinez, C., J. C. Pedraza-Ortega, and J. M. Ramos-Arreguin. 2014. A Novel Approach for Face Authentication Using Speeded Up Robust Features Algorithm. In Human-Inspired Computing and Its Applications, p. 356–367. Springer International Publishing.

[7] Fedias, M., and D. Saigaa. 2011. A New Fast method of face Authentication based on First order Statistical Feature. In International Journal of Computer Applications (IJCA), 14(8), p. 32-37.

[8] Bairagi, B. K., S. C. Das, A. Chatterjee, and B. Tudu. 2012. Expressions invariant face recognition using SURF and Gabor features. In Third International Conference on Emerging Applications of Information Technology (EAIT), IEEE, p. 170-173.

[9] Ren, J., X. Jiang, and J. Yuan. 2013. A complete and fully automated face verification system on mobile devices. In Pattern Recognition, 46(1), p. 45-56.

[10] Stokkenes, M., K. B. Raja, R. Raghavendra, and C. Busch. 2015. Multi-modal Authentication System for Smartphones Using Face, Iris and Periocular. International Conference on Biometrics, IEEE, p.143-150

[11] Lowe, D. G. 2004. Distinctive Image Features from Scale-Invariant Keypoints. In International journal of computer vision, 60(2), p. 91–110.

[12] Boullosa, Ó. 2011. Estudio comparativo de descriptores visuales para la detección de escenas cuasi-duplicadas. Universidad Autónoma de Madrid, Madrid, España.

[13] Oyallon, E., and J. Rabin. 2013. An analysis and implementation of the SURF method, and its comparison to SIFT. In Image Processing On Line, ISSN 2105–1232.

[14] Derpanis, K. 2007. Integral image-based representations. Department of Computer Science and Engineering, York University, p. 1–6.

[15] Viola, P., and M. Jones. 2002. Robust real-time object detection. In International Journal of Computer Vision, vol. 57, no. 2, p. 137–154.

[16] Bay, H., A. Ess, T. Tuytelaars, and L. Van Gool. 2008. Speeded-up robust features (SURF). In Computer vision and image understanding, 110(3), p. 346–359.

[17] Terriberry, T. B., L. M. French, and J. Helmsen. 2008. GPU accelerating speeded-up robust features. In Proceedings of 3DPVT, Vol. 8, p. 355–362.

[18] Svab, J., T. Krajnik, J. Faigl, and L. Preucil. 2009. FPGA based speeded up robust features. In Technologies for Practical Robot Applications. IEEE International Conference on, p. 35–41.

[19] Bouris, D., A. Nikitakis, and I. Papaefstathiou. 2010. Fast and efficient FPGA-based feature detection employing the SURF algorithm. In Field-Programmable Custom Computing Machines, 18th IEEE Annual International Symposium on, p. 3–10.

[20] Murali, Y., and M. MITS. 2012. Image mosaic using speeded up robust feature detection. In International Journal of Advanced Research in Electronics and Communication Engineering, 1(3), p. 40–45.

[21] Thakoor, K. A., S. Marat, P. J. Nasiatka, B. P. McIntosh, F. E. Sahin, A. R. Tanguay, J. D. Weiland, and L. Itti. 2013. Attention biased speeded up robust features (AB-SURF): A neurally-inspired object recognition algorithm for a wearable aid for the visually-impaired. In Multimedia and Expo Workshops, IEEE International Conference on, p. 1–6.

[22] Wang, Y. T., C. T. Chi, and Y. C. Feng. 2014. Robot mapping using local invariant feature detectors. In Engineering Computations: International Journal for Computer-Aided Engineering and Software 31(2), p. 297–316.

[23] Paik, J.K. 2011. Image processing method and system using gain controllable clipped histogram equalization. U.S. Patent No 7, 885, 462, p. 1–15.

[24] Han, J.H., S. Yang, and B.U. Lee. 2011. A novel 3-D color histogram equalization method with uniform 1-D gray scale histogram. IEEE Transactions on Image Processing, 20(2), p. 506–512.

[25] Deza, M. M., and E. Deza. 2009. Encyclopedia of Distances. Springer, Berlin. DIGINFO. 2012.

la mecatrónica en méxico - mecamex.net · prologo estimados lectores, de nueva cuenta es un honor...

Documents