presentation rvp imagesimilarity
Post on 04-Jul-2015
274 Views
Preview:
DESCRIPTION
TRANSCRIPT
Búsqueda de Similitud no-supervisada en Imágenes a
través de Comparación Elástica.
H. Cuesta-Arvizu¹ & J. Figueroa-Nazuno²
¹ Universidad Autónoma del Estado de México² Centro de Investigación en Computación. Instituto Politécnico
Nacional
09/07/2012 1
Contenido
• Motivación.
• Definición del Procedimiento.a) Caltech256 Dataset
b) Generación de la Representación.
c) Mapeo lineal de la Representación.
d) Comparación Elástica N-Dimensional.
• Fast Dynamic Time Warping (FDTW).
• Pseudocódigo para el FDTW.
• Resultados Experimentales.
• Conclusiones.
09/07/2012 2
Motivación
• El ser humano cuenta con mecanismos para detecciónde similitud que aun son desconocidos y el problema decomparar imágenes a nivel semántico o estructural hademostrado ser un problema complejo desde el puntode vista computacional.
• Típicamente este problema es tratado por las técnicasclásicas como, comparación de Ondeletas, Histogramade color, Frecuencias (Análisis de Fourier) oReconocimiento de patrones con redes neuronalesartificiales. Sin embargo cada uno de estos métodospierde información acerca de la imagen o requiereentrenamiento exhaustivo.
09/07/2012 3
Definición del Procedimiento
• El procedimiento consta de tres faces (Generaciónde la Representación, Mapeo lineal de laRepresentación, Aplicación de la ComparaciónElástica N-Dimensional).
• Siendo la comparación elástica una comparaciónde series de tiempo, a través de una medida dedistancia. A continuación se describen las facesdel procedimiento.
09/07/2012 4
Caltech256 Dataset
• Las consultas de imágenes se realizaron sobre unset acotado de la base de datos de imágenesCaltech la cual cuenta con 30607 imágenes quefueron obtenidas de Google y de PicSearch.com.
• Las imágenes están catalogadas en 257 clasesevaluadas por el ojo humano para asegurarcalidad y relevancia.
• De las cuales para el presente trabajo fueronusadas 684 imágenes pertenecientes a 8categorías.
09/07/2012 5
Generación de la Representación
• Se considera a cualquier imagen como una matriz de la cual se obtiene un vector de 768 elementos (256 x cada sub-matriz de color).
• Definiendo el vector (Representación de la Imagen) como sigue:
{ }n
nmm
n
vv
dd
dd
....1
,1,
,11,1
=∨⇒
=∧L
MOM
L
09/07/2012 6
Mapeo lineal de la Representación
Figura. 1. Representación Original y Normalizada.
• Representación debe contener valores escalarespositivos. En la parte inferior de la Figura 1, seaprecia la misma firma normalizada conservandola morfología básica de la serie de tiempo peroconteniendo solo valores positivos.
09/07/2012 7
Comparación Elástica N-Dimensional.
• Como se observa en la Figura 2. Se comparauna representación de Referencia contra lasrepresentaciones a consultar obteniendo unamatriz de distancias y una alineación parcialde las series de tiempo, obteniendo un valorescalar de distancia entre lasrepresentaciones.
09/07/2012 8
Comparación Elástica N-Dimensional.
Figura. 2. Alineación parcial por medio del FDTW.09/07/2012 9
Fast Dynamic Time Warping
Figura 3. Ejemplo de Alineación de series de tiempo con FDTW.
• FDTW es un algoritmo para medir similitudentre dos secuencias que varían ya sea en sutiempo o su velocidad. FDTW busca la optimaalineación de “warps” de puntos en los datosde dos series de tiempo (Ver Figura 3.).
09/07/2012 10
Pseudocódigo para el FDTW.
09/07/2012 11
Resultados Experimentales• Aunque no es posible definir un criterio
universalmente aceptado para categorizarsimilitud de imágenes. En este artículo se utiliza uncriterio de apreciación directa, vía interpretaciónhumana
Figura 3. Casos de éxito para la Comparación Elástica para las clases dinosaurios, africanos y camiones.
09/07/2012 12
Resultados Experimentales
Figura 4. Casos de éxito para la Comparación Elástica para las clases caballos, rosas y elefantes.09/07/2012 13
Resultados Experimentales
Figura 5. Caso de error para la Comparación Elástica para la clase Edificios y paisajes.
09/07/2012 14
Resultados Experimentales
Nombre de la Clase
No. Imágenes
% Primer Resultado Correcto
% Segundo Resultado Correcto
Dinosaurio 102 99 99Africanos 85 98 95Camiones 56 98 90Caballos 122 92 88Rosas 95 96 92Elefantes 36 98 87Paisajes 116 60 52Edificios 72 50 45
Tabla I.- Resultado de la Comparación elástica.
09/07/2012 15
Conclusiones• Como muestran los resultados el procedimiento es muy
preciso para la clasificación de imágenes de diferentesclases.
• Adicionalmente, el hecho de que en esteprocedimiento no requiera de ningún tipo deentrenamiento previo, ofrece ventajas para labúsqueda en grandes sets de imágenes que no seencuentren anotados ni clasificados de ninguna forma(semántica o contextual).
• Una de las principales aportaciones del modelopropuesto es su simplicidad.
• Una búsqueda de similitud sin contexto y no supervisadaque ofrece buenos resultados para la mayoría de loscasos estudiados.
09/07/2012 16
Gracias.
Hector Cuesta-Arvizu
hm_cuesta@yahoo.com.mx
@hmcuesta
09/07/2012 17
top related