avances en visión artificial gracias al aprendizaje profundo · aprendizaje profundo ¿por qué...
Post on 21-Aug-2020
3 Views
Preview:
TRANSCRIPT
javier@panoimagen.com
Avances en visión artificial gracias al Aprendizaje Profundo
Javier Becerra ElcintoDr. Ing. Telecomunicación
javier@panoimagen.com
Un poco de historia
Imagen: Revista Trimestral de Histología Normal y Patológica, Santiago Ramón y Cajal (1888/1889)
javier@panoimagen.com
Perceptron
La unidad básica de una red neuronal (McCulloch–Pitts/Rosenblatt [1957])
Le siguieron Adaline [1960], Neocognitron [1980], y otros modelos más complejos.
javier@panoimagen.com
Respuestas neuronales en el cortex visual V1
D. Hubel & T. Wiesel [1968]
javier@panoimagen.com
Algoritmos ML y Visión Artificial
Algoritmos tipo “feature engineering”Incorporan conocimiento del dominio al problema
Reconocimiento de objetos con SIFT [1999]
Detección de personas - HOG [2005]
Algoritmos tipo “data-driven”Los propios datos determinan el comportamiento del algoritmo
Reconocimiento facial con Eigenfaces [1987]
Segmentación usando GrabCut [2004]
Reconocimiento de dígitos manuscritos (MNIST) [1998]
javier@panoimagen.com
¿Y el Aprendizaje Profundo?
Primera aparición registrada del término Deep Learning en 2000.
Popularizado por artículo del 2006.
Quiz: ¿en qué año se publicó el algoritmo que se considera como el primer ejemplo de “Deep Learning”?
javier@panoimagen.com
Aprendizaje profundo
¡¡¡En 1965!!!
GMDH (8 capas) [2015]
javier@panoimagen.com
Aprendizaje profundo
¿Por qué empezamos a oir hablar de Deep Learning 40 años más tarde?
Las soluciones de aprendizaje profundo no se han podido implementar de forma práctica hasta que:
●Se ha dispuesto de grandes bases de datos de test para entrenamiento.
●La capacidad de proceso disponible (en CPUs, GPUs, múltiples CPUs/GPUs conectados en red…) ha reducido los tiempos de cálculo hasta valores razonables.
javier@panoimagen.com
Aprendizaje profundo
¿Y en qué consiste el Aprendizaje profundo?
No hay una definición única, pero casi todas coinciden en que:Se trata de sistemas de aprendizaje multicapa en cascada, con unidades de procesamiento no lineal.
Pueden utilizar aprendizaje supervisado o aprendizaje no supervisado.
El aprendizaje de múltiples niveles de características o representaciones de datos: las características de más alto nivel se derivan de las características de nivel inferior para formar una representación jerárquica.
javier@panoimagen.com
Aprendizaje profundo
Vamos a ilustrarlo con una red neuronal sencilla:
playground.tensorflow.com
javier@panoimagen.com
javier@panoimagen.com
javier@panoimagen.com
Aprendizaje profundo: arquitectura jerárquica
javier@panoimagen.com
ImageNet Large Scale Visual Recognition Challenge
1.200.000 imágenes clasificadas en 1000 categorías
javier@panoimagen.com
ImageNet Large Scale Visual Recognition Challenge
Presentación de Kaiming He en ICCV15
AlexNet: ImageNet Classification with Deep Convolutional Neural Networks [2012]
javier@panoimagen.com
Algunas aplicaciones
Imagen generada mediante la red DeepDreamImagen generada mediante la red DeepDream
javier@panoimagen.com
Google Deep Brain
●Red neuronal de convolución●8 capas●3 millones de nodos●1.000 millones de conexiones●16.000 procesadores●10.000.000 de imágenes (sin etiquetar, extraídas de Youtube)
…logran “descubrir” de forma autónoma la imagen de un gato
Quoc Le et al. [2011]
javier@panoimagen.com
Facebook’s DeepFace
FBI “Next Generation Identification”: precisión del 85%.
Facebook’s DeepFace: precisión del 97%.
Entrenada a partir de 4 millones de fotografías de usuarios.
DeepFace [2014]
javier@panoimagen.com
Generative Adversarial Networks
Un gran avance en los métodos de generación de imágenes utilizando dos redes neuronales que compiten entre sí:●El discriminador: un “detective” que se conoce todas las obras de, digamos, Miró, y detecta cualquier Miró a la legua.●El generador: un “falsificador” incansable, y que nunca ha visto un ¡¡cuadro de Miró!! Él crea obras nuevas “partiendo de la nada”, y en función de la reacción del detective, va corrigiendo su estilo hasta lograr engañarlo.
Una mejora sustancial frente a métodos de optimización con maximización a posteriori utilizados previamente.
Ian Goodfellow et al [2014]
javier@panoimagen.com
Generative Adversarial Networks
Algunos ejemplos online:● Image to image (basado en Isola et al. [2016])● Coloreando imágenes (basado en Zhang et al [2016])
javier@panoimagen.com
GRACIAS POR SU ATENCIÓN
top related