Reconocimiento visual de ademanes usando MS Kinect - Introducción
Dr. Héctor Avilés | Escuela de Inviernode Robótica
2015
Motivación● Los ademanes son
importantes porque:– Complementan el
lenguaje hablado– Son una alternativa
de comunicación a la distancia o en ambientes ruidosos
– Se cree que es previo a la comunicación oral
Motivación
● Igualmente los ademanes son importantes en comunicación humano-robot:– Para conversaciones más “naturales” – Para mostrar cómo, dónde y con qué debe
realizar sus tareas– Complementar o eliminar ambigüedad en
instrucciones habladas, e.g., “múevete para allá”
Dispositivos de captura
Dispositivos “usables”
Dispositivos “táctiles”Dispositivos “táctiles”
Sistemas visuales
Dispositivos de captura
● Ventajas de los sistemas visuales:– No requieren manipulación o uso de objetos– Son menos intrusivos– Menos problemáticos para personas
discapacitadas– Permiten explorar mecanismos que emulen a
la visión humana
Dispositivos de captura
● Sin embargo:– Mayor cantidad de datos (e.g., en captura de
video RGB de 640x480 pixeles a 30Hz ≈ 27Mb)
– Requiere algoritmos más sofisticados para extracción de información
● Usualmente se realiza un compromiso “precisión-velocidad de procesamiento”
Contenido
✗ Motivación✗ Dispositivos de captura✔ Reconocimiento visual de ademanes:
✔ Definición– Decisiones de diseño
● Resumen
Definición
Reconocimiento visual de ademanes
Proceso de análisis para asignar a un ademán capturado en una o más imágenes
un concepto o significado previamente conocido
Contenido
✗ Motivación✗ Dispositivos de captura✔ Reconocimiento visual de ademanes:
✗ Definición✔ Decisiones de diseño
● Resumen
Decisiones de diseño
● El reconocimiento visual de ademanes requiere conocer la aplicación y de ahi definir:– Ademanes– Dispositivo de captura de imágenes– Algoritmos para análisis visual– Atributos de los gestos– Método de clasificación
Aplicaciones● Operación de equipos
de cómputo (e.g., dispositivos móviles)
● Sistemas de seguridad
● Control de la TV
● Análisis de actividades en ambientes inteligentes (casas, aulas)
● Evaluación automático de interfaces gráficas
● Apoyo a personas discapacitadas
● Cuidado de niños y adultos mayores
● Interacción por videoconferencia
● Evaluación de desempeño deportivo
● Animación de avatares (e.g., en películas animadas)
● Juego de videojuegos
● ...
● Instrucción de robots
Aplicaciones
● Sin embargo, de acuerdo a M. Turk:
¡No hay una aplicación definitoria de esta área de estudio!
Selección de ademanes
● Diversas clasificaciones de ademanes:– De la mano, del brazo, del cuerpo
– Naturales (e.g., espontáneos), codificados
– Estáticos (e.g., posturas), dinámicos
– Gesticulación, pantomima, emblemáticos, lenguaje de signos
– Icónicos, metafóricos, deícticos, simbólicos, golpe
● En general, la aplicación influye en las decisiones a tomar
Dispositivos de captura
Cámaras termales
Escáner láser
Cámaras RGB-D
CámarasTime of Flight
Cámaras RGB
Cámara stereo
Análisis visual
● Tres tareas principales:– Localización del objeto de interés (i.e.,
aislarlo dentro de la imagen) – Seguimiento a través de la secuencia de
imágenes (localización y predicción)– Descripción interna del objeto
● Usualmente se requiere forma, pose, profundidad, color, movimiento
Análisis visual
● Estas tareas no son simples en ambientes poco restringidos
● No existen algoritmos que resuelvan estos problemas completamente
Análisis visual - Seguimiento
Cambios de iluminación Cambios en orientación y distancia
Oclusión parcial Objetos similares
Análisis visual - Descripción de la mano
Modelo volumétricotexturizado
Modelo de Contorno
Modelo de esqueleto
Silueta
Modelo de alambreFormas geométricas simples
Atributos de los ademanes
● Objetivo esencial con múltiples propuestas de tres tipos principales:– Postura– Movimiento– Combinación postura-movimiento
Atributos de los ademanes
Postura ó posición específica en un momento determinado
Desplazamiento en la secuencia de video
Clasificadores de ademanes
● Múltiples alternativas:– Plantillas de postura/movimiento– Redes neuronales– Árboles de decisión– Modelos difusos– Modelos ocultos de Markov y redes Bayesianas
(dinámicas)– ...
● Los modelos probabilistas aparecen comúnmente en la literatura
Decisiones de diseño
Las decisiones anteriores forman parte de una teoría al reconocimiento visual de
ademanes todavía en desarrollo
Decisiones de diseño
● Aproximación computacional de D. Marr al problema de visión:– Modelo computacional: ¿Qué ademanes?,
¿para qué usarlos?– Algoritmos: ¿Qué información extraer de los
ademanes?, ¿cómo reconocerlos?– Implementación: ¿Qué dispositivos de
captura?, ¿qué estructuras de datos?, ¿lenguajes?
Contenido
✗ Motivación✗ Dispositivos de captura✔ Reconocimiento visual de ademanes:
✗ Definición✗ Decisiones de diseño
✔ Resumen
Resumen
● Los ademanes son importantes en comunicación natural humano-humano, hombre-máquina y humano-robot
● Múltiples aproximaciones (aplicaciones, dispositivos, algoritmos de análisis visual, descripciones, atributos, clasificadores)
● Ninguna solución definitiva todavía para cada etapa ni para el problema en general