grupo de ingeniería electrónica aplicada a espacios inteligentes y transporte modelado de arrays...

18
Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones de localización de locutores Alejandro Legrá-Ríos, Javier Macías-Guarasa, Daniel Pizarro y Marta Marrón-Romera Departamento de Electrónica – Universidad de Alcalá email: [email protected] SAAEI’2011 – Sesión Especial Aplicaciones en espacios inteligentes – 5/julio/2011

Upload: sandalio-junco

Post on 12-Feb-2015

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte

Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones de

localización de locutores

Alejandro Legrá-Ríos, Javier Macías-Guarasa, Daniel Pizarro y Marta Marrón-Romera

Departamento de Electrónica – Universidad de Alcaláemail: [email protected]

SAAEI’2011 – Sesión Especial Aplicaciones en espacios inteligentes – 5/julio/2011

Page 2: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

2 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Índice Introducción

Descripción del sistema Propuesta general Generación de imágenes de potencia acústica Búsqueda de máximos y cálculo de posición 3D

Evaluación experimental: Bases de datos y métricas de evaluación Resultados

Conclusiones y líneas futuras

Page 3: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

3 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Introducción Contexto:

Análisis automático de espacios inteligentes Detección, localización y seguimiento de

locutores Estrategias:

Sensores de visión, acústicos, etc. Fusión sensorial

Nuestra propuesta: Sensado acústico: modelado de arrays de

micrófonos como cámaras de perspectiva Literatura: tareas distintas y falta evaluación

objetiva con datos reales

Evaluación preliminar

Page 4: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

4 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Descripción del sistemaPropuestas general Cámara:

Píxel como intersección rayo con plano imagen Array de micrófonos:

Rayos acústicos parten de centro del array y barren espacio a explorar

Page 5: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

5 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Descripción del sistemaGeneración de imágenes acústicas Generación de mapas

de potencia acústica:

SRP-PHAT

Page 6: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

6 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Descripción del sistemaBúsqueda de máximos y cálculo posición 3D Estimación de máximos:

Non maximum supressioncon aproximación subpixélica

Cálculo de posición 3D: Triangulación lineal DLT

Eliminación de estimacionesincoherentes: Para entornos con más de

4 arrays Variante de la técnica Random Sample

Consensus (RANSAC)

Page 7: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

7 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Evaluación experimentalBases de datos proy. CHIL + eval. CLEAR 2007 Seminarios:

AIT (~40 min.): 3 arrays

ITC (~60 min): 6 arrays

Page 8: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

8 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Evaluación experimentalMétricas Pcor:

% tramas con error de posicionamiento inferior a 50cm (fine error)

AEE fine+gross: El error promedio total cometido en todas las

estimaciones realizadas AEE fine:

El error promedio en las estimaciones definidas como fine errors

Deletions: % de tramas con locutor activo no detectado

por el sistema

Page 9: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

9 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Evaluación experimentalResultados Variación en resolución imágenes (AIT):

Con separación radial en rayo de 100mm

SRP-PHAT exhaustivo (tamaño celda 50mm): Pcor = 63% AEE Fine = 233mm AEE fine+gross = 572mm

Resultados prometedores

Page 10: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

10 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Evaluación experimentalResultados Variación en separación radial (AIT):

SRP-PHAT exhaustivo (tamaño celda 50mm): Pcor = 63% AEE Fine = 233mm AEE fine+gross = 572mm

Necesidad de afinar estrategia

de separación radial

Page 11: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

11 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Evaluación experimentalResultados Estimación de coherencia (ITC):

SRP-PHAT exhaustivo (tamaño celda 50mm): Pcor = 62% AEE Fine = 175mm AEE fine+gross = 762mm

Clave, pero necesidad de

mejorar tasa de borrados

Page 12: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

12 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Conclusiones y líneas futuras Propuesta de sistema de localización de

locutores: Información acústica Algorítmica de visión, modelando arrays de micrófonos

como cámaras de perspectiva Resultados:

No mejoran algoritmos clásicos Trabajo preliminar: prometedores

Trabajo futuro: Evaluación exhaustiva Técnicas más elaboradas de estimación de máximos y

evaluación de coherencia Incorporación de algoritmos de seguimiento

Page 13: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

13 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

¿ Preguntas ?

Page 14: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

14 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Descripción del sistemaBúsqueda de máximos y cálculo posición 3D

Page 15: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

15 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Evaluación experimentalResultados Experimento base:

Error pequeño en estimación DLT

Page 16: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

16 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Evaluación experimentalResultados Experimento base:

Error elevado en estimación DLT

Page 17: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

17 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Evaluación experimentalResultados Barrido en resolución:

Page 18: Grupo de Ingeniería Electrónica aplicada a Espacios INteligentes y TRAnsporte Modelado de arrays de micrófonos como cámaras de perspectiva en aplicaciones

18 de 13 Arrays de micrófonos como cámaras de perspectiva – UAH SAAEI’2011 – SS Espacios inteligentes

Evaluación experimentalResultados Non maximum supression:

Máximos locales Problemas en selección de umbral