utp 2015-2_pdi_ea1 introduccion a la va

36
Procesamiento de Imágenes y Visión Artificial (WEE2) Sesión: 1 MSc. Ing. José C. Benítez P. Introducción a la Visión Artificial y el Procesamiento Digital de Imágenes

Upload: jcbpperu

Post on 28-Jul-2015

759 views

Category:

Documents


3 download

TRANSCRIPT

Procesamiento de Imágenes

y Visión Artificial

(WEE2)

Sesión: 1

MSc. Ing. José C. Benítez P.

Introducción a

la Visión Artificial y el

Procesamiento Digital de Imágenes

Logros de aprendizaje

1. Definir los conceptos básicos de Inteligencia Artificial,

Visión Computacional, Visión Artificial, Procesamiento

de Imágenes, Gráficos por computadora.

2. Conocer las dificultades de la Visión Computacional y el

Reconocimiento de Patrones.

3. Definir la imposibilidad física y, las restricciones y

supuestos del procesamiento de imágenes.

4. Identificar la aplicaciones de la visión artificial.

5. Modelar un Sistema de Visión Artificial.

2

3

Contenido

Introducción a la Visión Artificial y al PDI

• Inteligencia artificial.

• Visión Artificial, Visión Computacional, PDI, Gráficos

por computadora.

• Disciplinas de la Visión Computacional.

• Procesamiento de Imágenes.

• Reconocimiento de patrones.

• Visión computacional.

• Gráficos por computadora.

• Dificultades de la Visión Computacional.

• Dificultades del Reconocimiento de Patrones.

• Imposibilidad física.

• Restricciones y supuestos.

• Aplicaciones de la Visión Artificial.

• Sistema de Visión Artificial.

Esquema del curso

Operaciones

Punto

Filtros Segmentación

Extracción de

características

Operaciones

Morfológicas

Reconocimiento

de Patrones

Introducción a

la Visión

Artificial

Representación

de la Imagen

4

Inteligencia Artificial

• La inteligencia artificial es

una ciencia que intenta crear

programas para máquinas que

imiten el comportamiento y la

comprensión humana.

• Intenta crear máquinas y/o

programas para automatizar

tareas que requieran de

comportamiento inteligente.

• Estas máquinas y/o programas

se denominan agentes.

5

Visión Artificial

• La Visión Artificial (Visión por Computadoro Visión Computacional), es parte de lainteligencia artificial.

• Es el conjunto de técnicas y modelos quepermiten procesar, analizar y explicaraquella información espacial (3-D) obtenidaa través de una imagen digital (2-D).

• Intenta programar un computador para que"entienda" una escena o las característicasde una imagen digital.

6

La visión artificial y otras áreas

7

Disciplinas de la Visión Computacional

Procesamiento de Imágenes

Reconocimiento de Patrones

Visión Computacional

Gráficos por Computadora

8

Procesamiento de Imágenes

• Transforma imágenes para obtener nuevas imágenes.

Binarización, Complemento

Corte, Ecualización, Filtros

Operaciones Morfológicas

Imagen 2D Imagen 2D

9

• Mejorado de Imágenes

• Restauración de imágenes

corregir imágenes fuera de foco

• Compresión de la imagen

(transmisión)

• Identificar el ROI.

Procesamiento de Imágenes

10

Reconocimiento de Patrones

• Identificar los objetos existentes en una imagen.

Segmentación, filtros,

Identificación de bordes,

Clasificación y reconoci-

miento de Patrones

Imagen 2D patrones

11

• Reconocimiento de rostros

• Reconocimiento de celulas

• Reconocimiento de huellas

digitales

• Reconocimiento de placas

Reconocimiento de Patrones

12

Visión Computacional

• Reconstrucción de la imagen 3D desde imágenes 2D

Esquema intermedioEsquema Básico Escena en 3-DImagen Original

Construcción imágenes 3D

Generación de escenas

Descripción de la escenaImagen 2D

Datos

geométricos

en 3D

13

• Determinar la identidad y localización de objetos en una imagen.

• Construir una representación tridimensional de un objeto.

• Construir una descripción de la escena de trabajo.

• Establece la relación entre el mundo 3-D y las vistas 2-D tomadas de él, para:

1. Reconstruir un espacio 3-D a partir de vistas 2-D

2. Proyectar una escena 3-D en un plano 2-D.

Visión Computacional

14

Gráficos por Computadora

• Modelado Geométrico de objetos

Projecciones 3D en 2D

Sombreado,

Texturizado

Animación, Renderización

Datos

Geométricos

en 3DImagen 2D

15

Dificultades de la visión computacional

Es un mapeo de M:1 (3D ���� 2D)• Muchas superficies 3D con materiales, geometría e

iluminación distintas, nos llevan a imágenes 2D idénticas.

• El mapeo inverso (2D � 3D) no tiene una solución única, por que en el paso 3D � 2D se ha perdido información.

Computacionalmente cara.• El cerebro humano trabaja en paralelo, para procesar miles

de señales. Una PC tiene un solo μP.

Dificultad para identificar el patrón a reconocer.• No entendemos aún el problema de reconocimiento de

patrones.

16

Dificultades del Reconocimiento de Patrones

¿Cómo discernir entre realidad y una imagen de la realidad?¿Qué pistas o claves están presentes en la imagen?¿Qué conocimiento utilizamos para reconocer algo en la imagen?

17

Dificultades del Reconocimiento de Patrones

¿Qué es este objeto?

¿Juega el color un rol importante en el reconocimiento?

¿Sería más fácil reconocerlo desde una vista diferente?

18

Dificultades del Reconocimiento de Patrones

• ¿La textura característica de una imagen pueden ayudarnos a reconocer objetos rápidamente?

19

Dificultades del Reconocimiento de Patrones

• ¿La forma de una imagen pueden ayudarnos a reconocer

objetos rápidamente?

¿cuál es macho y cuál es hembra?

20

Imposibilidad física

21

Restricciones y Supuestos

• Restricciones para recobrar la escena– Recolectar más datos (imágenes)– Asumir cosas acerca del mundo

• Computabilidad y robustez– Es la solución computable usando recursos razonables?– Es la solución robusta?

• Sistemas para la industria.– Hacen fuertes suposiciones sobre las condiciones de iluminación– Hacen fuertes suposiciones sobre la posición de los objetos– Hacen fuertes suposiciones sobre el tipo de objetos

22

Aplicaciones de la Visión Artificial

23

Control de calidad en la industria

24

Biometría

25

Detección de rostros

26

Reconocimiento de Actividad Humana

27

Reconocimiento de objetivos

28

Interpretación de imágenes aéreas

29

Monitoreo de tráfico

30

Sistema de Visión Artificial

31

Sistema de Visión Artificial

32

Digitalización

Procesamientode la imagen

Segmento de interésObjetos Reconocidos

Retro-alimentación Imagen Capturada

33

Sistema de Visión Artificial

Referencias

• R. C. González, R. E. Woods; Digital image processing; Addison-

Wesley, 2007.

• N. Efford; Digital image processing: A practical introduction

using JAVA; Addison-Wesley, 2000.

• R. C. González, R. E. Woods, S. L. Eddins; Digital image

processing using MATLAB; Prentice Hall, 2004.

• J. R. Parker; Algorithms for image processing and computer

vision; Wiley, 1997.

34

35

Preguntas

Al término de la experiencia de aprendizaje el alumno debe ser

capaz de responder las siguientes preguntas:

1. ¿Qué es la IA?.

2. ¿Qué son los agentes?

3. ¿Qué es la VA?

4. ¿Qué es el PDI?

5. ¿Cuáles son las aplicaciones del PDI?

6. ¿Qué es el reconocimiento de patrones?

7. ¿Cuáles son las aplicaciones del RDP?

8. ¿Qué es la visión computacional (VC)?

9. ¿Qué son los gráficos por computadora?.

10. ¿Cuáles son las dificultades de la VC y del RDP?.

11. Hacer un listado de 10 aplicaciones del PDI.

12. ¿Qué es un sistema de VA y cuáles son sus elementos?

36

Sesión 1. Introducción a la VA y al PDI

Procesamiento de Imágenes

y Visión Artificial

Blog del curso:

http://utppdiyva.blogspot.com