upiita sistema de visión panorámica basado en la visión

INSTITUTO POLITÉCNICO NACIONAL

UNIDAD PROFESIONAL INTERDISCIPLINARIA EN INGENIERÍA Y TECNOLOGÍAS AVANZADAS

U P I I T A

"Sistema de Visión Panorámica basado en la visión del Gigantocypris"

Trabajo Terminal

Que para obtener el Título de

"Ingeniero en Biónica"

Asesor M. en C. Alvaro Anzueto Ríos

M é x i c o D .F. Junio d e 2007

CONTENIDO

Resumen ........................................................................................................................................... III

OBJETIVOS ..................................................................................................................................... IV

Objetivos Generales ..................................................................................................................... IV

Objetivos Particulares .................................................................................................................. IV

INTRODUCCIÓN .............................................................................................................................. 1

Antecedentes .................................................................................................................................. 2

Imágenes Panorámicas obtenidas por el hombre ....................................................................... 2

Justificación ................................................................................................................................... 4

Aplicaciones .............................................................................................................................. 5

MARCO TEÓRICO ........................................................................................................................... 7

Varios tipos de ojos ........................................................................................................................ 7

Visión Panorámica ......................................................................................................................... 8

Estructura del ojo de los mamíferos ............................................................................................. 10

Los artrópodos ............................................................................................................................. 12

Clasificación de los artrópodos ............................................................................................... 13

La visión de los Arthropoda .................................................................................................... 13

Sistema de visión del Gigantocypris ........................................................................................... 16

La cámara fotográfica .................................................................................................................. 17

Espejos ......................................................................................................................................... 20

Espejos Planos ......................................................................................................................... 22

El espejo parabólico ................................................................................................................ 23

El espejo hiperbólico ............................................................................................................... 26

DESARROLLO ............................................................................................................................... 31

Descripción del Trabajo ............................................................................................................... 31

Sistema cámara-espejo hiperbólico ......................................................................................... 33

Análisis de la superficie reflejante en el ojo del gigantocypris .................................................... 35

Cálculos Adicionales al Modelo del Sistema de Visión Panorámico .......................................... 39

Campo de Visión del Sistema ................................................................................................. 39

Resolución de ima cámara catadióptrica ................................................................................. 40

Diseño Mecánico ......................................................................................................................... 41

Sistema de soporte del espejo ................................................................................................. 41

Montaje del dispositivo ............................................................................................................ 44

Construcción y Armado del dispositivo ....................................................................................... 47

Materiales ..................................................................................................................................... 52

Análisis matemático ..................................................................................................................... 54

Desdoblamiento de la Imagen ...................................................................................................... 60

Algoritmo de desdoblamiento .................................................................................................. 61

Programa de desdoblamiento ................................................................................................... 62

Reconocedor de Círculos ............................................................................................................. 66

Operadores de Prewitt ............................................................................................................. 67

Procedimiento .......................................................................................................................... 68

Código del detector de círculos ............................................................................................... 70

Etapa final .................................................................................................................................... 72

Propuesta de Aplicación .............................................................................................................. 74

Filtrado de Bordes ................................................................................................................... 76

Definición de Regiones ........................................................................................................... 77

Costo del Prototipo ...................................................................................................................... 78

Problemas encontrados ................................................................................................................ 78

CONCLUSIONES ........................................................................................................................... 79

BIBLIOGRAFÍA ............................................................................................................................. 81

CIBERGRAFÍA ...................................................................................................................... 82

Sistema de Visión Panorámica basado en la visión del Gigantocypris

Palabras clave: artrópode, visión panorámica, omnidireccional o visión de 360°, crustáceo,

phylum (filo), espejos convexos, ojos compuestos, reflexión de rayos de luz, catóptrico,

frente de onda.

Abstract. This work is focused to artificial vision area. It consists in the design of an

omnidirectional vision system based on the eyes of arthropods and especially of the

gigantocypris, a deep sea crustacean. The system captures 360° images using a hyperbolic

mirror and a regular digital camera arranged in front of the mirror so it can take pictures

containing information of all directions. Resumen

Un sistema de visión panorámico es aquel que puede obtener imágenes que aportan

información de todas las direcciones alrededor del sistema. Esta habilidad esta presente en

la naturaleza en los ojos de los crustáceos y de los insectos, entre otros seres. El hombre ha

desarrollado diversos sistemas para lograr una visión panorámica. Muchas veces, el sistema

se compone de varias cámaras o de varios espejos dispuestos de forma tal que se logren

apreciar los 360°. Otros métodos propuestos consisten en una sola cámara, la cuál es girada

sobre un eje. Estos sistemas panorámicos obtienen muchas imágenes, las cuales requieren

un tratamiento posterior para obtener una imagen cilindrica. Estos sistemas necesitan

mucho tiempo de procesamiento, un espacio grande para montar el sistema, una calibración

muy fina (para una reconstrucción correcta) y también representan un gran costo (cuando se

utilizan varias cámaras), por lo que se ha seguido estudiando cómo obtener imágenes de

360° con sistemas más baratos, eficientes, compactos y fáciles de construir.

OBJETIVOS

Objetivos Generales • Diseñar y construir un sistema de visión artificial basado en la visión de los

crustáceos, en particular del gigantocypris, por medio del cual se pueda obtener

imágenes de 360° (panorámicas). Todo esto mediante el uso de superficies

reflejantes (en este caso, espejos convexos) y cámaras digitales.

• Diseñar e implementar un algoritmo con el cuál convertir las imágenes panorámicas

en imágenes cilindricas (rectangulares continuas) de tal forma que sean útiles para

hacer análisis de visión artificial (segmentación y reconocimiento de formas,

búsqueda de trayectorias, etc.) y para trabajos posteriores donde se requiera una

visión panorámica, como puede ser en el campo de imagenología médica y

aplicaciones en robòtica.

Objetivos Particulares

• Modelado del sistema de visión del gigantocypris. Un estudio matemático del

sistema de visión de este crustáceo, enriquecido con una investigación de los tipos

de visión panorámica presentes en la naturaleza. Obtención de un modelo

matemático que describa el sistema de visión del gigantocypris y un marco teórico

sobre este tipo de visión.

• Modelado de los espejos convexos. Estudio de las características y propiedades de

los espejos convexos en general. Posteriormente, análisis del espejo hiperbólico y el

espejo parabólico. Obtención de un modelo que describa la forma en que trabajan

estos espejos. Esto sirve para el diseño de un algoritmo de desdoblamiento.

• Modelo de la cámara. Estudio del sistema de captura que utilizan las cámaras en

general, así como del modelo matemático que describe la relación entre puntos del

espacio y píxeles en la imagen. Esto sirve para proponer una disposición de las

partes del sistema.

• Diseño general del dispositivo. Obtener una idea concreta de cada etapa del proceso.

Plantear los requerimientos del sistema de visión: ubicación de la cámara con

respecto al espejo, modo de obtención de las imágenes, forma de transmitirlas a la

computadora, un pre-procesamiento en caso necesario, etc.

• Diseño del dispositivo destinado al soporte. Se refiere al diseño mecánico del

sistema de soporte del dispositivo, éste requiere de una base para la cámara y un

brazo que sostenga al espejo.

• Diseño mecánico general del prototipo. Esto incluye el diseño completo del soporte

en un paquete de dibujo asistido por computadora (CAD) y la selección de los

materiales a utilizar en la construcción.

• Diseño Mecánico enfocado a un sistema en particular: adaptación a un móvil.

• Construcción del soporte físico. Construcción de las partes del soporte del espejo y

del soporte de la cámara.

• Armado del dispositivo.

• Diseño del algoritmo. Se refiere a la parte matemática del procesamiento llevado a

cabo.

• Creación del algoritmo de desdoblamiento.

• Creación del Programa. Basándose en el algoritmo diseñado, creación del programa

de desdoblamiento. Este programa trabaja con las imágenes circulares para obtener

proyecciones cilindricas.

• Implementación del programa. Procesamiento de imágenes reales obtenidas por el

prototipo.

• Desarrollo de un algoritmo reconocedor de círculos, auxiliar en la búsqueda del

centro del espejo.

• Etapa final. Acoplamiento de todas las etapas del trabajo.

INTRODUCCIÓN

La ingeniería biónica tiene como objetivo el estudio de los principios de funcionamiento de

los sistemas biológicos, para su aplicación en la solución de problemas en cualquier campo.

Una de las áreas de trabajo y de estudio de la biònica es la visión artificial, que tiene como

finalidad la reproducción artificial (incluyendo sistemas no informáticos) del sentido de la

vista.

Se estima que el 75% de la información que maneja un ser humano es visual. Se sabe que

existen seres vivos cuya existencia gira casi exclusivamente alrededor de la percepción

visual; sin embargo, también es cierto que un ser humano desprovisto del sentido de la vista

puede desarrollar totalmente su capacidad mental y llevar una vida en plenitud, aunque esto

último le obligue a una dependencia estrecha de otros semejantes. No parece necesario, por

tanto, afirmar cuan vital es la visión en los seres vivos. [1, pag. 219 párrafo 3]

Existen seres vivos cuya existencia depende casi exclusivamente de su percepción visual.

Básicamente, el objetivo de la visión artificial es automatizar funciones de inspección

visual, tradicionalmente realizadas por el hombre u otros seres vivos. Así, parece natural

pensar que el objetivo de dotar a las máquinas del sentido de la vista supone un salto

cualitativo en sus capacidades de actuación.

La visión artificial también se denomina visión computacional, es decir, basada en

computadoras, puesto que es impensable otorgar a una máquina cierto grado del sentido de

la vista sin que se utilice una computadora, tanto para la etapa inicial (puramente sensorial)

como para la fase avanzada que demanda mayor complejidad de procesamiento.

En este trabajo se estudian los sistemas de visión omnidireccional presentes en la

naturaleza. Los animales pertenecientes al grupo de los artrópodos están dotados de esta

habilidad.

Los animales que poseen una visión omnidireccional pueden ubicarse a sí mismos y vigilar

todo su entorno con facilidad. Ésta es una capacidad muy deseable en sistemas de control

automático, en sistemas móviles y en general dentro de la visión artificial.

El trabajo esta dividido de la siguiente forma: primero se presentan los antecedentes de la

visión omnidireccional, esto es, cómo ha evolucionado y los trabajos presentes hasta el

momento; una justificación del trabajo y un marco teórico del que se parte para trabajar; se

plantea el problema de ingeniería que presenta el diseño del sistema de visión

omnidireccional; después se explica el desarrollo del trabajo, los puntos que debieron

considerarse para el diseño, las características del prototipo, los esquemas del diseño del

mismo y los puntos críticos (problemas); por último, se exponen las conclusiones del

trabajo y se presentan las referencias empleadas.

Antecedentes

Imágenes Panorámicas obtenidas por el hombre

El hombre, a partir de la observación de los diferentes sistemas de visión panorámica ha

implementado sistemas capaces de obtener imágenes panorámicas [2, 3]. El propósito es

tener una imagen de todo lo que se encuentra alrededor, proyectada sobre un plano

cilindrico. De aquí se origina una imagen cilindrica, la cual es en realidad una imagen

rectangular, pero cuyos extremos (derecho e izquierdo) coinciden, haciéndola "continua".

Una manera de obtener imágenes omnidireccionales es tomar una serie de fotos con una

cámara convencional que se gira sobre un soporte. Esto provee un alto número de

imágenes, pero el problema es que para obtener la imagen cilindrica se necesita esperar a

que la cámara haya dado toda la vuelta. Este sistema consume demasiado tiempo, aún sin

contar con el tiempo de procesamiento posterior para obtener la imagen cilindrica.

Otro método propuesto es el de tener varias cámaras puestas en diferente ángulo, de tal

forma que juntas abarquen los 360° del entorno. Hay trabajos en los que se han usado 8

cámaras dispuestas sobre una base y a partir de ellas se construye la imagen. Y ya que se

toma la foto simultáneamente, no hay mucha pérdida de tiempo, porque las cámaras están

fijas. El problema de este sistema es el costo de las cámaras y al igual que en el caso

anterior, el tiempo de procesamiento requerido para reconstruir la imagen panorámica.

Por medio de éste tipo de visión se pueden construir sistemas de realidad virtual, cuyo uso

ha ido aumentando últimamente.

Los sistemas de visión artificial se han utilizado para la implementación de autolocalización

y detección de objetos relevantes en robots futbolistas. Estos robots han participado en la

robo-copa llamada "The World Cup of Soccer Robots". [4]

La detección de movimiento es de gran importancia en la visión artificial. Por medio de

algoritmos de detección de cambio de fondo y cámaras omnidireccionales, en República

Checa han tenido muy buenos resultados usando imágenes cilindricas para obtener el fondo

de toda la habitación de manera inmediata y poder obtener toda la información con una

resolución aceptable. [5]

Justificación

Las imágenes panorámicas y en general la visión omnidireccional son un paso muy grande

en el campo de la robótica ya que permiten una apreciación completa del medio en el que

se está. Cuando se construye un robot que utiliza visión artificial, muchas veces el

problema es que tiene que procesar mucha información en poco tiempo, sobre todo si el

robot se encuentra en movimiento, si se quisiera una toma de todo el entorno y la única

forma de tomarla fuera rotar la cámara, sin importar qué tan rápido se hiciera, habría que

detenerse completamente' para que todas las tomas tuvieran la misma referencia. En

cambio, con un sistema como el propuesto, no se tiene este problema pues solo se toma una

fotografía en la que se captura todo al mismo tiempo.

Es importante también hacer notar que los sistemas que trabajan con varias cámaras y los

que rotan la cámara tienen el problema de requerir un procesamiento muy tardado para

acoplar todas las imágenes obtenidas (en el caso de rotación de la cámara la información

puede tomarse con tomas espaciadas o por medio de video, lo cual implica una gran

cantidad de cuadros). Es evidente que el procesamiento que pueda requerir una sola imagen

es mucho menor (en cuestión de tiempo) al del procesamiento de varias imágenes.

En el caso de los aparatos de laparoscopia se tienen varios problemas: el primero es que

obviamente no es posible darse el lujo de hacer del examen un proceso lento y complicado;

el espacio del que se dispone es muy pequeño como para poder introducir varias cámaras o

motores para manipular la(s) cámara(s); es importante tener una visión de las paredes de la

cavidad en donde se está realizando el examen, lo cual no puede lograrse con una cámara

convencional. Un sistema de visión panorámica en este tipo de estudios dará una mayor

eficiencia en el trabajo.

Aparte del ahorro de tiempo se debe hacer notar que también existe una ventaja económica

frente a los sistemas que utilizan varias cámaras. También debe tenerse en cuenta lo

sencillo del diseño propuesto en comparación con los otros sistemas que requieren del

montaje de varios dispositivos y muchas mediciones como son la distancia entre las

cámaras y la orientación en que se encuentra cada una.

La disposición física del sistema propuesto, a grandes rasgos, solo requiere del montaje de

un espejo y una cámara, alineados. Esto da la comodidad de tener un fácil mantenimiento y

un fácil armado.

Aplicaciones

En la naturaleza un sistema de visión panorámica es usado por algunos animales para poder

detectar amenazas a su alrededor. De igual manera este sistema puede ser instrumentado

para monitorear rápidamente el entorno en busca de peligros. Si se diseña un robot que

deba desempeñar su tarea en una zona de riesgo, este sistema es propicio para proveer al

robot de una alarma, o bien, como un sistema de alerta que puede ser acoplado a los

automóviles para evitar choques.

Con este sensor se puede hacer un sistema de visión para reconocimiento o seguimiento de

líneas. Esto puede servir más adelante para un seguidor de objetos o sistemas de visión

artificial más elaborados.

Al ser sensible a todo el espacio alrededor de él, este sistema puede hacer más eficiente a

un robot que deba encontrar la salida a un laberinto, esto es porque en una sola toma capta

la posición de los objetos en todas direcciones, esto permite que esté en movimiento al

momento de hacer el sensado del lugar en que se encuentra.

Sería también útil su implementación en robots encargados del transporte de mercancía en

grandes bodegas, ya sea para buscar algún producto o para llevarlo a un lugar para ser

almacenado. A un robot de este estilo se le puede dar un código para buscar una ubicación

específica o un paquete específico.

Puede utilizarse también para la recreación remota de un lugar, que puede usarse para

exploración. En el caso de robots exploradores, como los que se han mandado a la luna o a

Marte. En ellos, la implementación de un sistema de visión de 360° daría un gran campo de

visión, que podría aumentar la rentabilidad y utilidad de los exploradores e incluso de los

propios proyectos de exploración.

El uso de este tipo de visión se está popularizando en muchos lugares para hacer robots que

juegan foot-ball, ya que así pueden ubicar la pelota en cualquier parte de la cancha y a los

demás jugadores.

La construcción de este sensor en un tamaño reducido (del orden de cm.) daría la

oportunidad de implementarle en aparatos de laparoscopia.

MARCO TEORICO

Varios tipos de ojos

E n la naturaleza existen diversos tipos de ojos. A continuación se presentan algunos

aspectos de los principales:

Rana. Sus ojos son muy parecidos en su estructura básica a los de los mamíferos, pero el

método de acomodación es diferente. La rana enfoca los objetos cercanos mediante

movimientos del cristalino hacia delante, con lo que aumenta la distancia entre el cristalino

y la retina.

Mamíferos. El ojo de los mamíferos cambia de forma al enfocar. La cantidad de luz que

entra al ojo está controlada por los músculos lisos del iris dispuestos circular y radialmente

que contraen o dilatan la pupila. Este proceso es análogo al diafragma de una cámara

fotográfica o de un microscopio.

Artrópodos. Utilizan ojos compuestos, conformados por celdas alargadas llamadas

"omatidios", que funcionan como ojos completos, solo que están dirigidos hacía una

dirección específica. Aquí está incluida la visión de los camarones, los cangrejos, las

cucarachas, las moscas, abejas, etc.

En el caso de los artrópodos, el hecho de tener "muchos ojos", cada uno de los cuáles está

orientado en una dirección diferente, les permite poseer una visión panorámica. [6, 7]

Visión Panorámica

El hombre siempre ha tenido curiosidad por la naturaleza, y el hecho de que ciertos

animales posean una visión panorámica es particularmente intrigante. A lo largo de los

años, se han identificado 3 tipos de ojos compuestos que permiten esta habilidad especial.

Existen en los insectos diurnos y nocturnos y en algunas especies de crustáceos como las

langostas, camarones y cangrejos. Estos tipos de visión se basan en la forma y composición

de sus ojos. Pueden estar compuestos por celdas que captan la luz de una dirección

particular, valiéndose de cambios en las propiedades ópticas de las celdas. Otra forma de

visión que se ha encontrado, hace uso de superficies reflejantes.

Los ojos de los insectos diurnos están compuestos regularmente por un patrón de celdas

foto-receptivas que permiten la visión panorámica. De hecho, cada ojo de estos insectos

comprende una colección de pares de elementos lenticulares y sensores ópticos

elementales, cada uno de los cuales cubre una dirección específica.

En los insectos nocturnos, los elementos lenticulares se encuentran dispuestos en un

eficiente patrón hexagonal. El índice de refracción en cada lente varía radialmente de forma

tal que los rayos incidentes convergen en un punto focal sobre la retina. Esto provoca la

mejora de la vista nocturna.

Cada ojo en un crustáceo comprende un juego de superficies cuadradas parecidas a espejos

como parte de sus elementos lenticulares. Esto le permite a los rayos ser reflejados y

converger hacia puntos diferentes y únicos sobre la retina.

Un caso muy interesante es el del gigantocypris, un crustáceo de las profundidades marinas,

que tiene grandes ojos con reflectores, similares a la óptica de los telescopios. Estas

características le permiten ver bajo las oscuras condiciones de las profundidades, del orden

de cientos de metros. Aunque esta criatura roja-anaranjada tiene un largo de apenas media

pulgada, su cabeza ocupa la mitad de su cuerpo. Sus dos ojos están cubiertos por párpados

transparentes.

Todo esto permite aprender cómo es que los diferentes animales redirigen la luz al punto

donde mejor convenga para tener el campo de visión que cada uno requiere.

A partir de todas estas observaciones se ha creado el concepto de "visión panorámica", que

es el tener la capacidad de observar al mismo tiempo todo lo que está alrededor del sistema,

sin necesidad de girar la cabeza sobre su eje. Ya que ésta "toma" puede hacerse al rotar la

cabeza (o la cámara) en una revolución, o sea, 360°, a este tipo de visión se le llama visión

de 360 grados. Una visión más avanzada que se ha empezado a trabajar en muy pocos

lugares es la de obtención de imágenes esféricas, que se denomina como visión de 360° x

360°.

Estructura del ojo de los mamíferos

Cada globo ocular es un órgano de forma oval construido según los principios de una

simple cámara fotográfica (figura 7). En efecto, posee una pequeña abertura en la parte

anterior, la pupila, por la cual entra la luz; un cristalino, que enfoca las imágenes de los

objetos y una retina sensible a la luz, análoga a la película.

La pared del globo ocular, se compone de tres capas de tejido, la más extema se haya

formada por tejido conectivo fibroso denso que presta resistencia a la pared. Casi toda esta

capa es opaca y recibe el nombre de esclerótica, pero su porción anterior, por la cual pasa

la luz, es clara y se llama córnea. La superficie de la córnea está cubierta de una capa de

epitelio estratificado, la conjuntiva, que se continúa con la epidermis.

La siguiente capa de la pared del globo ocular pigmentada de oscuro y muy vascularizada

es denominada coroides. Su pigmentación absorbe los rayos luminosos, con lo que

disminuye los reflejos internos que podrían hacer borrosa la imagen, y sus vasos nutren la

retina. Delante del cristalino se extiende la porción anterior de la coroides, junto con una

porción no sensible de la retina y forman el iris, disco opaco con la pupila en su centro. El

iris impide que la luz penetre en el ojo salvo por el centro del cristalino o parte más eficaz

1

desde el punto de vista óptico. La cantidad de luz que entra al ojo está controlada por los

músculos lisos del iris dispuestos circular y radialmente que contraen o dilatan la pupila.

En este sentido, el iris es análogo al diafragma de una cámara fotográfica o de un

microscopio. La porción engrosada de la coroides en tomo a la base del iris es el cuerpo

ciliar. Cierto número de fibras de la zónula se extienden de dicho cuerpo al cristalino y

ayudan a sostenerlo en su lugar. Los músculos del cuerpo ciliar intervienen en la función

de enfoque del ojo.

La retina es la estructura más interna del globo ocular; consta de una capa pigmentaria,

íntimamente asociada con la coroides y de una capa nerviosa, que contiene millones de

células receptoras, los bastones y conos, y las neuronas que inician la elaboración de

señales luminosas y que transmiten la información al cerebro por medio del nervio óptico.

Los bastoncitos y los conos se encuentran en la superficie de la capa nerviosa que mira a la

coroides, y la luz debe atravesar casi toda la retina antes de poder estimularlos.

Las cavidades intraoculares están repletas de líquido. En efecto, un humor vitreo

gelatinoso ocupa la gran cámara situada entre el cristalino y la retina y ayuda a sostener el

primero de estos órganos en su lugar. Un humor acuoso llena la cámara posterior entre

el iris y el cristalino y la cámara anterior entre el iris y la córnea. Éste humor lleva a cabo

dos funciones. En primer lugar contribuye a nutrir la comea y el cristalino que carecen de

vasos sanguíneos y en segundo, al mantener la presión intraocular contribuye a conservar la

turgencia y forma del globo ocular. [9]

El campo visual humano. El campo visual, la zona del espacio que puede ser percibida

para una posición fijada del ojo, es muy amplio. Los límites son del orden de 60 grados

para el meridiano superior, 75 grados para el inferior, 60 grados para el nasal y 100 grados

para el temporal. [10]

Los artrópodos

Los artrópodos son animales segmentados cuya epidermis secreta un exoesqueleto de

fuertes anillos que se corresponden con los segmentos; estos anillos están unidos por

membranas flexibles que actúan como articulaciones. En muchos de los segmentos se

advierten apéndices laterales pareados, cada uno de los cuales posee un esqueleto quitinoso

similar de anillos articulados. El phylum (o filo) toma su nombre precisamente de estos

apéndices articulados (del griego arthron articulación y podos pie). El exoesqueleto es en

esencia un complejo químico que incluye quitina. El сuerpo está constituido por cabeza,

tórax y abdomen, cada uno está compuesto por varios segmentos que pueden fusionarse de

diferentes modos. La musculatura corporal se halla formada de gran número de pequeños

músculos que se extienden por las articulaciones para formar un mecanismo complicado

capaz de movimientos precisos y complejos. Su adaptación es tan precisa que con

frecuencia su distribución ecológica queda estrictamente limitada, lo que puede explicar el

enorme número de especies de artrópodos, pues muchas especies pueden coexistir en la

misma región geográfica si cada una posee diferentes requerimientos ecológicos. En la

actualidad, el número de especies conocidas de los demás filos suma 130 000, mientras que

los artrópodos suman unas 870 000. La mayor parte (800 000) son insectos, casi todos

terrestres. [9]

Clasificación de los artrópodos

Pueden dividirse en cuatro subfilos según la estructura de los apéndices de los seis primeros

segmentos. En todos los artrópodos el primer segmento aparece en el embrión pero nunca

se halla netamente definido en el adulto y jamás tiene apéndices. En la mayor parte de los

artrópodos, la boca se halla situada ventralmente entre el tercero y cuarto segmentos.

Los cuatro subfilos son: Trilobita, Chelicerata, Crustácea y Labiata. Los trilobita, única

clase de los trilobita (trilobites), han desaparecido. Dentro de los chelicerata (quelicerados)

se encuentran grupos vivientes y extintos como los límulos, euriptéridos, escorpiones o

alacranes, arañas y ácaros.

El subfilo crustácea (crustáceos) incluye como única clase la denominada crustácea,

formada por artrópodos dominantemente acuáticos que actualmente viven. El segundo y

tercer segmentos de estos animales posee cada uno un par de antenas. Los crustáceos han

invadido una gran variedad de hábitats acuáticos; algunos reptan sobre el fondo mientras

otros nadan o son arrastrados por la corriente. Muchas especies destacan por su abundancia.

Los crustáceos como grupo probablemente integren una masa más grande de material vivo

que la de cualquier otra clase de animales considerada aisladamente.

El cuarto subfilo, labiata (labiados), incluye milípedos, centípedos, e insectos. El segundo

segmento posee antenas, el tercero carece de apéndices y, sobre el sexto destacan apéndices

que se fusionan para formar un labio inferior, el labium.

Los crustáceos pueden encontrarse tanto en el océano, en aguas dulces y también existen

hoy crustáceos terrestres. [9, 11]

La visión de los Arthropoda

En cuanto al aparato visual, es muy diferente a través del phylum. Su origen es muy difícil

de aclarar. En general se puede decir que los ojos son de dos tipos, los ojos sencillos u

ocelos y los ojos compuestos. Los primero se encuentran en la mayor parte de los

crustáceos inferiores, en la larva nauplio de todos los crustáceos y en cuyo caso se le llama

ojo nauplio, además en una gran parte de los insectos adultos y sus larvas.

Los ojos compuestos (ver figura 8) están formados por unidades llamadas omatidias

(ommatidia) que son numerosas (En el cangrejo de río, hay 2500 omatidias por ojo).

Externamente cada omatidia está formada por una córnea o lente biconvexa, enseguida y

debajo, se encuentran dos células epidérmicas que secretan la lente y que están colocadas

una a cada lado del cono del cristalino, el cual está constituido por cuatro células arregladas

como una pirámide invertida; el ápice del cristalino descansa en las células sensoriales o

fotorreceptores, cuyo conjunto constituye la retina. En cada omatidia existen siete a ocho de

estas células fotorreceptoras colocadas en círculo, y sus superficies internas están

codificadas para la sensación visual, éstas forman el rabdoma (rhabdom). Cada omatidia

está separada de las otras por células pigmentarias que la rodean y que son de dos a ocho

distales por seis a diez proximales; estas células descansan sobre la membrana basal. A

cada una de las células sensoriales o fotorreceptoras, llega una fibra nerviosa que va a

formar parte del nervio óptico junto con las de las otras omatidias.

De acuerdo con la vision, se distinguen dos tipos de ojos compuestos, el primero, o de

visión por aposición (figura 9, A), en que cada omatidia está rodeada por un pigmento

continuo, de manera que un rayo luminoso no puede propagarse más que a través de una

sola omatidia; así que se formarán tantas imágenes como omatidias haya en el ojo, siendo

además muy poco luminosas también a causa de la cantidad de pigmento. Este tipo de ojos

se encuentra en los insectos diurnos, como odonatos, himenópteros y dípteros.

El Otro tipo, O de visión por superposición (figura 9, B) tiene como característica principal

la de presentar el pigmento localizado en las pociones distai o proximal de la omatidia y por

consiguiente los rayos luminosos pueden atravesar muchas omatidias, superponiéndose las

imágenes; además, éstas son, al contrario de las del primer tipo, muy luminosas. A tal tipo

pertenecen los ojos de artrópodos nocturnos, como lepidópteros y muchos crustáceos, en

los que los pigmentos emigran en relación con la luminosidad del medio ambiente. En un

lugar con luz intensa, el pigmento rodea toda la omatidia y el ojo se comporta como de

visión por aposición; en la penumbra los pigmentos emigran a la parte distai y proximal de

la omatidia y el ojo funciona como de visión por superposición. Aparte de los ocelos y ojos

compuestos que son típicos de los crustáceos e insectos y en otros grupos de artrópodos

como los Scutigera (Chilopoda), es posible considerar tres tipos más, comunes a los

arácnidos y a los paleostráceos, ellos son: ojos compuestos degenerados, más simples que

los de los insectos y crustáceos, son propios de los euriptéridos y xifosuros; según algunos

autores, también a este tipo corresponden los ojos laterales de alacranes; los ojos inversos,

comunes en los arácnidos, que por cierto no son homólogos a ningún otro ojo de los

artrópodos, y se forman por la presencia de tres capas de células originadas por una

invaginación lateral de los tegumentos; los ojos medianos dorsales, son característicos de

los xifosuros y parecen ser homólogos al ojo nauplio de los crustáceos. [9,12]

Sistema de visión del Gigantocypris

El gigantocypris (figuras 1 0 y l l ) e s u n crustáceo de las profimdidades del mar que tiene

grandes ojos con reflectores que son similares a la óptica de los telescopios. Estas

características le permiten ver bajo condiciones muy obscuras en profundidades del orden

de miles de pies (cientos de metros). Es un animal rojo-anaranjado de alrededor de media

pulgada de largo y su cabeza ocupa la mitad de su cuerpo. Sus dos ojos están cubiertos por

una túnica transparente. La óptica es de un ojo con reflexión: el fondo del ojo esta formado

por un espejo. A este tipo de visión se le llama sistema catóptrico, por que se vale del uso

de espejos. Un corte transversal horizontal del ojo del gigantocypris muestra que la forma

de los espejos en el fondo del ojo es parabólica con un punto focal situado a una pequeña

distancia del vértice del espejo. El espejo enfoca la luz reflejada sobre la retina y aunque la

imagen formada en la retina no es fina, es aproximadamente 17 veces más luminosa que la

formada en un ojo con elementos lenticulares. [8]

La cámara fotográfica

En el siguiente esquema, se presenta, la formación de una imagen en una cámara digital y la

relación de un punto en el espacio con los correspondientes píxeles en la imagen formada.

El sistema consiste de un plano imagen, que es donde se proyecta la imagen (o sea que

representa el sensor de la cámara, o la retina); el punto focal o centro de la cámara C que se

encuentra a una distancia "'f ' del plano imagen (distancia focal); el eje óptico, que es la

línea que pasa por el centro de la cámara y es pependicular al plano imagen; por último, el

punto principal "c", es la intersección del eje óptico con el plano imagen.

Es importante tomar en cuenta que la transformación necesaria para ir de xm punto en el

espacio a píxeles implica utilizar diversos sistemas coordenados Los sistemas coordenados existentes en este sistema son los siguientes:

1) El sistema coordenado de la cámara, con origen en el punto focal С y el eje z

colinear con el eje óptico. El sistema coordenado de la cámara tiene tres ejes y sus

unidades están dadas en milímetros.

Hay que tomar en cuenta que para comenzar se podría tomar el sistema coordenado

universal, que dice dónde se encuentra la cámara y su centro en el espacio, pero esto

se ignorará suponiendo se sabe en dónde se encuentra la cámara. También se puede

pensar que estos dos sistemas coordenados coinciden.

2) El sistema coordenado de la imagen, tiene solo 2 ejes { u y v } y origen en el punto

principal. Sus unidades están dadas en milímetros.

3) El sistema coordenado de píxeles, con 2 ejes {qu y qv} y origen en la esquina

superior izquierda del plano de imagen. Sus unidades están dadas en número de

píxeles.

Es muy importante considerar la diferencia de unidades entre los diferentes sistemas

coordenados.

Un punto P como el mostrado tiene coordenadas {x, y, z}, el punto correspondiente a P en

el sistema coordenado de pixeles tiene coordenadas {qu, qv}. Cada punto en el espacio se

proyecta sobre un punto en el sensor de la cámara, cada uno de estos puntos tiene

coordenadas en el sistema coordenado de la cámara y su correspondiente en píxeles. Cabe

mencionar que todos los puntos proyectados tendrán la misma componente z en el sistema

coordenado de la cámara y que al quitar esta coordenada, se puede cambiar directamente

entre el sistema coordenado de la cámara y el de la imagen. Este cambio no es válido

siempre, porque cualquier punto que en el sistema coordenado de la cámara tenga una

componente z diferente a "f no pertenece siquiera al plano de la imagen y no tiene

coordenadas en el sistema coordenado de la imagen.

Un punto cualquiera "U" en el sistema coordenado de la imagen tiene coordenadas (u, v).

La forma de pasar entre el sistema coordenado de la cámara y el sistema coordenado de la

imagen es la siguiente:

Aquí puede a hacerse un análisis de unidades y corroborar que las unidades de "U"

efectivamente son mm.

Para pasar de coordenadas en el sistema de la imagen a coordenadas en el sistema de

pixeles se debe hacer uso de un factor de traslación y de una constante de proporcionalidad

"k" como factor de acoplamiento de unidades, ya que éstas no son iguales para cada

sistema. El "factor de traslación" se refiere a las coordenadas del punto principal "c". Estas

coordenadas pueden estar tanto en mm. como en píxeles, pero en el caso de los mm. habría

que trasladar primero y luego ajustar las unidades; en caso contrario primero se ajustan

unidades y luego se traslada. Esto se entenderá mejor con las siguientes expresiones: Las coordenadas de un punto cualquiera en el sistema coordenado de pixeles son:

Es importante hacer notar que, en principio, los vectores qu y qv, no tienen porque ser

ortogonales, pero en éste análisis se considera, no sólo porque es más sencillo sino por que

las imágenes en una computadora tienen ejes ortogonales. Asimismo, el factor de

acoplamiento k, en principio, tampoco tiene por qué ser el mismo para cada eje. En caso de

presentarse una deformación de la imagen debe procederse a analizar estos dos puntos para

evitar cualquier posible error. [13]

Espejos

Un espejo puede ser simplemente un a pieza de vidrio negro o una superficie metálica

finamente pulida. En el pasado, los espejos se hacían generalmente recubriendo el vidrio

con plata. Hoy en día, los recubrimientos de aluminio al vacío sobre sustratos altamente

pulidos han quedado como el estándar para los espejos de calidad. A menudo se colocan

también capas protectoras de monóxido de silicio o fluoruro de magnesio sobre el aluminio.

En aplicaciones especiales (por ejemplo, en lasers).

La ley de la reflexión dice que "El ángulo de incidencia es igual al ángulo de reflexión"

y que "el rayo incidente, la perpendicular a la superfìcie y el rayo reflejado se

encuentran todos en un mismo plano que se denomina: plano de incidencia" (Hecht

pags. 99 y 100 [14]). La primer parte la esta ley se muestra en la figura 13 y su expresión

es:

Todos los espejos cumplen con esta ley en cada punto de su superficie y sus propiedades

cambian dependiendo de su forma.

Existen los siguientes tipos de espejos: planos, parabólicos, hiperbólicos y esféricos, entre

otros. Cada uno tiene propiedades específicas y ventajas dependiendo de la aplicación que

se busque.

Espejos Planos

Se encuentra el lugar donde se forman las imágenes en un espejo plano al analizar la figura

14. Se utiliza una fuente puntual ubicada en el punto S, que está a una distancia S0 para

examinar el recorrido de los rayos de luz y el lugar donde convergen. La imagen se forma

en el punto P, que se encuentra a una distancia Sj.

22

Espejos Convexos

Un espejo convexo es aquel que refleja en el lado convexo. Los espejos convexos tienen la

ventaja de dar un campo de visión muy amplio que permite la visión panorámica, esto es

que con solo una toma, se obtiene una imagen de 360°. Esta imagen obviamente se

consigue deformada, pero con el tratamiento adecuado se obtienen imágenes cilindricas

planas a partir de ella.

El espejo parabólico

Un espejo parabólico es aquel cuya superficie está regida por la ecuación de la parábola. La

ecuación que rige la forma del espejo obviamente está en tres dimensiones, a continuación

se da su definición general para dos dimensiones. Una vez que se tiene la ecuación plana de

la parábola es fácil expandir el concepto a tres dimensiones.

Una parábola es el lugar geométrico de un punto que se mueve en un plano de tal manera

que su distancia de una recta fija, situada en el plano, es siempre igual a su distancia de un

punto fijo del plano y que no pertenece a la recta. El punto fijo se llama foco y la recta fija

directriz de la parábola.

La recta que pasa por el foco (F) y es perpendicular al plano se llama eje de la parábola. Sea

A el punto de intersección del eje y la directriz. El punto V, punto medio del segmento AF,

está, por definición, sobre la parábola; este punto se llama vértice.

Propiedades de los espejos parabólicos

Sus propiedades son ideales desde algunos puntos de vista para los sistemas de visión

artificial y se cumplen tanto para espejos cóncavos como para espejos convexos (la

diferencia radica en la formación de imágenes reales o virtuales, respectivamente). Para un

espejo cóncavo todos los rayos que llegan paralelos al eje principal de la parábola son

reflejados pasando por el foco de ésta, es decir, convergen en el fòco. Asimismo, todo

rayo que llega a la superficie del espejo pasando por el foco, se reflejará paralelo al

eje. Análogamente, para un espejo convexo, los rayos que llegan paralelos al eje, divergen

del foco, formando una imagen virtual y los rayos que llegan en dirección al foco son

reflejados paralelos al eje. A continuación se muestra como llegar a la conclusión anterior.

Se trata de determinar la configuración que un espejo debe tener a fin de que una onda

plana (o sea, que todos los rayos de luz son paralelos) incidente se reforme bajo reflexión

en una onda esférica convergente (en la que todos los rayos de luz convergen a un punto).

Según Hecht [14], "Un frente de onda se transforma en otro, con tal que los caminos por los

que se propaga la energía sean todos «iguales», manteniendo de esta forma la fase del

frente de onda". Esto quiere decir que todos los rayos de luz que provienen de una fuente

recorren la misma distancia para formar la imagen, ya sea que terminen siendo paralelos,

diverjan o converjan.

Asumiendo esto último, si la onda plana debe converger, al final, a un punto F, las

distancias recorridas para todos los rayos deben ser iguales. Por lo tanto, para puntos

arbitrarios A1 y A2 (ver figura 16) la distancia recorrida es

Figura 16. Trayectorias recorridas por los rayos de luz en una superficie parabólica.

Ya que el plano Z es paralelo a los frentes de onda incidentes

W^A^ = W^A2 +A^D^ .(14)

Por lo consiguiente, la ecuación (13) queda satisfecha por una superficie para la cual

A^F = A^D^ y A^F = A^D-^ o, más generalmente, una donde AF = AD para cualquier

punto A en el espejo. Esta superficie es un paraboloide con foco y directriz F y S,

respectivamente. [14]

El espejo hiperbólico

El espejo hiperbólico es un espejo (en este caso, convexo) cuya forma es la de media

hipérbola. Una hipérbola es, por definición, el lugar geométrico de un punto que se mueve

en un plano de tal manera que el valor absoluto de la diferencia de sus distancias a dos

puntos fijos del plano, llamados focos, es siempre igual a una cantidad constante, positiva y

menor que la distancia entre los focos.

En la figura 17 se muestra una hipérbola plana con centro en el origen y cuyo eje focal

coincide con el eje "y". Entonces, los focos, F1 y F2 están sobre el eje "y", en (O, e) y (e, 0),

respectivamente, siendo "e" una constante positiva. Sea P(x, y) un punto cualquiera de la

hipérbola. Entonces, por la definición de la hipérbola, el punto P debe satisfacer la

condición geométrica siguiente, que expresa que el valor absoluto de la diferencia de las

distancias del punto a los focos es una cantidad constante.

Propiedades de la Hipérbola. Es sabido que las propiedades de reflexión son diferentes

para cada espejo, dependiendo de la forma que éste tenga. En el caso de un espejo

hiperbólico, se sabe que cualquier rayo que incide sobre su superfìcie en dirección al

punto focal "e" se reflejará directamente sobre el otro foco (ubicado en -e). Esta

propiedad aunada al proceso de formación de una imagen en una cámara será muy útil para

el desarrollo como podrá verse más adelante. Para llegar a esta conclusión se usa un

razonamiento como el utilizado en el espejo parabólico.

En este caso se trata de determinar la configuración que un espejo debe tener a fin de que

una onda esférica divergente (o sea, que todos los rayos de luz se originan en un punto) se

reforme bajo reflexión en otra onda esférica divergente, pero en un punto diferente. Cabe

mencionar que en este caso se analiza la formación de una imagen "virtual" y la superficie

es convexa (figura 18 a). El análisis para una superficie cóncava se desarrolla de una

manera similar y en tal caso arabas ondas son esféricas convergentes, como se ve en la

figura 18 b).

Como se ha dicho, las distancias recorridas por todos los rayos deben ser iguales. Todos los

rayos parten de F y terminan en F' pasando por un punto en la superficie del espejo. Por lo

El segundo término en cada expresión tiene un signo negativo ya que la trayectoria

recorrida desde un punto cualquiera A en la superficie del espejo hacia el punto F' tiene un

sentido contrario a la dirección de los rayos de luz reales. Este signo también muestra que

la imagen formada es virtual.

Si la distancia es igual para cualquier punto sobre el espejo, entonces se puede generalizar

de la siguiente forma

donde c es una constante arbitraria mayor que cero. Ésta última es la expresión geométricade la hipérbola. [14]

DESARROLLO

Descripción del Trabajo

Diseño de un sistema de visión artificial basado en los principios de ñincionamiento de la

visión del gigantocypris.

Este trabajo esta basado en el sistema de visión de los artrópodos, que han desarrollado la

capacidad de visión panorámica, el phylum arthropoda es muy extenso y esta formado por

los crustáceos, arácnidos, insectos, etc. Como modelo principal para el trabajo se ha

seleccionado al gigantocypris (miembro de la clase crustácea) ya que su sistema de visión

se basa en el uso de espejos, los cuales están presentes en el fondo de sus ojos, también se

escogió este crustáceo debido a la disposición de su retina con respecto al sistema entero

(su retina esta orientada hacia atrás), en general, su sistema de visión y el sistema propuesto

en el trabajo tienen muchos puntos en común.

La idea del trabajo es copiar la capacidad de los animales mencionados de dirigir las

imágenes a la retina de la forma que más les convenga. En el caso del gigantocypris se

aprecia que la retina está invertida, o sea que las células sensibles se encuentran de cara al

fondo del ojo. Cuando se utilizan cámaras fotográficas digitales, el sensor (normalmente

compuesto por foto diodos o fototransistores) hace las veces de la retina del ser vivo y se

encuentra de cara a la escena. En el caso de una cámara omnidireccional como la propuesta

la "retina esta de cara al espejo", como en el ojo del gigantocypris.

También se observa que la forma de su ojo sigue una curvatura parabólica, lo que le ayuda

a reflejar los rayos de luz de una manera sencilla de modelar. Para el prototipo diseñado se

optó por utilizar un espejo hiperbólico en vez de uno parabólico, ya que éste último no tiene

un punto único de reflexión y uno hiperbólico sí.

A partir de las observaciones hechas, se busca construir un sistema, con un bloque que

refleje los rayos de la zona de interés hacia el sensor, o sea, hacia la cámara. El sistema

constituye un análogo de la visión del gigantocypris en el cual la cámara hace las veces de

la retina y el espejo hiperbólico hace las veces del espejo parabólico en el fondo de ojo del

gigantocypris, siendo esta última analogía solamente funcional, es decir, se imitan las

propiedades de reflexión para redirigir la luz hacia la zona de recepción.

El sistema propuesto consiste en el arreglo de una cámara y un espejo puestos de frente. El

espejo proporciona la ventaja de captar los rayos de todo el entorno (360°). Los rayos son

reflejados de tal manera que se proyectan hacia abajo. Frente al espejo se coloca una

cámara encargada de captar la imagen, que contiene una escena de todo el entorno. La

imagen recibida por la cámara está distorsionada y se necesita un tratamiento para obtener

una imagen cilindrica y posteriormente trabajar con ella. El procesamiento de la imagen

necesita un reordenamiento espacial. Esto quiere decir que en la primer etapa sólo hay un

cambio de posición de los píxeles. El resultado esperado al procesar la imagen es

convertirla de una imagen circular (con proporciones distorsionadas) a una cilindrica.

Sistema cámara-espejo hiperbólico

Figura 20. Diagrama que muestra la disposición fisica de los elementos del sistema.

La cámara, con centro C, se encuentra abajo, y se hace coincidir al punto C con F' (el foco

inferior de la hipérbola). El espejo se encuentra alineado directamente sobre el centro de la

cámara, de esta forma, al tomar una fotografía, en realidad se captura todo el rededor del

sistema.

El espejo con el que se trabaja es de tipo hiperbólico, con un diámetro de 60 mm. La

desventaja que se tiene es que los mejores espejos que se pueden conseguir para estos

propósitos son importados, lo cual eleva su costo.

Al obtener información con este sistema, se podría tener una pérdida de resolución, pero la

gran ventaja que da es que en una sola toma se obtiene información de lo que hay delante,

detrás, a la izquierda y a la derecha del sistema.

Análisis de la superficie reflejante en el ojo de

gigantocypris

El ojo del gigantocypris contiene un espejo parabólico. Tomando en cuenta que la luz

puede venir desde cualquier punto del entorno (debido a que sus ojos permiten el paso de la

luz), todos los rayos que vengan de afuera y que pasen por el foco de la parábola se

reflejarán hacia delante sobre su retina. El hecho de que los rayos proyectados sobre la

retina sean paralelos evita que la retina tenga que estar a una distancia única del espejo. El

hecho de que la retina se encuentre más lejos del fondo de ojo se vería reflejada solamente

en una mínima pérdida de potencia de la luz reflejada, debida al trayecto más largo

recorrido. Considerando el tamaño del crustáceo y del ojo, la pérdida sería despreciable.

Este sistema es particularmente interesante para el estudio de sistemas de visión

omnidireccionales porque el punto donde convergen todos los rayos de luz reflejados se

encuentra ubicado en el infinito.

Para encontrar el lugar donde se reflejará un punto del espacio sobre la retina (o un sensor,

en el caso de una cámara) se considera:

• Que el sistema es plano, aprovechando la simetría del problema. Por lo tanto se

trabaja en coordenadas {x, y} en vez de trabajar en tres dimensiones, lo cual es

más complicado.

• Que el origen del sistema de coordenadas se encuentra en el origen de la

parábola.

• El foco de la parábola se encuentra en las coordenadas {0, p/2}.

El discriminante tiene dos partes y la selección del signo es sencilla: si x¡ es positiva, x es

negativa y viceversa.

Esto es debido a que el rayo cruza la "función" de la parábola 2 veces, como lo hace en la

imagen, pero no lo hace físicamente. Ya que en la figura 22 se grafica toda la parábola,

pero en realidad el espejo no tiene una altura tan grande. Por esto, los rayos que vengan de

la derecha se reflejan a la izquierda del eje y los que vienen de la izquierda harán lo

contrario.

Sin embargo, aunque podría pensarse que el espejo parabólico es la mejor opción para la

implementación del sistema panorámico, tiene algunas desventajas, como el alto costo de

maquinado del espejo y le necesidad de usar lentes diferentes a las convencionales en la

cámara. Esto último también aumenta el tamaño del dispositivo, ya que dichas cámaras son

más grandes. [6]

Aún así, la base del sistema es lo más interesante. Y aunque el sistema de que es objeto el

trabajo usa un espejo convexo en vez de uno cóncavo, la idea y los principios de

limcionamiento son los mismos. El sistema de visión del gigantocypris puede verse por

medio de un diagrama a bloques de la siguiente manera.

El prototipo ocupa un espejo hiperbólico que provee un único centro de reflexión (el foco

principal de la hipérbola) y los rayos redirigidos también tienen un punto al cual convergen

(el foco secundario) lo cual permite usar una cámara convencional.

Cálculos Adicionales al Modelo del Sistema de Visión

Panorámico

Resolución de una cámara catadíóptríca

Según [8], la resolución de una cámara catadióptrica depende del punto en el espejo donde

se esté formando la imagen y está dada por la siguiente expresión:

donde (r, z) son las coordenadas en el espacio del punto en el espejo donde se está

formando la imagen y el centro de la cámara "c", esta ubicado en (0, c). El punto (r, z) se obtiene de la ecuación de la forma del espejo, dependiendo del caso.

Se ve que la resolución de la cámara no es homogénea en todo el espejo y varía de manera

radial en la imagen.

Diseño Mecánico

El prototipo debe cumplir las especificaciones marcadas: la cámara y el espejo deben estar

alineados y a una distancia tal, que el foco secundario del espejo coincida con el punto

focal de la cámara. Para lograr esto, el prototipo contiene un tomillo sin-fin, que se atomilla

a un soporte para el espejo. Cada pieza será explicada en las siguientes secciones.

Sistema de soporte del espejo

Los sistemas de soporte propuestos en la literatura [8, 13] constan de cilindros y esferas de

plástico o cristal y se debe cumplir con dos condiciones:

• Eliminar reflexiones internas producidas por el aparato

• Una superficie lisa para adquirir imágenes no distorsionadas

Sin embargo, requieren consideraciones especiales y se optó por un sistema de soporte con

un brazo mecánico. El problema que presenta es que bloquea la visión en una región de la

imagen omnidireccional. Esto puede corregirse por medio del material del cuál esté hecho

el brazo (si el material es translúcido, la región puede ser reconstruida) o simplemente

puede ignorarse esta sección; en tal caso, el sistema tiene un punto muerto, abarcando

ciertos ángulos, dependiendo del grosor del brazo.

Otro problema que presenta el sistema de soporte es que puede producir errores en el

cómputo de las imágenes si desalinea los ejes del espejo y de la cámara. El algoritmo para

desdoblado de las imágenes tiene como parámetro el centro de la imagen circular y si este

cambia el resultado es una imagen desdoblada distorsionada. Un ligero cambio en las

coordenadas del centro de la imagen provoca una gran distorsión en la imagen de salida.

Este detalle se verá corregido en el procesamiento por medio de un algoritmo de búsqueda

de círculos previo al desdoblamiento de la imagen. Lo cual corregirá en parte un posible

error en la alineación del espejo y la cámara.

El sistema elegido para el soporte del espejo consta de una barra hexagonal de aluminio

(figura 27) que se atomilla en un sin-fin. Se añadió un par de tuercas (una arriba y una

abajo) que hacen presión a ambos lados para mantenerla a una altura fija.

Con la barra, que es gmesa (1.3 cm), se evita que tenga un movimiento hacia arriba y hacia

abajo del espejo.

La selección del aluminio se hizo principalmente porque es fácil de trabajar, sobre todo si

se toma en cuenta que se busca una pieza más gruesa que la anterior.

Para evitar algunos errores causados por las lámparas (pueden provocar una saturación de

los sensores) se añadió un disco de color negro sobre el espejo. Este disco tiene una doble

función: primero, obstruye la luz indeseable que puede haber sobre el móvil (fuera de la

zona de interés); segundo, ayuda a delimitar bien el área de la fotografía que pertenece al

espejo y lo que está fuera de éste. Ya que todo lo que la cámara capta alrededor del espejo

no es de importancia para el sistema de visión, es necesario "recortar" todo lo que esté

fuera de él. Al poner el disco, toda esta zona se vuelve negra o prácticamente negra.

volviendo más sencillo el filtrarla (con una umbralización, por ejemplo). Otra ventaja es

que se provoca un cambio brusco en los niveles de gris de la imagen en la orilla del espejo,

lo cuál ser/irá para encontrar el centro de la imagen.

El espejo es soportado por una placa de metal, como la que se muestra a continuación. A

ésta va atornillado el espejo. La placa tiene un orificio de tal forma que un tomillo sinfin

puede atomillarse a ella y puede hacerla subir o bajar.

El orificio que tiene un radio r = 0.48 cm es donde va a estar el tomillo sinfín. El otro es

donde se atornillará el espejo.

El espejo tiene un tomillo en su base como se muestra. También pueden verse sus

dimensiones.

El objetivo del tomillo sinfín es poder bajar y subir el espejo para hacer coincidir el centro

de la cámara con el foco del espejo. El tomillo sinfín está fijo al disco intemo de un balero

y el disco extemo está fijo. El balero puede soldarse o fijarse de otra manera al fijo

dependiendo del lugar donde se vaya implementar el dispositivo. En la figura 29 se muestra la configuración general del sistema de visión antes del montaje.

Montaje del dispositivo

La cámara seleccionada para el prototipo cuenta con dos tomillos laterales. Se diseñó una

base para poder sostenerla y a su vez poder fijarla al móvil mediante dos tomillos más, tal

como se muestra en las figuras 30 y 31. La base esta formada por dos piezas sujetas por un

tomillo, si este tomillo se afloja, permite girar la cámara, en caso necesario.

Se trata de una cámara inalámbrica de circuito cerrado. Su selección se hizo por dos

razones principales: la primera es su tamaño reducido (alrededor de 3 cm.); la otra razón es

que al ser inalámbrica, permite independizar el sistema de recepción, del área de

procesamiento.

En la figura 31 (lado derecho) puede verse que sobresalen tres tomillos y no solo dos. Esto

no es un problema ya que el móvil tiene un orificio en el centro y así el tornillo central no

estorba.

La base del tomillo sin-fin se fija al móvil con tres tomillos. Como el tomillo tiene que

moverse verticalmente (para poder ajustar la altura del espejo), una parte tiene que entrar y

salir del móvil, el cuál es hueco.

El tomillo entra y sale del móvil por otro orificio que tiene el móvil. Por dentro hay una

tuerca más que sirve para evitar que el tomillo gire, una vez que se haya elegido la altura

correcta.

Hay un cuarto orificio en la pieza de la figura 32. Este orificio sirve para poner un

prisionero y así fijar el balero extemo del sistema que permite subir y bajar el tomillo. Las

demás partes del sistema mecánico permanecen sin cambios. En la figura 33 se muestra el

prototipo completo.

Esquema del prototipo completo montado en el móvil:

Construcción y Armado del dispositivo

A continuación se muestran los pasos seguidos para la construcción del prototipo siguiendo

los esquemas presentados en la sección anterior. Los materiales se escogieron de manera

que la construcción del prototipo fuera económica, pero cuidando que se adecuaran a las

necesidades del proyecto.

En la figura 34 se puede ver la barra hexagonal que soporta el espejo. En la imagen también

puede verse el disco negro que fue colocado sobre el espejo para poder aislarlo en la

imagen. El material utilizado para construir el soporte es aluminio. El disco negro esta

hecho de plástico.

La base de la cámara se muestra a continuación con la cámara montada (figura 35), aquí

puede apreciarse el tomillo central de la base, que permite girar la cámara sobre su propio

eje. También pueden verse dos orificios a los lados de la base que sirven para sujetarla al

móvil.

La cámara a utilizar, vista de frente, se presenta en la figura 36. Tiene una antena por donde

envía la imagen utilizando radio frecuencia (RF).

En la figura 37 puede verse el móvil a ufilizar para el proyecto. Éste no es propiamente

parte del sistema de visión omnidireccional, solo es un ejemplo de los tipos de aplicación

en que se podría ufilizar un sistema como el propuesto. Éste carro tiene 2 servo-motores,

uno para cada llanta.

En la figura 37 se aprecian también los orificios por donde pasa el sin-fin y el tomillo de la

cámara, así como el resto de los puntos donde puede atornillarse algún otro elemento.

A continuación se muestran las partes del sistema de giro del soporte del espejo (figura 38).

Este sistema permite al tomillo sin-fin girar para que el espejo pueda colocarse más arriba o

más abajo.

El tomillo está fijo a la parte interna del balero con 2 tuercas. La siguiente pieza que se ve,

de abajo hacia arriba, da soporte al balero dentro de la última pieza. Ésta última es la que va

fija al móvil. El balero queda fijo por medio de dos prisioneros que van a los lados de la

pieza fija. En la figura 39 se muestra el móvil con el sistema de giro y la cámara montados.

En las figura 41 se muestra el prototipo terminado, visto de diferentes ángulos. La

alimentación de la cámara y el sistema de control para los servo-motores se ubican en el

espacio existente dentro del móvil.

Materiales

Para la obtención de las imágenes se cuenta con la siguiente cámara:

Mini-cámara para circuito cerrado de TV

Marca: Lloyds Modelo: CA-1035

Importado: Lloyd's electrónica SA de CV

Alimentación: 9Vcc batería

8Vcc 200mA y para la recepción se cuenta con el siguiente receptor:

Receptor para mini-cámara para circuito cerrado de TV

Marca: Llovds Modelo: CA-1035

Importado: Lloyd's electrónica SA de CV

Alimentación: 9Vcc batería

8Vcc 200mA

Para poder leer las imágenes en la computadora se usa una tarjeta de video: TV Capture

Card. Esta tarjeta tiene entrada de señal de televisión, super video y RCA. Esta última es la

que se usa.

El tomillo y las piezas que lo sujetan al fijo son de hierro, el soporte del espejo es de

aluminio, el disco es de plástico y el balero es de acero.

Los parámetros del espejo a utilizar son a = 28.0949 mm. y b = 23.4124 mm., siguiendo

(24). La figura 42 muestra el esquema del proveedor.

Las especificaciones completas del espejo pueden ser consultadas en la página delproveedor [20].

Análisis matemático

La figura 43 muestra un corte del sistema a escala. Pueden verse las dos hojas de la

hipérbola; la parte superior es el espejo real y la inferior es mostrada solamente como

auxiliar para entender mas fácilmente el procesamiento basándose en la geometría propia

de la curva.

Gracias a la simetría del espejo, éste puede ser dividido en sectores y trabajar en un plano,

en vez de trabajar cada punto en el espacio tridimensional. De esta forma, se puede trabajar

en dos dimensiones, después bastará con aplicar el mismo procedimiento de 0 a 360° para

tener toda la imagen.

Debido a esto, la ecuación de la hipérbola se simplifica, pasando de tres a dos dimensiones.

Para el desdoblamiento se trabajará con la siguiente ecuación:

El rayo 1 (r1) de la figura 43 pasa por un punto en la orilla del espejo y por el foco F de la

hipérbola, con su respectivo rayo reflejado hacia el otro foco F'.

El rayo representa la mayor apertura del espejo, esto quiere decir que viene del punto más

alto de la imagen cilindrica y que estará reflejado en la orilla de la imagen obtenida por la

cámara (imagen circular). La ecuación de la recta es:

donde z(30) es la función z evaluada en r = 30 (el radio físico del espejo).

Para poder desdoblar la imagen se harán algunas consideraciones:

a) La imagen que da la cámara será la imagen de entrada.

b) La imagen desdoblada será la imagen de salida.

c) Las imágenes de salida y entrada estarán ubicadas imaginariamente a una distancia

de L y h, respectivamente, de forma que sus proyecciones tengan el mismo tamaño

en mm y en píxeles. Las expresiones para calcular L y h se muestran mas adelante.

Al hacer este ajuste, la constante k, (ecuación (6), del modelo de la cámara), toma

un valor de 1, por lo cual puede ignorarse en las expresiones.

Punto más alto en la imagen de entrada

Se ha dicho que el punto que se encuentra en la orilla de la imagen corresponde al rayo de

luz que se refleja en el borde del espejo. También se dijo que la imagen se colocará a una

distancia conveniente para que coincida su tamaño en mm y en píxeles, como se muestra en

la figura 44.

Sección Ignorada (pixign)

Debido a las propiedades de reflexión de este espejo, el punto central de la imagen de

entrada proviene de una línea sobre el eje óptico que bien podría estar en uno de los focos o

en el infinito, lo cual complica el desdoblamiento total. Para el procesamiento se considera

que la imagen de salida es una proyección sobre un cilindro alrededor del espejo. La figura

45 muestra un corte radial del espejo y los rayos de los extremos.

La imagen de entrada esta contenida horizontalmente entre los rayos r3 y r4, mientras que

la de salida lo está verticalmente entre los rayos r l y r2 (considerando esto, se comprenderá

que la imagen de entrada con la que se trabajará es en realidad una dona y no un disco). Se

puede apreciar que entre más grande sea la pendiente de r4, la pendiente de r2 será cada vez

menor, con lo cual, la imagen de salida se hará más y más grande tendiendo a una altura

infinita. Para evitar esto, se tiene cierto porcentaje de pixeles ignorados, llamado "pixign"

que se da en porcentaje del radio de la imagen (R). El punto de la imagen de entrada que

coincide con este porcentaje se refleja sobre el espejo (ver la intersección entre el r4 y r2) y

marca el punto más bajo de la imagen de salida. La ecuación de r4 es la siguiente:

Criterio para escoger el signo en la raíz. Se debe tomar en cuenta primero que Inign

siempre es positivo. Una de sus soluciones es la intersección con la hoja inferior de la

hipérbola y la otra con el espejo (la hoja superior de la hipérbola). Se busca la intersección

con el espejo, o sea, el valor más alto posible de inign y ya que el producto m-e es positivo

en todos los casos, la forma en que la expresión es máxima es cuando se toma la parte

positiva de la raíz.

La imagen de salida está a una distancia "L" del eje del espejo. "L" también puede

considerarse el radio del cilindro sobre el cual se proyecta ésta imagen. La imagen tiene una

parte sobre e y una parte por debajo de e, como se ve en la figura 46. La altura de la parte

superior se llamará Isa y la de la inferior Isb.

Desdoblamiento de la Imagen

El procedimiento es recorrer la imagen de salida buscando el punto de donde proviene. Para

poder ir de la imagen de salida a la de entrada lo primero que se necesita es encontrar la

recta que pasa por ese punto y el punto F (punto focal superior del espejo, o foco principal).

Luego se encuentra la intersección de esa recta con la superficie del espejo. Por último se

encuentra el lugar en el que se proyecta sobre la imagen original. Éste punto es el que se

debe copiar en la posición que se está evaluando de la imagen de salida.

La pendiente de una recta que pasa por un punto de la imagen de salida y por el foco

principal es:

La última parte sirve para visualizar ambas imágenes (figura 47).

La lectura de las imágenes, como se verá más adelante, puede hacerse de manera cíclica,

cambiando la instrucción en la línea cuatro y poniendo todo el código anterior dentro de un

ciclo while.

Reconocedor de Círculos

El código de desdoblamiento tiene algunos parámetros de entrada que se toman como

conocidos. Las coordenadas, en píxeles, del centro del espejo, forman parte de estos

parámetros, sin embargo, en principio, son desconocidas. Al tener un detector de círculos,

se busca tener las coordenadas exactas del centro del espejo, en la imagen. Aunque

teóricamente el eje del espejo está alineado con el eje de la cámara, con lo cual las

coordenadas del centro del espejo coincidirían con el centro de la imagen,

experimentalmente esto no es así. Por esto se desarrolló el detector. A continuación se

explica el funcionamiento general.

El reconocedor consta principalmente de dos partes. Primero se tiene un filtro pasa-altas de

gradiente para resaltar el borde del espejo. Mismo que presenta un cambio brusco en los

niveles de gris de la imagen. Este cambio brusco es debido al disco oscuro colocado sobre

el espejo. Al aplicar este filtro a la imagen, se obtiene una segmentación parcial del espejo.

Parcial, porque se tienen sus bordes, pero aún no se conoce su centro con exactitud.

El filtro utilizado es un filtro de Prewitt de gradiente de primera derivada. Los operadores

de Prewitt son los mostrados a continuación.

Puede verse que las constantes de los operadores quedan intactas al calcular (50) y por lo

mismo no presentan un factor discriminante para el borde, por lo tanto pueden ignorarse

para un análisis cualitativo.

Finalmente, la imagen de gradiente obtenida con el filtro de gradiente de primera derivada

debe ser sometida a un filtro de umbral para obtener una nueva imagen, ahora binaria (ver

figura 49).

Procedimiento

Mora que se tiene una imagen binarizada se comienza la detección de círculos. Para

agilizar el procedimiento, primero se declara el tamaño de un área alrededor del centro de la

imagen (ver figura 50), dentro de la cual se espera que se encuentre el centro del espejo.

Mientras más pequeña sea ésta área más rápida será la localización, pero existe un mayor

riesgo de cometer un error, dejando el centro real del espejo fiaera de la zona de búsqueda.

La altura y ancho de esta zona se define como la y Ja, respectivamente.

En un principio, se esperaba que el radio (R) de la imagen circular fuera la mitad de la

altura de la imagen de entrada. Pero debe entenderse que éste valor del radio es aproximado

al real. En la práctica se encontró que el valor del radio debe multiplicarse por un factor de

0.96 ya que la imagen del espejo no abarca completamente la altura de la fotografía. Cabe

mencionar que se trabaja con imágenes rectangulares horizontales, en caso de trabajar con

imágenes verticales, el radio deberá tomarse a partir del ancho de la imagen de entrada.

A partir de los valores de la y Ja se crea una matriz vacia que funcionará como un

acumulador. Esto quiere decir que cada pixel dentro del área de búsqueda que tenga una

:^istancia euclidiana con un punto de la imagen binaria igual a "R" aportará un valor de "1"

a la celda que le corresponda en la matriz de búsqueda.

A continuación se recorre un "cuadro" de I (aproximadamente 2R) pixeles por lado,

centrado en la imagen de entrada, (ver figura 51). Cada punto dentro del área de búsqueda

que cumpla la condición antes mencionada aumentará su valor en uno.

Una vez que se ha recorrido toda la imagen se busca el valor máximo en la matriz de

búsqueda. Las coordenadas de este píxel, trasladadas a la imagen completa, son las

coordenadas del centro del espejo.

A continuación se muestra el resultado que se tiene en la matriz de búsqueda

desdoblamiento no podría darse. En la figura 53 se presenta una imagen desdoblada

haciendo uso del detector de círculos explicado.

Etapa final

El sistema de visión presentado consta de varias etapas. Una vez que cada etapa ftinciona

correctamente de manera independiente es necesario acoplarlas para tener un sistema

funcional. A continuación se explica cuáles son las etapas principales del sistema, seguidas

por una breve descripción de su funcionamiento. Entre cada etapa se encuentra una

explicación de la forma en que se lleva a cabo el acoplamiento. Después se da una reseña

de los problemas detectados en cada punto y la forma en que se les dio solución. El sistema de visión consta de las siguientes etapas principales:

• Sistema Cámara-espejo.

• Envió por RF.

• Lectura en la computadora.

• Procesamiento.

• Presentación de la imagen desdoblada.

Sistema Cámara-Espejo

El sistema cámara-espejo, como ya se ha dicho, esta basado en el sistema de visión del

gigantocypris. Consiste en un espejo hiperbólico que refleja todo lo que se encuentra

alrededor del sistema y en su superficie se crea una imagen "circular" que contiene

información de todo el entorno. Envío por RF

El espejo se encuentra situado sobre una cámara digital de radiofrecuencia (RF) que al ser

conectada envía de manera constante las imágenes en forma de video. De esta manera el

prototipo tiene envío inalámbrico de la escena. Lectura en la Computadora

Se cuenta con un receptor de RF que tiene salida tipo RCA. Para poder recibir las imágenes

se hace uso de una tarjeta digitalizadora. La tarjeta de adquisición de video es manejada

desde Matlab usando el comando "vcapg2", que permite visualizar la escena tal como la

percibe el robot y tomar cuadros (frames) con la sintaxis "a=vcapg2". De esta manera se

tiene acceso a las imágenes circulares obtenidas por el prototipo. La función vcapg2 no es

propiamente una función de Matlab aunque fue creada para su uso desde Matlab y puede

ser descargada de [21]. Procesamiento

Como ha sido explicado anteriormente, las imágenes circulares son entrada para el

algoritmo de desdoblamiento, que conforma, junto con los algoritmos de filtrado y

detección de círculos, todo el procesamiento.

Presentación de la Imagen Desdoblada

Una vez que la imagen fue desdoblada, ésta puede ser sometida a un procesamiento

específico, dependiendo de la aplicación buscada. También puede almacenarse en la

memoria de la computadora para hacer un procesamiento posterior, ya sea en ese equipo o

en otro. Si es necesario, esta imagen puede ser reenviada a un punto remoto o incluso

enviada por Internet. En este caso, para la presentación del sistema se despliega la imagen

en pantalla para apreciar el resultado del desdoblamiento.

Todo el proceso se encuentra dentro de un bucle que regresa al punto de la lectura para

tomar una nueva imagen circular con la función "vcapg2".

Propuesta de Aplicación

La aplicación seleccionada para probar el sistema de visión es un móvil. El móvil se

controla desde la computadora y el envío de imágenes por RF constituye una

retroalimentación del estado del móvil, por lo tanto el control se da en lazo cerrado. El

móvil es colocado en un ambiente controlado: un laberinto con obstáculos. El proceso se

muestra mediante el siguiente diagrama a bloques (figura 54).

En la aplicación, el sistema de visión manda las imágenes constantemente y estas son

maestreadas en la computadora después del envío por RF. Una vez en la computadora y ya

extraído el centro de las imágenes se aplican los filtros mencionados en el diagrama de

bloques y que son explicados a continuación.

Filtrado de Bordes

Para detectar los obstáculos presentes en la escena deben ser detectadas todas las líneas

verticales de la escena real. Por las propiedades del sistema de visión, las lineas verticales

reales se convierten en líneas radiales en las imágenes circulares. Por esto se hace una

búsqueda de las mismas.

La imagen es sometida a una umbralización para segmentar los obstáculos, después se le

aplica un filtro de gradiente de primera derivada para resaltar los bordes. Con esto se tiene

una imagen binarizada que contiene bordes radiales, bordes no radiales y ruido propio de la

imagen.

Una vez que la imagen esta binarizada, se recorren todas las posiciones y se calcula el

ángulo que tiene cada pixel de borde con el centro de la imagen. Todos los pixeles que

..üga al mismo ángulo con respecto al centro son parte de un posible borde radial en ese

ángulo. Se lleva a cabo una selección de los ángulos que contienen más pixeles y los demás

son eliminados. Al hacer esto se elimina ruido en la imagen y se tienen los bordes radiales

principales. Si una línea es radial pero contiene pocos pixeles (un valor debajo de un

umbral seleccionado) es ignorada, pero si el móvil se acerca, comienza a detectarse porque

su número de pixeles aumenta.

Definición de Regiones

Para comprobar que un borde radial es en verdad la orilla de un obstáculo se debe

comprobar que haya un cambio brusco de los niveles de gris a ambos lados. Esto se hace

con un muestreo de los pixeles alrededor del borde. Para facilitar la detección del área de

los obstáculos, éstos son de color negro.

Los bordes se clasifican como de entrada y de salida "a los objetos", es decir, si un borde

comienza en pasillo y después hay un objeto (en el sentido de las manecillas del reloj), será

un borde de entrada y viceversa.

Una vez que se tienen los bordes de los obstáculos se identifica de qué ángulo a qué ángulo

se tiene un objeto y de qué ángulo a qué ángulo se tiene pasillo. Esto se hace seleccionando

como objeto todo lo que se encuentre entre un borde de entrada y el siguiente de salida.

Todo lo que no se considera obstáculo es pasillo y una posible ruta a seguir.

A continuación se selecciona el pasillo más cercano yendo hacia adelante, siempre que sea

lo suficientemente amplio para que pase el móvil. Se calcula el ángulo que se debe girar, se

codifica en binario se envia por el puerto serial.

Costo del Prototipo

El espejo representa el gran gasto del sistema ya que prácticamente se debe mandar a hacer.

El precio del espejo como el que se utilizó en este trabajo (de 60 mm de diámetro y forma

hiperbólica) es de aproximadamente $1500. El trabajo incluye el armado de una base para

el espejo y un brazo que ayude a sostener la cámara sobre el primero. El costo de la

fabricación es de aproximadamente $200. Este costo cambia dependiendo del material

seleccionado para el prototipo y la forma de maquinado. La tarjeta digitalizadora tiene un

costo de $600. El costo aproximado de la cámara fue de $2200. Con esto se llega a un costo total aproximado de $4500.

Problemas encontrados

Alimentación de la cámara. La cámara de RF trabaja con una alimentación de 9Vdc que en

un principio era proporcionada por un adaptador. Esta alimentación fue reemplazada por

baterías, colocadas dentro del prototipo.

La tarjeta digitalizadora presentó algunos problemas a la hora de leer desde Matlab, ya que

incluye una aplicación especial para su manejo que debe deshabilitarse antes de comenzar

el procesamiento, de otra manera no es posible accesar a ella. Mediante los comandos

habituales de Matlab, el manejo de la tarjeta es complicado, es por esto que se recurrió a la

función vcpg2 para la lectura de imágenes.

El uso de un espejo parabólico, como en el caso del gigantocypris, fue cambiado en el

trabajo por el de uno hiperbólico, para aprovechar la propiedad que tiene la hipérbola de

contar con dos puntos focales, lo que permite dirigir la imagen entera hacia un punto

específico. Esto último permite que la cámara capture correctamente la imagen

omnidireccional.

El trabajo presenta un problema a la hora del diseño del sistema, por el hecho de necesitar

ubicar exactamente el centro de reflexión de la cámara (el punto en el espacio en el que se

encuentra el foco de la cámara) para hacer coincidir este punto con uno de los focos del

espejo hiperbólico. Las cámaras comerciales normalmente no incluyen ésta característica

en sus especificaciones,

Se cuenta con la ventaja de usar una cámara que permite ajustar la distancia focal, de tal

forma que el sistema puede ser recalibrado en caso necesario. Esta calibración también

puede realizarse por medio del soporte, donde se encuentra el espejo, alejándolo o

acercándolo de la cámara.

Se tuvieron varias propuestas para el soporte del espejo, la selección de la pieza usada se

hizo por tener xm grosor mayor al de las otras piezas, con lo cual se limitó el movimiento

vertical del soporte.

Un análisis del sistema revela que la resolución espacial de la imagen está en función del

radio. Por lo cual se tiene menor resolución en el centro de la imagen y mayor al alejarse

del eje óptico. Esto se puede aprovechar considerando que la información contenida en la

imagen en la zona central incluye la imagen reflejada de la cámara misma y de ángulos

superiores (cercanos a 90°) con respecto a la horizontal, siendo toda ésta, información de

poco interés.

La forma de transmisión escogida es por radio frecuencia (RF), utilizando una cámara para

circuito cerrado y un receptor con salida de TV. Para la obtención de la señal por la

computadora se consiguió una tarjeta de adquisición de señal de TV.

Al ver la imagen desdoblada desplegada en pantalla se puede apreciar la correspondencia

entre imagen de entrada e imagen de salida. Al analizar ambas imágenes se verifica el

modelo matemático propuesto para el sistema. Una vez que se tiene acceso a las imágenes

circulares y panorámicas que ofrece el sistema de visión se puede decidir trabajar con las

¡)rimeras o con las últimas. Una persona familiarizada con las imágenes circulares puede no

, „querir la visualización de la imagen panorámica, pero aún asi es una herramienta muy

".iiportante el poder hacer la conversión para análisis o para presentar datos de una manera

más clara para el entendimiento humano o para cierto proceso.

5n todo caso, si proceso de desdoblamiento puede omitirse si solamente se requiere un

análisis cualitativo, pero si se requiere un análisis más profundo de la escena, entiéndase

esto como la medición de distancias exactas o tamaño de los objetos, el desdoblamiento

será necesario para que la imagen tenga proporciones reales y se puedan hacer mediciones.

Para la aplicación propuesta no es necesario hacer el desdoblamiento de las imágenes. El

desdoblamiento puede hacerse con la única finalidad de presentar la escena al observador.

La imagen desdoblada no se utiliza en el procesamiento y no afecta la decisión tomada.

Desplegar la imagen en Matlab consume tiempo de procesamiento que podria ahorrarse en

otras aplicaciones o al trabajar en un lenguaje de bajo nivel.

upiita sistema de visión panorámica basado en la visión

Documents