capítulo 5: caracterización de texturas. métodos...

13
Capítulo 5: Caracterización de Texturas. Métodos Estadísticos Basados en la Transformada Wavelet “Extracción de características de textura basada en la transformada Wavelet discreta” 17 5 CARACTERIZACIÓN DE TEXTURAS. MÉTODOS ESTADÍSTICOS BASADOS EN LA TRANSFORMADA WAVELET. 5.1 INTRODUCCIÓN El análisis de texturas juega un importante papel en muchas tareas de procesamiento de imágenes, desde percepción remota hasta imágenes médicas, visión robótica o buscar entre el contenido de una gran base de datos de imágenes. Por ello en las últimas décadas se han propuesto varios métodos para extraer características de textura, pero el problema recae en la dificultad de encontrar un método óptimo. La principal clase de característica extraída depende de la suposición de que la textura se puede definir por las propiedades estadísticas locales de un píxel en escala de grises. A partir del histograma de la imagen se pueden derivar los estadísticos de primer orden y usarse como características de textura. Pronto se sostuvo que no eran suficientes para una descripción adecuada de textura, y se vio la necesidad de introducir estadísticos de segundo orden. Éstos se reflejan de forma eficiente en las características computadas a partir de la matriz de co-ocurrencia. La conjetura de que los estadísticos de segundo orden eran suficientes para el análisis de textura fue rechazada más tarde y se introdujeron otros esquemas de análisis de texturas, como los basados en campos aleatorios de Markov o modelos fractales. El punto débil que tienen en común todos estos análisis de textura es que la imagen se analiza en una única escala. Estudios del sistema visual humano sostienen que el córtex visual puede ser modelado como un sistema de canales independientes, cada uno con una orientación y sintonización de frecuencia espacial determinadas. Por tanto esa limitación puede ser superada empleando representaciones multiescala. Varios sistemas de análisis de texturas han sido descubiertos. En particular los filtros Gabor fueron empleados para llevar a cabo la segmentación de texturas. Sin embargo la teoría Wavelet ha llegado a ser el marco matemático más idóneo para el análisis de imagen multiescala [5] [8]. Como ya se ha estudiado en el capítulo anterior, la transformada Wavelet mapea la imagen en una sub-imagen de baja resolución, o imagen tendencia, y una serie de imágenes de detalles. La imagen tendencia se obtiene enturbiando iterativamente la imagen, mientras que las imágenes de detalles contienen la información perdida durante dicha operación. La energía o la desviación típica de las sub-imágenes de detalles son las características más usadas para clasificación de texturas y problemas de segmentación. Constituirán, por tanto, un primer conjunto de propiedades que caracterizarán la textura. En conclusión, este trabajo combina la estadística y la visión multiescala e intenta demostrar que la textura puede ser completamente caracterizada a partir de las propiedades estadísticas de los coeficientes de su representación multiescala. Para describir óptimamente esas estadísticas, se introducen otros dos conjuntos de características: el histograma Wavelet y la matriz de concurrencia. La información estadística de primer orden se deriva del histograma de la imagen de detalles. Como observó Mallat [5], estos histogramas de detalles obtenidos a partir de texturas naturales pueden ser modelados por una familia de funciones exponenciales. Introduciendo los parámetros de dicho modelo como características de textura se describen completamente los coeficientes estadísticos Wavelet de primer orden. Se obtiene una mejora adicional en la descripción de texturas a partir de los coeficientes estadísticos de segundo orden, los cuales pueden ser descritos usando la matriz de concurrencia de la imagen de detalles. Aunque la descripción más completa se obtiene combinando ambos, información estadística de primer y de segundo orden. Se consigue con ello un cuarto conjunto de características de textura. En resumen, los patrones de textura se identificarán usando cuatro conjuntos distintos de características: La energía de la sub-imagen de detalles. Los parámetros del modelo que representa al histograma de la sub-imagen de detalles. Los descriptores obtenidos a partir de la matriz de concurrencia de la sub-imagen de detalles.

Upload: vanlien

Post on 28-Sep-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 17

5 CARACTERIZACIÓN DE TEXTURAS. MÉTODOS ESTADÍSTICOS BASADOS EN LA TRANSFORMADA WAVELET.

5.1 INTRODUCCIÓN

El análisis de texturas juega un importante papel en muchas tareas de procesamiento de imágenes, desde percepción remota hasta imágenes médicas, visión robótica o buscar entre el contenido de una gran base de datos de imágenes. Por ello en las últimas décadas se han propuesto varios métodos para extraer características de textura, pero el problema recae en la dificultad de encontrar un método óptimo.

La principal clase de característica extraída depende de la suposición de que la textura se puede

definir por las propiedades estadísticas locales de un píxel en escala de grises. A partir del histograma de la imagen se pueden derivar los estadísticos de primer orden y usarse como características de textura. Pronto se sostuvo que no eran suficientes para una descripción adecuada de textura, y se vio la necesidad de introducir estadísticos de segundo orden. Éstos se reflejan de forma eficiente en las características computadas a partir de la matriz de co-ocurrencia.

La conjetura de que los estadísticos de segundo orden eran suficientes para el análisis de textura fue

rechazada más tarde y se introdujeron otros esquemas de análisis de texturas, como los basados en campos aleatorios de Markov o modelos fractales.

El punto débil que tienen en común todos estos análisis de textura es que la imagen se analiza en una

única escala. Estudios del sistema visual humano sostienen que el córtex visual puede ser modelado como un sistema de canales independientes, cada uno con una orientación y sintonización de frecuencia espacial determinadas. Por tanto esa limitación puede ser superada empleando representaciones multiescala.

Varios sistemas de análisis de texturas han sido descubiertos. En particular los filtros Gabor fueron

empleados para llevar a cabo la segmentación de texturas. Sin embargo la teoría Wavelet ha llegado a ser el marco matemático más idóneo para el análisis de imagen multiescala [5] [8]. Como ya se ha estudiado en el capítulo anterior, la transformada Wavelet mapea la imagen en una sub-imagen de baja resolución, o imagen tendencia, y una serie de imágenes de detalles. La imagen tendencia se obtiene enturbiando iterativamente la imagen, mientras que las imágenes de detalles contienen la información perdida durante dicha operación. La energía o la desviación típica de las sub-imágenes de detalles son las características más usadas para clasificación de texturas y problemas de segmentación. Constituirán, por tanto, un primer conjunto de propiedades que caracterizarán la textura.

En conclusión, este trabajo combina la estadística y la visión multiescala e intenta demostrar que la

textura puede ser completamente caracterizada a partir de las propiedades estadísticas de los coeficientes de su representación multiescala. Para describir óptimamente esas estadísticas, se introducen otros dos conjuntos de características: el histograma Wavelet y la matriz de concurrencia.

La información estadística de primer orden se deriva del histograma de la imagen de detalles. Como

observó Mallat [5], estos histogramas de detalles obtenidos a partir de texturas naturales pueden ser modelados por una familia de funciones exponenciales. Introduciendo los parámetros de dicho modelo como características de textura se describen completamente los coeficientes estadísticos Wavelet de primer orden.

Se obtiene una mejora adicional en la descripción de texturas a partir de los coeficientes estadísticos

de segundo orden, los cuales pueden ser descritos usando la matriz de concurrencia de la imagen de detalles. Aunque la descripción más completa se obtiene combinando ambos, información estadística de primer y de segundo orden. Se consigue con ello un cuarto conjunto de características de textura.

En resumen, los patrones de textura se identificarán usando cuatro conjuntos distintos de

características: • La energía de la sub-imagen de detalles.

• Los parámetros del modelo que representa al histograma de la sub-imagen de detalles.

• Los descriptores obtenidos a partir de la matriz de concurrencia de la sub-imagen de detalles.

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 18

• Combinación de las características extraídas del histograma y de la matriz de concurrencia.

Los apartados siguientes se detienen en cada uno de los conjuntos de características que se pueden

extraer partiendo de las matrices de detalles.

5.2 ENERGÍA La energía normalizada de una sub-imagen formada por N coeficientes se define como:

( )[ ] b ,b D · N1 E

kj,

2kjnini ∑= (7)

La característica de energía Wavelet {Eni} n=1...d, i= H, V, D refleja la distribución de energía a lo largo del

eje de frecuencia sobre una escala y en una orientación determinada. Además, se ha comprobado que es muy potente para caracterización de texturas. Como la información de textura más relevante ha sido borrada filtrando pasobaja iterativamente, la energía de la imagen de baja resolución Ld generalmente no se considera una característica de textura.

Generalmente, la energía de las imágenes se concentra en las frecuencias bajas ya que su

espectro se reduce con el incremento de las frecuencias. Estas propiedades de las imágenes quedan reflejadas en la transformada Wavelet de la imagen. Los niveles más bajos de compresión se corresponden con las bandas de alta frecuencia. En particular, el primer nivel representa la banda de más alta frecuencia y el nivel más fino de resolución. A la inversa, el último nivel (n) de descomposición corresponde con la banda de frecuencia más baja y la resolución más tosca. Así, al desplazarse de los niveles de descomposición más altos a los más bajos, o sea, de baja frecuencia a alta frecuencia, se observa una disminución de la energía contenida en las sub-bandas recorridas.

Consecuentemente, si los coeficientes Wavelet obtenidos para un nivel concreto poseen pequeñas

magnitudes (valores próximos a cero) de energía, se espera que esos coeficientes Wavelet estén en los primeros niveles de descomposición. El aumento del nivel de descomposición Wavelet produce unos coeficientes con mayores magnitudes.

Una medida alternativa que se usa a veces como característica de textura es la desviación media,

dada por la ecuación (8):

)b ,(b D · N1 MD

kj,kjnini ∑= (8)

Las características de energía y desviación media son una medida de la dispersión de los

coeficientes Wavelet y están fuertemente correladas ya que existe una cierta relación entre los coeficientes de la misma posición espacial en las diferentes bandas. En este trabajo utilizaremos sólo las de energía para caracterizar la textura ya que al estar correladas, usar las dos sería redundante y la primera requiere menor coste computacional. Se obtiene un vector de características de doce elementos, que se corresponden con la energía de cada una de las doce matrices de coeficientes de detalle Wavelet. Hay que recordar que son tres sub-imágenes por cada uno de los cuatro niveles de descomposición Wavelet.

5.3 HISTOGRAMA

El histograma de una imagen es una herramienta visual de gran aceptación y utilidad para el estudio de imágenes digitales. Con una simple mirada puede proporcionar una idea muy aproximada de la distribución de niveles de gris, el contraste que presenta la imagen y alguna pista del método más adecuado para manipularla.

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 19

El histograma de una imagen digital con L niveles de gris en el rango [0, L-1] es una función discreta de la forma:

Nn )h(r k

k = (9)

donde: rk es el k-ésimo nivel de gris

nk es el número de píxeles en la imagen con el nivel de gris rk

N es el número total de píxeles de la imagen

k = 0, 1, 2, ..., L-1 niveles de gris

Las intensidades o niveles de gris están representadas a lo largo del eje x, y suele ir de 0 a 255,

mientras que el número de ocurrencias para cada intensidad se representan en el eje y. Debe remarcarse que la frecuencia de aparición de cada nivel de gris en el histograma se muestra siempre en forma relativa debido al hecho que el valor absoluto puede variar bastante en función del tamaño de la imagen, así como también puede variar el máximo valor a representar.

Figura 15: Imagen original en escala de grises y su histograma

En el caso de una imagen en color, no podemos hablar de un único histograma que caracterice a la

imagen sino de tres histogramas, uno para cada color (RGB, por ejemplo). Si bien el uso del histograma y sus posteriores modificaciones son más aplicables a imágenes en escala de grises.

Figura 16: Imagen original en color RGB y sus tres histogramas,

correspondientes al rojo, al verde y al azul

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 20

La forma del histograma proporciona información importante, como la intensidad media y la dispersión de los valores de nivel de gris, siendo esta última, la medida de contraste de la imagen.

En lo referente al contraste, cuanto mayor es la dispersión a lo largo del eje de los niveles de gris

mayor es el contraste de la imagen y es entonces cuando el sistema visual humano consigue una máxima respuesta en su apreciación de la imagen, véase la figura 17 (b). Por su parte, un histograma que presente un perfil estrecho corresponderá a una imagen de bajo contraste, como la que se aprecia en la figura 17 (a).

Figura 17: Apreciación del contraste de una imagen a partir de su histograma.

(a) Imagen de bajo contraste, (b) Imagen de alto contraste

En cuanto a la intensidad, el histograma proporciona una descripción de la apariencia global de una

imagen de forma que si los niveles de gris están concentrados hacia el extremo oscuro del rango de la escala de gris, la apariencia global de la imagen será oscura; mientras que si sucede justo lo contrario, valores cercanos a 255, la imagen correspondiente será brillante.

Figura 18: Intensidad de una imagen reflejada en su histograma.

(a) Imagen brillante, (b) Imagen oscura

5.3.1 Modelo del Histograma de Detalles Wavelet

En este apartado se describe el método de caracterización de textura mediante información procedente de los histogramas Wavelets de las sub-bandas obtenidas a distintas escalas. Las características de primer orden analizadas son las de energía y las de histograma. Las características de histograma permiten indetificar mejor la textura, respecto de las características de energía. Para ello, se obtendrá el histograma asociado a cada sub-banda de detalle.

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 21

Mallat [5] demostró experimentalmente que las densidades de probabilidad de las sub-matrices de detalle de imágenes de texturas naturales podían ser modeladas por una familia de exponenciales:

|u|- exp ·K h(u) ⎟⎠⎞

⎜⎝⎛ ⎟

⎠⎞⎜

⎝⎛= βα (10)

donde: α refleja la varianza de la función densidad de probabilidad, es decir, da una idea de la

anchura del histograma.

β refleja lo rápido que decae el valor máximo de dicha función (así, con β igual a dos, se tiene una Gaussiana). Es inversamente proporcional a la tasa de decrecimiento del histograma.

K es una constante de normalización para asegurar que ∫ h(u) ·du =1

Este modelo fue construido estudiando los histogramas de siete imágenes diferentes descompuestas

en cuatro niveles de resolución. Si se asume que el histograma es equivalente a la función densidad de probabilidad, pues

también modela la distribución de los coeficientes Wavelet de la sub-banda de detalle correspondiente, todos los estadísticos de primer orden de dicha sub-banda estarán contenidos en dos únicos parámetros, α y β, que son las denominadas características del histograma Wavelet.

El cálculo de estos dos parámetros se basa en la estimación del momento de primer y segundo

orden del histograma de la imagen de detalles:

∫= |·h(u)·duu| m1 ∫= ·h(u)·du|u| m 22 (11)

Insertando la definición del histograma (10) y usando la condición de normalización se obtienen las

ecuaciones que proporcionan α, β y K:

( )( )

( ) ( )xx

xxF13

22

ΓΓ

Γ= (12)

Donde Γ es la función gamma dada por: ( ) dt·te x 1-x-t∫=Γ (13)

Se obtiene β a partir de la función F-1(x) y, posteriormente, α y K:

⎟⎠⎞

⎜⎝⎛=

2

211-

mmF β (14)

⎟⎠⎞⎜

⎝⎛Γ

⎟⎠⎞⎜

⎝⎛Γ

=

β

βα

2

1

1m (15)

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 22

⎟⎠⎞⎜

⎝⎛Γ⋅

=

βα

β12

K (16)

Notar que la energía (7) y la desviación media (8) son exactamente las estimaciones m2 y m1,

respectivamente, exigidas para computar α y β. La transformación altamente no lineal (14) (15) mapea las características correladas Eni y MDni en las características de histograma Wavelet α y β, los cuales se interpretan fácilmente como características específicas e independientes del histograma de detalles. Además α y β contienen toda la información de primer orden presente en el histograma.

En este caso, el vector de características estará formada por 24 elementos, ya que cada una de las

doce sub-imágenes de detalles estará definida por dos parámetros, α y β. La formulación para la computación de las características Wavelet que se ha presentado aquí, puede

emplearse fácilmente para otras tareas de análisis de texturas. Por ejemplo, para segmentación las características Wavelet se computan sobre una pequeña ventana local centrada en cada píxel de la imagen, dando como resultado un vector de características por píxel. La imagen se subdivide entonces en un número de regiones, asociando cada píxel a una región particular basándose en su vector de características.

5.4 MATRIZ DE CO-OCURRENCIA

Cuando las características basadas en estadísticos de primer orden no son suficientes, los estadísticos de segundo orden pueden mejorar la discriminación de texturas. A partir de toda la información estadística de primer orden de las imágenes de detalles capturada en las características de histograma, la extensión obvia es la computación de la matriz de co-ocurrencia para describir los estadísticos de segundo orden de dichas sub-imágenes.

La información textural en una imagen está contenida en la relación espacial que los tonos de gris

tienen entre ellos. Esas relaciones están especificadas en la matriz de co-ocurrencia espacial (o de niveles de gris) que son computadas en una dirección especifica (o bien para todas: 0°, 45°, 90° y 135°) entre los píxeles vecinos dentro de una ventana móvil dentro en la imagen.

Este método permite extraer una gran cantidad de información de textura de imagen por la gran

variedad de descriptores que es posible obtener de esta matriz, que hacen posible caracterizar con un conjunto de valores cuantificables cada imagen analizada.

5.4.1 Definición de la Matriz de Co-ocurrencia

Cada coeficiente de la matriz de detalles Wavelet es un número real, mientras que la matriz de co-ocurrencia se define para una imagen con un número discreto de niveles de gris. Así, el histograma de detalles es discretizado eligiendo M valores {uj,∆uj} j=1…M :

jDni =~

si ⎥⎦⎤

⎢⎣⎡ Δ

−∈ 2,2j

jj

jniuuuuD (17)

El elemento (j, k) de la matriz de co-ocurrencia Cni

δθ se define como la probabilidad conjunta de que un coeficiente Wavelet D ̃ni=j co-suceda con un coeficiente D ̃ni=k en una distancia δ en la dirección θ [1]. Así, cuanto mayores sean los valores de su diagonal principal, Cni

δθ (j, j), más homogénea será la textura que representa, mientras que cuanto más repartidos estén los valores fuera de la diagonal más heterogénea será.

Normalmente se usan valores pequeños para δ ya que existe una correlación más relevante entre

píxeles cercanos. La relación espacial entre el píxel de referencia y su vecino puede ser en cualquiera de las ocho direcciones (Norte, Sur, Este, Oeste y las 4 diagonales), pero solo se toman cuatro, ya que la Norte es

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 23

opuesta a la Sur y en vez de contarlas separadamente hay formas mas sencillas de medirlas (matriz simétrica, que más adelante se detalla). Cuando se habla de una relación “espacialmente invariante” se eligen las cuatro direcciones N, NE, E y SE y se promedian. (Esto también se expresa respectivamente como 0°, 45°, 90° y 135°).

Figura 19: Los 8 vecinos del píxel de referencia X de acuerdo al ángulo θ utilizado en el

cálculo de la matriz de co-ocurrencia para una distancia δ=1.

A partir de esta matriz se calculan 8 variables estadísticas de segundo orden, propuestas por Haralick (1973) [1], las cuales describen propiedades como contraste, energía, entropía, uniformidad local, probabilidad máxima, tonalidad, importancia y correlación. Estas características extraídas de la imagen de detalles serán las características de co-ocurrencia Wavelet.

Características similares fueron propuestas por Thyaragajan [9], sin embargo se obtuvieron usando

una transformada Wavelet sub-muestreada, resultando imágenes de detalles muy pequeñas para escalas bajas para las cuales las características de la matriz de co-ocurrencia no son robustas y pueden ser engañosas. También computa las características de co-ocurrencia de la imagen tendencia para cada escala, lo que puede conducir a redundancia ya que las imágenes de baja resolución a dos escalas diferentes contienen información de baja frecuencia superpuesta.

5.4.2 Construcción de la matriz

En la figura 20 se representa la imagen prueba u original donde los valores corresponden a Niveles de Grises. La imagen tiene 4 píxeles de lado y 4 niveles de grises: 0, 1, 2 y 3. (Haralick et al. 1973). Todos los cálculos de las medidas texturales que se presentan en este apartado están basados en esta imagen.

Figura 20: Imagen prueba de dimensión 4x4 con 4 valores de niveles de gris (0, 1, 2 y 3)

La matriz de co-ocurrencia considera la relación espacial entre dos píxeles, llamados píxel de

referencia y píxel vecino. Por ejemplo, si se escoge el píxel vecino que está situado un píxel a la derecha de cada píxel de referencia, 0º, esto se expresa como (1,0): 1 píxel en la dirección x, 0 píxel en la dirección y.

Cada píxel en la ventana se va convirtiendo sucesivamente en el píxel de referencia, empezando por

el ubicado arriba a la izquierda y finalizando abajo a la derecha. En el caso del ejemplo, (1,0), los píxeles ubicados en el margen derecho de la imagen original, no tienen vecino a la derecha por lo tanto no son usados en el computo.

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 24

Se pueden utilizar diferentes relaciones entre píxeles, por ejemplo: (-1,0) un píxel a la izquierda del píxel de referencia, (1,1) un píxel a la derecha y un píxel abajo (en diagonal). En este trabajo hemos usado las siguientes combinaciones que dan lugar a las cuatro orientaciones principales, θ= 0º, 45º, 90º y 135º, para una distancia de un píxel, δ=1:

(1,0) orientación horizontal, 0º

(0,-1) orientación vertical, 90º

(1,1) orientación diagonal hacia arriba, 45º

(1,-1) orientación diagonal hacia abajo, 135º

Las posibles combinaciones de niveles de grises para la imagen de prueba se presentan en la tabla

2, estas etiquetas no se volverán a mostrar en las matrices de co-ocurrencia.

Píxel VecinoPíxel Referencia 0 1 2 3

0 (0,0) (0,1) (0,2) (0,3) 1 (1,0) (1,1) (1,2) (1,3) 2 (2,0) (2,1) (2,2) (2,3) 3 (3,0) (3,1) (3,2) (3,3)

Tabla 2: Todas las posibles combinaciones de los 4 niveles de gris de la imagen de prueba

La primera celda debe completarse con la cantidad de veces que ocurre la combinación (0,0).

Cuántas veces, en el área de la ventana un píxel con valor de gris igual a 0 (píxel vecino), esta situado a la derecha de otro píxel con valor 0 (píxel de referencia), en el caso de tener una orientación horizontal 0º, que se corresponde con la relación espacial (1,0).

Existen, por lo tanto diferentes matrices de co-ocurrencia para cada relación espacial, según se

considere el vecino de arriba, al costado o en diagonal. En la figura 21 se muestra la matriz de co-ocurrencia (b) correspondiente a la matriz de coeficientes de prueba (a) para la relación espacial (1,0).

Figura 21: Matriz de co-ocurrencia para la imagen de prueba

Esta matriz se interpreta de la siguiente manera: En la imagen de prueba, dos veces el píxel de

referencia es 0 y su vecino a la derecha es también 0 (Primera celda). Tres veces el píxel de referencia es 2 y su vecino a la derecha es 2 (tercera celda de la diagonal, en azul en la figura 21.

En la matriz precedente, se cuenta cada píxel de referencia con su vecino a la derecha. Si el calculo

se realiza solo de este modo, usando sólo una dirección, entonces el número de veces que aparece la combinación (2,3) no es el mismo que la combinación (3,2) (por ejemplo el 3 está a la derecha del 2 una vez, pero a la izquierda ninguna), por lo tanto la matriz no es simétrica respecto de la diagonal.

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 25

Sin embargo, la simetría es necesaria para el cálculo. Ésto se logra si cada par de píxeles se cuentan dos veces: una vez a la derecha y otra vez a la izquierda (se intercambian los píxeles de referencia y vecino en el segundo cálculo). Para obtener una matriz simétrica la forma más sencilla, en vez de contar dos veces, es sumarle a esta matriz su matriz traspuesta. La matriz traspuesta se logra intercambiando las filas y columnas de la matriz original.

Sumando cada elemento de la matriz de co-ocurrencia original del ejemplo anterior y su traspuesta,

se llega a la matriz simétrica de la tabla 3:

4 2 0 0 2 4 0 0 0 0 6 1 0 0 1 2

Tabla 3: Matriz simétrica para una relación horizontal (derecha 0º + izquierda 180º)

de la imagen de prueba

Una vez obtenida la matriz simétrica, el paso siguiente es expresar esta matriz como probabilidad. La

definición mas simple de la probabilidad es: ”el número de veces que un evento ocurre, dividido por el número total de posibles eventos” y la ecuación para su cálculo es:

∑−

=

= 1

0,,

,, N

jiji

jiji

V

VC (18)

Donde:

i es el número de filas y j el número de columnas

V es el valor de la celda (i,,j) en la ventana

Ci,j es la probabilidad en la celda i,j

N es el numero de filas o columnas

Considerando la imagen de prueba de 4 x 4 píxeles, y la relación (1,0) el número total de posibles

pares es de 12, como muestra la figura 22, y para una relación horizontal (derecha más izquierda) ese número se duplica (24).

Figura 22: Total de pares posibles para una relación espacial (1,0) si la matriz es 4x4

Observando la matriz horizontal de la tabla 3, se comprueba que, por ejemplo, la combinación (2,2)

aparece 6 veces de las 24 posibles (12 a la derecha y 12 a la izquierda) y la combinación (2,3) solo 1 vez. La combinación (2,2) ocurre 6 veces sobre 24 posibles, por lo que la probabilidad es de ¼ ó 0.250. Mientras que la combinación (2,3) es de 1/24 ó 0.042.

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 26

La ecuación (18) transforma la matriz de co-ocurrencia en una aproximación de tabla de probabilidad. Decimos, que es una aproximación, porque una verdadera probabilidad requiere de valores continuos, y los valores de grises son valores enteros, por lo tanto discretos.

Este proceso se denomina Normalización de la matriz. Aplicando esta ecuación a la matriz simétrica de la tabla 3 se obtiene la matriz de la tabla 4, donde el sumatorio de todos los elementos debe ser igual a 1, pues está normalizada.

0.166 (4/24)

0.083 (2/24)

0.042 (1/24)

0 (0/24)

0.083 0.166 0 0 0.042 0 0.250 0.042

0 0 0.042 0.083

Tabla 4: Matriz normalizada horizontal

Se asume que toda la información está contenida en la matriz de dependencia espacial

desarrolladas para las 4 direcciones de la figura 19. En general, cuanto mayor es el número de la diagonal en la matriz de co-ocurrencia, mas homogénea es la textura en esa parte de la imagen que está siendo analizada.

5.4.3 Características de la matriz Con respecto a la matriz de co-ocurrencia simétrica y normalizada hay algunos aspectos a resaltar:

Los elementos de la diagonal representan pares de píxeles que no tienen diferencias en su

nivel de gris. Si estos elementos tienen probabilidades grandes, entonces la imagen no muestra mucho contraste, la mayoría de los píxeles son idénticos a sus vecinos.

Sumando los valores de la diagonal tenemos la probabilidad que un píxel tenga el mismo

nivel de gris que su vecino.

Las líneas paralelas a la diagonal separadas una celda, representan los pares de píxeles con una diferencia de 1 nivel de gris. De la misma manera sumando los elementos separados dos celdas de la diagonal, tenemos los pares de píxeles con dos valores de grises de diferencia. A medida que nos alejamos de la diagonal la diferencia entre niveles de grises es mayor.

Sumando los valores de estas diagonales paralelas obtenemos la probabilidad que un píxel

tenga 1, 2, 3, etc. niveles de grises de diferencia con su vecino. Las principales propiedades de una matriz de co-ocurrencia son:

Cuadrada: El rango de los niveles de gris de los píxeles de referencia y el de los vecinos es el mismo, por lo tanto las filas y las columnas tienen idéntico número.

Tiene el mismo número de filas y columnas que el número de bits de la imagen.

La imagen de prueba tiene solo 4 valores posibles (0, 1, 2 y 3), es decir es una imagen de 2 bits (22= 4). Los datos de 8 bits tienen 256 (28= 256) posibles niveles de gris, así la matriz de co-ocurrencia es de 256 x256.

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 27

Es simétrica con respecto a la diagonal Una matriz simétrica significa que los mismos valores ocurren en las celdas opuestas a la diagonal. Por ejemplo, el valor en la celda (3,2) debería ser el mismo que el valor en la celda (2,3) para que la matriz sea simétrica. En el apartado anterior se explicó cómo conseguir que la matriz sea simétrica.

5.4.4 Descriptores de Textura de la Matriz de Co-ocurrencia

Hasta este punto se ha detallado como se crea una matriz normalizada, expresada como probabilidad, para una determinada relación espacial entre dos píxeles vecinos. Una vez construida, de esta matriz pueden derivarse diferentes medidas. Las siguientes son una breve explicación de algunas de estas descriptores texturales, que serán los que formen el vector de características de co-ocurrencia:

Inercia (o contraste)

Es una medida de la variación local en una imagen. Alcanza un valor alto cuando la imagen tiene mucho contraste y tiene un valor bajo cuando los valores altos de la matriz están cerca de la diagonal principal.

( ) jiji

CjiC ,2

,1 ⋅−= ∑ (19)

Energía (o momento angular de segundo orden)

Esta medida da valores altos cuando en la matriz de co-ocurrencia tiene pocas entradas de gran magnitud, y es baja cuando todas las entradas son similares. Si todos los píxeles son iguales la energía es mínima. Es una medida de la homogeneidad local. ∑=

jijiCC

,

2,2 (20)

Entropía

Este descriptor nos mide la aleatoriedad de la imagen, alcanzando su máximo cuando todos los elementos de la matriz de coocurrencia son iguales.

[ ]∑ ⋅−=ji

jiji CCC,

,2,3 log (21)

Se asume que 0*log(0)=0.

Homogeneidad Es lo opuesto al contraste y se calcula mediante la ecuación:

( )∑−+

=ji

ji

ji

CC

,2

,4 1

(22)

Otra forma de realizar el cálculo es en forma matricial, multiplicando la matriz de probabilidades (Tabla 4) por la matriz de pesos. Aunque en la tabla 5 se presentan los pesos más comunes para calcular la homogeneidad, en este trabajo no se utiliza matriz de pesos para calcular la homogeneidad. Los pesos son menores para los coeficientes más alejados de la diagonal.

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 28

1 0.5 0.2 0.1 0.5 1 0.5 0.2 0.2 0.5 1 0.5 0.1 0.2 0.5 2

Tabla 5: Matriz de pesos más utilizada en el cálculo de la homogeneidad

La homogeneidad es alta cuando la matriz de coocurrencia se concentra a lo largo de la diagonal. Esto ocurre cuando la imagen es localmente homogénea.

Probabilidad máxima Se obtiene fácilmente como: { }jiCC ,5 max= (23)

Tonalidad

Lo primero que se debe calcular es la media de la matriz de co-ocurrencia, tanto para filas como para columnas. Se hace notar la diferencia que existe entre esta GLCM media de la media aritmética de los valores de grises de los píxeles de la ventana. La media en la matriz de coocurrencia no es simplemente el promedio de los valores originales de los niveles de gris en la ventana. El valor del píxel no es ponderado por su frecuencia por si mismo, sino por la frecuencia de su co-ocurrencia en combinación de un determinado valor del píxel vecino.

∑ ⋅=ji

jix CiM,

, ∑ ⋅=ji

jiy CjM,

, (24)

Se define entonces la tonalidad como: ( )∑ ⋅−+−=

jijiyx CMjMiC

,,

36 (25)

Importancia

Medida similar a la tonalidad cuya expresión viene dada por: ( )∑ ⋅−+−=

jijiyx CMjMiC

,,

47 (26)

Medida de Información de Correlación

En [1], Haralick propone la siguiente expresión:

( )yx

xy

HHHC

C,max

38

−= (27)

Donde: ( ) ∑=

jjix CiS , ( ) ( )[ ]∑ ⋅−=

ixxx iSiSH 2log (28)

Capítulo 5: Caracterización de Texturas.

Métodos Estadísticos Basados en la Transformada Wavelet

“Extracción de características de textura basada en la transformada Wavelet discreta” 29

( ) ∑=i

jiy CiS , ( ) ( )[ ]∑ ⋅−=j

yyy iSjSH 2log (29)

( ) ( )[ ]∑ ⋅⋅−=ji

yxjixy jSiSCH,

2, log (30)

Este descriptor nos mide la semejanza de la imagen consigo misma desplazada. Algunas propiedades de la correlación son:

• Un objeto tiene más alta correlación dentro de él que entre objetos adyacentes.

• Píxeles cercanos están más correlacionados entre si que los píxeles más distantes

El vector de características de co-ocurrencia estará formado por 96 elementos. A partir de cada sub-

imagen de detalles se calculan sus cuatro GLCM (Grey Level Co-ocurrence Matriz), una en cada orientación principal. De las matrices GLCM 0º, 45º, 90º y 135º de la sub-imagen se obtienen las ocho características anteriores (son 24 características en total) y se promedian para tener las ocho características de co-ocurrencia que definen una sub-imagen de detalles. Como una imagen de textura se descompone en doce sub-imágenes de detalles (tres en cada nivel y cuatro niveles de descomposición) y de las que se calculan ocho medidas, la imagen de textura se identifica por 96 (12 sub-matrices * 8 descriptores) características de co-ocurrencia.

El último vector de características utilizado para determinar texturas se construye uniendo las 24

características de histograma con las 96 características de co-ocurrencia, obteniendo un vector de 120 elementos.