visio per computador presentació

Característiques(image features)

Felipe LumbrerasDept. Ciències de la Computació / Centre de Visió per Computador

Universitat Autònoma de Barcelonahttp://www.cvc.uab.es/shared/teach/a102784/

http://www.cvc.uab.es/shared/teach/a102784/

Característiques

Porció d’informació que permet resoldre una tasca.

"interesting" part of an image (Wikipedia)

• dos tipus de característiques:– Globals: propietats globals o una part d’ella que la descriuen

• Nivell de gris mitjà, color mitjà, principals colors, histograma, histograma color.

– Locals: part d’una imatge, detectable i amb entitat pròpia• punts, contorns, regions

Característiques

• de Global a Local

– Global

– Segment d’imatges (objectes)

– Mostreig (sliding window)

– Local

Característiques locals

• Què són– Porció d’una imatge que difereix del seu entorn. Associada a un canvi en

alguna propietat: intensitat, color, textura.– Poden ser:

• punts (corners, interest points), • contorns o parts (edges, ridges) o • petites regions (blobs)

• Cóm les trobem – Amb algorisme de Detecció/Extracció de característiques

• Localització/Descripció– Localització: posició més o menys precisa.– Descripció: mesures que es prenen al voltant de la característica que

permeten distingir-la o comparar-la amb d’altres.Depenent de l’aplicació prevaldrà més una o l’altra o totes dues.

Característiques locals

• Perquè les fem servirS’han usat amb èxit en moltes disciplines i aplicacions:

– Elements amb significació pròpia dins del context de l’aplicació: • Contorns relacionats amb carreteres en imatges aèries.

• Taques com a impureses en control de qualitat.

– Donen un conjunt limitat, ben localitzat i individualment identificable de punts d'ancoratge• Seguiment (tracking)

• Reconstrucció 3D

• Mosaics

– Poden ser usades com a una representació robusta de la imatge• Reconeixement d’objectes

• Classificació d’escenes

• Anàlisi de textures

• Cerca d’imatges

Característiques locals• Propietats (ideals):

– Repetibilitat: per imatges del mateix objecte o escena amb diferents condicions de captura, les característiques que trobem en una imatges han d'aparèixer en alt nombre en d’altres• Invariància: que no es vegin afectades o poc afectades per transformacions (intensitat,

geometria)• Robustesa: que no es vegin molt afectades per soroll, discretització, compressió,

desenfocament, ...

– Diferenciació/Informació: suficientment variada per poder distingir-la d’altres i posar-la en correspondència

– Localització: com a característiques locals han de estar lligades a punts molt concrets amb poca incertesa

– Quantitat: el nombre suficient per la tasca i la mida dels objectes implicats– Precisió: localització, escala i forma precisa– Eficiència: càlcul ràpid

• Escala: factor important a tenir en compte per obtenir robustesa, invariància i precisió. Permet treballar amb imatges adquirides de forma diferent, a diferents distàncies.

Propietats

Puntuals

Punts (cantonades)

Regió planano hi ha canvis en totes les direccions

Contornno hi ha canvis en la direcció del contorn

Cantonadacanvis significatius a totes les direccions

Detectors de cantonades

• Detector de HarrisProposat al 1988. Basat en l’anàlisi del tensor estructural 2D (matriu de derivades segones, second moment matrix).

• Detector de SUSAN Smallest Univalue Segment Assimilating Nucleus. Utilitza un enfoc morfològic (conjunts).

• Harris-LaplaceComença amb un Harris. Després determina la millor escala mitjançant el laplacià.

• Harris-AffineComença amb un Harris-Laplace. Després estima la forma afí (encaixa una el·lipse ), normalitza la forma afí (la converteix en un cercle). Torna a detectar punts en la imatge normalitzada.

Detector de Harris

intensitatintensitats

traslladadesfinestra

ofunció finestra w(u,v) =

gaussiana1 dins , 0 fora

• En una cantonada la intensitat canvia significativament en moltes direccions = Examinarem els canvis de intensitat deguts a translacions en una finestra local (SSD: sum of squared differences S).

Detector de Harris

La intensitat traslladada s’aproxima per una expansió de Taylor

Per tant

Que podem escriure en format matricial com

On A es el tensor estructural 2D

Detector de Harris

Canviem el problema d’examinar els canvis d’intensitat deguts a translacions per analitzar el comportament de la matriu A

→ Anàlisi dels valors propis1, 2 valors propis de A

Detector de Harris

1

2

“Cantonada”1 i 2 grans,1 ~ 2;S creix en totes direccions

1 i 2 petits;

S és quasi constant en totes direccions

“Contorn”1 >> 2

“Contorn”2 >> 1

“Pla”regió

Classificació dels punts de la imatge basat en els valors propis de A :

Detector de Harris

Funció de resposta de les cantonades ( R ):

R = det(A) - k (trace A)2

R = 12 - k (1 + 2 )2

on k es un valor constant (empíric) , k = [0.04,0.06]

Detector de Harris

1

2

“Cantonada”

“Contorn”

“Contorn”

“Pla”regió

• R depèn només dels valors propis de A

• R és gran per les cantonades

• R és negatiu amb magnitud gran pels contorns

• |R| és petit per les regions planes

R > 0

R < 0

R < 0|R| petit

Detector de Harris (algorisme)

• Derivades primeres d’un

punt de la imatge (u,v):

• Per cada punt computar:

• Matriu d’estructura local (M)

[abans anomenada A]

• Suavització amb una

gaussiana (G)

),(),( vux

IvuI x

=

),(),( vuy

IvuI y

=

),(),(),(

),,(),(

),,(),(

2

2

vuIvuIvuC

vuIvuB

vuIvuA

yx

y

x

=

=

=

=

=

BC

CA

III

IIIM

yyx

yxx

2

2

=

=

BC

CA

GBGC

GCGAM

Detector de Harris (algorisme)

• Diagonalitzem

• On 1, 2 són el valors propis de definits per:

• Descriu un punt en funció dels valors propis, mitjançant la funció de resposta de les cantonades

• Una bona cantonada ha de tenir canvis grans d’intensitat en totes direccions, R ha de ser gran i positiu.

=

2

1

0

0

M

( )222 422

1CBBAABA ++−+

( )2

1 2 1 2R k = − +

M

M

Original

Detector de Harris

funció de resposta a cantonades R

Detector de Harris

punts amb resposta alta: R > llindar

Detector de Harris

màxims locals de R

Detector de Harris

Resultat final

Detector de Harris

Detector de Harris (propietats)

• Invariant a Rotació: la resposta R es invariant a rotació.

• Invariància parcial al canvi afí d’intensitat (usem derivades)– Invariància a desplaçaments en intensitat: I → I+b

– Canvi de contrast: I → aI

La el.lipse rota però

la seva forma (valors

propis) resta igual.

R

x (image coordinate)

threshold

R

x (image coordinate)

Detector de Harris-Laplace

• Combina Harris amb un espai escala gaussià.

• Usem finestres gaussianes amb escales prefixades.

• S’escull l’escala que maximitza el LoG en aquest rang.

• Obtenim cantonades i l’escala on millor està representada

Detector de Harris-Affine

• Detecció inicial amb el detector Harris-Laplace

• Estimar la forma afí amb la matriu estructural 2D

• Normalitzar les regions afins a una circular

• Detectar novament posicions i escales en la imatge anterior

• Tornar al punt 2 si els valors propis varien

Segments

Contorns

• Què causa els contorns– Canvi de profunditat

– Canvi en la orientació

– Canvi de reflectància

– Canvi d'il·luminació

Christopher Rasmussen

Segments

• Contorns (edges): – Zones de la imatge on la magnitud del gradient té valors màxims.

• Valls/Crestes (ridges):– Corba que representa un màxim o mínim local

• Models

– Esglaó (contorn)

– Cresta

– Vall

Sudden

step edge

Slanted

step edge

Smooth

step edge

Planar

edge

Roof edgeLine edge

Gradient

• El gradient es el vector que apunta en la direcció de major canvi.

• Podem calcular d’ell la seva magnitud i la seva orientació

• Els contorns estan associats a valors alts de la magnitud del gradient

),(,)()grad( yx IIy

I

x

III =

==

)/arctan(

||22

xy

yx

II

II

=

+=

Suavització/Regularització

• Permet reduir el soroll i controlar l’escala d’anàlisi.

• La derivació amplifica el soroll. Podem suavitzar primer abans de derivar (regularitzar).

• Es pot suavitzar amb una gaussiana que té bones propietats (no amplifica certes freqüències).

• O directament, fer servir per derivar la convolució amb la derivada de la gaussiana.

Detectors de contorns

• Differential gradient operator

– Roberts

– Sobel

– Prewitt

• Laplacian of Gaussian

• Canny

Detectors de contorns

=

−−−

−

−

−

111

000

111

101

101

101

,)( imimimPrewitt

=

−−−

−

−

−

121

000

121

101

202

101

,)( imimimSobel

=

−

− 01

10

10

01,)( imimimRoberts

Sobel

Sobel im im im( ) =

−

−

−

+

− − −

1 0 1

2 0 2

1 0 1

1 2 1

0 0 0

1 2 1

2 2

Original Sobel Original Sobel

Laplacià

• Laplacià

• Aproximació numèrica

• Els creuaments per zero del laplacià donen els contorns de la imatge

2

2

2

22 )()()(

y

I

x

IIIILaplacian

+

===

−

−−

−

=

010

141

010

)( imimLaplacian

Laplacià

• Desavantatge: resultat més sorollós

• Solució: suavitzar amb una gaussiana

• Avantatge: dóna com a resultat contorns tancats

Original LoG Creuaments

Original Laplacià Creuaments

Detector de Canny

• Passos:

1. Calculem el gradient amb les derivades de la gaussiana

2. Apliquem supressió dels píxels no màxims (non-maximal supression)

• Aprimem contorns de varis píxels fins a amplada 1.

3. Unió i binarització• Definim llindars inferior i superior

• Acceptem tots els contorns per sobre del llindar inferior que estan connectats a contorns per sobre del llindar superior

• Matlab: edge(I, ‘canny’)

Detector de Canny2.- Norm of the gradient1.- Original

3.- Thresholding 4.- Thinning (non-maximum suppression)

Detector de Canny

• Escala

• L’elecció de depèn del comportament desitjat:– gran detecta contorns de gran escala

– petita detecta característiques petites

low high original

Agrupació

• Detecció de primitives d’alt nivell a partir de fragments de contorns o conjunt de punts

• Transformada de Hough per a línies (SLHT)

• Transformada de Hough per a cercles (CHT)

• Transformada de Hough generalitzada (GHT)

Transformada de Hough per a línies

• Transforma punts associats a un patró dins un espai de paràmetres on es poden representar d’una forma compacta.

• Exemple per a línies y=ax+b

• Solució: recta → r = x sin + y cos

y b

?

problema: a→

espai imatgex a

espai de paràmetres

→

Straight Line Hough Transform

• Passos:– Detecció de punts característics: seleccionar el píxels depenent de

les seves propietats locals (magnitud del gradient, orientació, ...) que seran transformats.

– Mapejat de la transformació: cada punt característic es mapeja en el espai de paràmetres (array d’acumulació o de votació).

– Detecció de pics: binarització local o global en l’array d’acumulació.

x

y

ri

i

r

180oi

rir = x sin + y cos

peak

→

ExempleInput image

Boundary detection

Hough

space

Result

−r

+r

x

y

Altres Transformades de Hough

• Cercles (CHT): – Espai de votació tridimensional (x,y,r).

– Cada punt vota en aquest espai de vocació en un con

• General (GHT):Definició del model:

– Per un objecte (contorn obert o tancat), definim un centre intern

– Per cada punt del contorn calculem el gradient (direcció del contorn)

– Del centre a cada punt del contorn calculem el radi i l’angle

– Guardem per cada direcció del contorn tots els radi-angle (R-table)

Votació:

– Generem imatge de contorns o partint de contorns. Calculem els gradients d’aquests.

– Per cada punt votem en tots els radi-angle que tinguem associats a aquesta direcció del contorn.

Regions

Regions

• Taques (blobs)

• Regions basades en intensitat

• Maximally Stable Extremal Region (MSER)

• Superpixels

Regions

• MSER– Regions estables, resten sense canvis en un rang de llindars.

• Superpixels– Agrupació compacta de píxels amb algun criteri

Descriptors

Descriptors

• Puntuals– Haar like

– Edge Orientation Histograms (EOH)

– Scale-Invariant Feature Transform (SIFT), SURF, BRISK, FREAK,...

– Histogram of Oriented Gradients (HOG)

– Local Binary Pattern (LBP)

• De forma– Simples: Àrea, Circularitat, Excentricitat, Orientació, Convexitat,

Moments,...

– Angular Radial Transform

– Shape contexts

– Shapemes

– Shape signature

– Boundary moments

– Fourier Descriptors

Haar-like

• Idea: diferència d’intensitat entre regions rectangulars

EOH

• Idea: relació entre les sumes locals de les magnituds del gradient de dues orientacions

SIFT

• Idea: localització en espai escala de DoG i descripció amb histogrames de gradients locals suavitzats.

SIFT

• Característiques invariants, “keypoints”– Estableix un marc invariant

• Màxims/mínims de l’espai escala DoG→ x, y, s• Màxim de la distribució dels gradients locals → q

– Forma vector descripció• Histograma de gradients locals suavitzats• 128 dimensions

• Les característiques SIFT són:– Geomètricament invariants a transformacions de

similaritats,• Bastant robust a canvis afins

– Parcialment invariants a canvis d'il·luminació i a canvis del punt de vista 3D

– Altament distintius

SIFT

• El contingut de la imatge es transforma en coordenades de característiques locals que són invariants a translació, rotació, escala I d’altres paràmetres.

HOG

• Idea: histograma d’orientacions del gradient ponderat per la magnitud del gradient

LBP

• Idea: descriu cada píxel a partir de les diferències locals d’intensitat en el veïnatge

Aplicacions

Brown and Lowe, ICCV 03

• Mosaics

Aplicacions

Quak09

• Cerca en bases de dades d’imatges

Aplicacions

Wojek09

• Detecció de vianants

Bibliografia

• T. Tuytelaars and K. Mikolajczyk. Local Invariant FeatureDetectors: A Survey. Fundations and Trends ® in ComputerGraphics and Vision, Vol. 3, No. 3, (2007) 177-280.

• E. Trucco, A. Verri. Introductory Techniques for 3-D ComputerVision. Prentice Hall (1998). Chap 4 and 5.

• Apunts del Master de Computer Vision:– Josep Lladós

– Marçal Rusiñol

– David Gerónimo

visio per computador presentació

Documents