visio per computador presentació

60
Característiques (image features) Felipe Lumbreras Dept. Ciències de la Computació / Centre de Visió per Computador Universitat Autònoma de Barcelona http://www.cvc.uab.es/shared/teach/a102784/

Upload: others

Post on 07-Nov-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Visio per Computador presentació

Característiques(image features)

Felipe LumbrerasDept. Ciències de la Computació / Centre de Visió per Computador

Universitat Autònoma de Barcelonahttp://www.cvc.uab.es/shared/teach/a102784/

Page 2: Visio per Computador presentació

Característiques

Porció d’informació que permet resoldre una tasca.

"interesting" part of an image (Wikipedia)

• dos tipus de característiques:– Globals: propietats globals o una part d’ella que la descriuen

• Nivell de gris mitjà, color mitjà, principals colors, histograma, histograma color.

– Locals: part d’una imatge, detectable i amb entitat pròpia• punts, contorns, regions

Page 3: Visio per Computador presentació

Característiques

• de Global a Local

– Global

– Segment d’imatges (objectes)

– Mostreig (sliding window)

– Local

Page 4: Visio per Computador presentació

Característiques locals

• Què són– Porció d’una imatge que difereix del seu entorn. Associada a un canvi en

alguna propietat: intensitat, color, textura.– Poden ser:

• punts (corners, interest points), • contorns o parts (edges, ridges) o • petites regions (blobs)

• Cóm les trobem – Amb algorisme de Detecció/Extracció de característiques

• Localització/Descripció– Localització: posició més o menys precisa.– Descripció: mesures que es prenen al voltant de la característica que

permeten distingir-la o comparar-la amb d’altres.Depenent de l’aplicació prevaldrà més una o l’altra o totes dues.

Page 5: Visio per Computador presentació

Característiques locals

• Perquè les fem servirS’han usat amb èxit en moltes disciplines i aplicacions:

– Elements amb significació pròpia dins del context de l’aplicació: • Contorns relacionats amb carreteres en imatges aèries.

• Taques com a impureses en control de qualitat.

– Donen un conjunt limitat, ben localitzat i individualment identificable de punts d'ancoratge• Seguiment (tracking)

• Reconstrucció 3D

• Mosaics

– Poden ser usades com a una representació robusta de la imatge• Reconeixement d’objectes

• Classificació d’escenes

• Anàlisi de textures

• Cerca d’imatges

Page 6: Visio per Computador presentació

Característiques locals• Propietats (ideals):

– Repetibilitat: per imatges del mateix objecte o escena amb diferents condicions de captura, les característiques que trobem en una imatges han d'aparèixer en alt nombre en d’altres• Invariància: que no es vegin afectades o poc afectades per transformacions (intensitat,

geometria)• Robustesa: que no es vegin molt afectades per soroll, discretització, compressió,

desenfocament, ...

– Diferenciació/Informació: suficientment variada per poder distingir-la d’altres i posar-la en correspondència

– Localització: com a característiques locals han de estar lligades a punts molt concrets amb poca incertesa

– Quantitat: el nombre suficient per la tasca i la mida dels objectes implicats– Precisió: localització, escala i forma precisa– Eficiència: càlcul ràpid

• Escala: factor important a tenir en compte per obtenir robustesa, invariància i precisió. Permet treballar amb imatges adquirides de forma diferent, a diferents distàncies.

Page 7: Visio per Computador presentació

Propietats

Page 8: Visio per Computador presentació

Puntuals

Page 9: Visio per Computador presentació

Punts (cantonades)

Regió planano hi ha canvis en totes les direccions

Contornno hi ha canvis en la direcció del contorn

Cantonadacanvis significatius a totes les direccions

Page 10: Visio per Computador presentació

Detectors de cantonades

• Detector de HarrisProposat al 1988. Basat en l’anàlisi del tensor estructural 2D (matriu de derivades segones, second moment matrix).

• Detector de SUSAN Smallest Univalue Segment Assimilating Nucleus. Utilitza un enfoc morfològic (conjunts).

• Harris-LaplaceComença amb un Harris. Després determina la millor escala mitjançant el laplacià.

• Harris-AffineComença amb un Harris-Laplace. Després estima la forma afí (encaixa una el·lipse ), normalitza la forma afí (la converteix en un cercle). Torna a detectar punts en la imatge normalitzada.

Page 11: Visio per Computador presentació

Detector de Harris

intensitatintensitats

traslladadesfinestra

ofunció finestra w(u,v) =

gaussiana1 dins , 0 fora

• En una cantonada la intensitat canvia significativament en moltes direccions = Examinarem els canvis de intensitat deguts a translacions en una finestra local (SSD: sum of squared differences S).

Page 12: Visio per Computador presentació

Detector de Harris

La intensitat traslladada s’aproxima per una expansió de Taylor

Per tant

Que podem escriure en format matricial com

On A es el tensor estructural 2D

Page 13: Visio per Computador presentació

Detector de Harris

Canviem el problema d’examinar els canvis d’intensitat deguts a translacions per analitzar el comportament de la matriu A

→ Anàlisi dels valors propis1, 2 valors propis de A

Page 14: Visio per Computador presentació

Detector de Harris

1

2

“Cantonada”1 i 2 grans,1 ~ 2;S creix en totes direccions

1 i 2 petits;

S és quasi constant en totes direccions

“Contorn”1 >> 2

“Contorn”2 >> 1

“Pla”regió

Classificació dels punts de la imatge basat en els valors propis de A :

Page 15: Visio per Computador presentació

Detector de Harris

Funció de resposta de les cantonades ( R ):

R = det(A) - k (trace A)2

R = 12 - k (1 + 2 )2

on k es un valor constant (empíric) , k = [0.04,0.06]

Page 16: Visio per Computador presentació

Detector de Harris

1

2

“Cantonada”

“Contorn”

“Contorn”

“Pla”regió

• R depèn només dels valors propis de A

• R és gran per les cantonades

• R és negatiu amb magnitud gran pels contorns

• |R| és petit per les regions planes

R > 0

R < 0

R < 0|R| petit

Page 17: Visio per Computador presentació

Detector de Harris (algorisme)

• Derivades primeres d’un

punt de la imatge (u,v):

• Per cada punt computar:

• Matriu d’estructura local (M)

[abans anomenada A]

• Suavització amb una

gaussiana (G)

),(),( vux

IvuI x

=

),(),( vuy

IvuI y

=

),(),(),(

),,(),(

),,(),(

2

2

vuIvuIvuC

vuIvuB

vuIvuA

yx

y

x

=

=

=

=

=

BC

CA

III

IIIM

yyx

yxx

2

2

=

=

BC

CA

GBGC

GCGAM

Page 18: Visio per Computador presentació

Detector de Harris (algorisme)

• Diagonalitzem

• On 1, 2 són el valors propis de definits per:

• Descriu un punt en funció dels valors propis, mitjançant la funció de resposta de les cantonades

• Una bona cantonada ha de tenir canvis grans d’intensitat en totes direccions, R ha de ser gran i positiu.

=

2

1

0

0

M

( )222 422

1CBBAABA ++−+

( )2

1 2 1 2R k = − +

M

M

Page 19: Visio per Computador presentació

Original

Detector de Harris

Page 20: Visio per Computador presentació

funció de resposta a cantonades R

Detector de Harris

Page 21: Visio per Computador presentació

punts amb resposta alta: R > llindar

Detector de Harris

Page 22: Visio per Computador presentació

màxims locals de R

Detector de Harris

Page 23: Visio per Computador presentació

Resultat final

Detector de Harris

Page 24: Visio per Computador presentació

Detector de Harris (propietats)

• Invariant a Rotació: la resposta R es invariant a rotació.

• Invariància parcial al canvi afí d’intensitat (usem derivades)– Invariància a desplaçaments en intensitat: I → I+b

– Canvi de contrast: I → aI

La el.lipse rota però

la seva forma (valors

propis) resta igual.

R

x (image coordinate)

threshold

R

x (image coordinate)

Page 25: Visio per Computador presentació

Detector de Harris-Laplace

• Combina Harris amb un espai escala gaussià.

• Usem finestres gaussianes amb escales prefixades.

• S’escull l’escala que maximitza el LoG en aquest rang.

• Obtenim cantonades i l’escala on millor està representada

Page 26: Visio per Computador presentació

Detector de Harris-Affine

• Detecció inicial amb el detector Harris-Laplace

• Estimar la forma afí amb la matriu estructural 2D

• Normalitzar les regions afins a una circular

• Detectar novament posicions i escales en la imatge anterior

• Tornar al punt 2 si els valors propis varien

Page 27: Visio per Computador presentació

Segments

Page 28: Visio per Computador presentació

Contorns

• Què causa els contorns– Canvi de profunditat

– Canvi en la orientació

– Canvi de reflectància

– Canvi d'il·luminació

Christopher Rasmussen

Page 29: Visio per Computador presentació

Segments

• Contorns (edges): – Zones de la imatge on la magnitud del gradient té valors màxims.

• Valls/Crestes (ridges):– Corba que representa un màxim o mínim local

• Models

– Esglaó (contorn)

– Cresta

– Vall

Sudden

step edge

Slanted

step edge

Smooth

step edge

Planar

edge

Roof edgeLine edge

Page 30: Visio per Computador presentació

Gradient

• El gradient es el vector que apunta en la direcció de major canvi.

• Podem calcular d’ell la seva magnitud i la seva orientació

• Els contorns estan associats a valors alts de la magnitud del gradient

),(,)()grad( yx IIy

I

x

III =

==

)/arctan(

||22

xy

yx

II

II

=

+=

Page 31: Visio per Computador presentació

Suavització/Regularització

• Permet reduir el soroll i controlar l’escala d’anàlisi.

• La derivació amplifica el soroll. Podem suavitzar primer abans de derivar (regularitzar).

• Es pot suavitzar amb una gaussiana que té bones propietats (no amplifica certes freqüències).

• O directament, fer servir per derivar la convolució amb la derivada de la gaussiana.

Page 32: Visio per Computador presentació

Detectors de contorns

• Differential gradient operator

– Roberts

– Sobel

– Prewitt

• Laplacian of Gaussian

• Canny

Page 33: Visio per Computador presentació

Detectors de contorns

=

−−−

111

000

111

101

101

101

,)( imimimPrewitt

=

−−−

121

000

121

101

202

101

,)( imimimSobel

=

− 01

10

10

01,)( imimimRoberts

Page 34: Visio per Computador presentació

Sobel

Sobel im im im( ) =

+

− − −

1 0 1

2 0 2

1 0 1

1 2 1

0 0 0

1 2 1

2 2

Original Sobel Original Sobel

Page 35: Visio per Computador presentació

Laplacià

• Laplacià

• Aproximació numèrica

• Els creuaments per zero del laplacià donen els contorns de la imatge

2

2

2

22 )()()(

y

I

x

IIIILaplacian

+

===

−−

=

010

141

010

)( imimLaplacian

Page 36: Visio per Computador presentació

Laplacià

• Desavantatge: resultat més sorollós

• Solució: suavitzar amb una gaussiana

• Avantatge: dóna com a resultat contorns tancats

Original LoG Creuaments

Original Laplacià Creuaments

Page 37: Visio per Computador presentació

Detector de Canny

• Passos:

1. Calculem el gradient amb les derivades de la gaussiana

2. Apliquem supressió dels píxels no màxims (non-maximal supression)

• Aprimem contorns de varis píxels fins a amplada 1.

3. Unió i binarització• Definim llindars inferior i superior

• Acceptem tots els contorns per sobre del llindar inferior que estan connectats a contorns per sobre del llindar superior

• Matlab: edge(I, ‘canny’)

Page 38: Visio per Computador presentació

Detector de Canny2.- Norm of the gradient1.- Original

3.- Thresholding 4.- Thinning (non-maximum suppression)

Page 39: Visio per Computador presentació

Detector de Canny

• Escala

• L’elecció de depèn del comportament desitjat:– gran detecta contorns de gran escala

– petita detecta característiques petites

low high original

Page 40: Visio per Computador presentació

Agrupació

• Detecció de primitives d’alt nivell a partir de fragments de contorns o conjunt de punts

• Transformada de Hough per a línies (SLHT)

• Transformada de Hough per a cercles (CHT)

• Transformada de Hough generalitzada (GHT)

Page 41: Visio per Computador presentació

Transformada de Hough per a línies

• Transforma punts associats a un patró dins un espai de paràmetres on es poden representar d’una forma compacta.

• Exemple per a línies y=ax+b

• Solució: recta → r = x sin + y cos

y b

?

problema: a→

espai imatgex a

espai de paràmetres

Page 42: Visio per Computador presentació

Straight Line Hough Transform

• Passos:– Detecció de punts característics: seleccionar el píxels depenent de

les seves propietats locals (magnitud del gradient, orientació, ...) que seran transformats.

– Mapejat de la transformació: cada punt característic es mapeja en el espai de paràmetres (array d’acumulació o de votació).

– Detecció de pics: binarització local o global en l’array d’acumulació.

x

y

ri

i

r

180oi

rir = x sin + y cos

peak

Page 43: Visio per Computador presentació

ExempleInput image

Boundary detection

Hough

space

Result

−r

+r

x

y

Page 44: Visio per Computador presentació

Altres Transformades de Hough

• Cercles (CHT): – Espai de votació tridimensional (x,y,r).

– Cada punt vota en aquest espai de vocació en un con

• General (GHT):Definició del model:

– Per un objecte (contorn obert o tancat), definim un centre intern

– Per cada punt del contorn calculem el gradient (direcció del contorn)

– Del centre a cada punt del contorn calculem el radi i l’angle

– Guardem per cada direcció del contorn tots els radi-angle (R-table)

Votació:

– Generem imatge de contorns o partint de contorns. Calculem els gradients d’aquests.

– Per cada punt votem en tots els radi-angle que tinguem associats a aquesta direcció del contorn.

Page 45: Visio per Computador presentació

Regions

Page 46: Visio per Computador presentació

Regions

• Taques (blobs)

• Regions basades en intensitat

• Maximally Stable Extremal Region (MSER)

• Superpixels

Page 47: Visio per Computador presentació

Regions

• MSER– Regions estables, resten sense canvis en un rang de llindars.

• Superpixels– Agrupació compacta de píxels amb algun criteri

Page 48: Visio per Computador presentació

Descriptors

Page 49: Visio per Computador presentació

Descriptors

• Puntuals– Haar like

– Edge Orientation Histograms (EOH)

– Scale-Invariant Feature Transform (SIFT), SURF, BRISK, FREAK,...

– Histogram of Oriented Gradients (HOG)

– Local Binary Pattern (LBP)

• De forma– Simples: Àrea, Circularitat, Excentricitat, Orientació, Convexitat,

Moments,...

– Angular Radial Transform

– Shape contexts

– Shapemes

– Shape signature

– Boundary moments

– Fourier Descriptors

Page 50: Visio per Computador presentació

Haar-like

• Idea: diferència d’intensitat entre regions rectangulars

Page 51: Visio per Computador presentació

EOH

• Idea: relació entre les sumes locals de les magnituds del gradient de dues orientacions

Page 52: Visio per Computador presentació

SIFT

• Idea: localització en espai escala de DoG i descripció amb histogrames de gradients locals suavitzats.

Page 53: Visio per Computador presentació

SIFT

• Característiques invariants, “keypoints”– Estableix un marc invariant

• Màxims/mínims de l’espai escala DoG→ x, y, s• Màxim de la distribució dels gradients locals → q

– Forma vector descripció• Histograma de gradients locals suavitzats• 128 dimensions

• Les característiques SIFT són:– Geomètricament invariants a transformacions de

similaritats,• Bastant robust a canvis afins

– Parcialment invariants a canvis d'il·luminació i a canvis del punt de vista 3D

– Altament distintius

Page 54: Visio per Computador presentació

SIFT

• El contingut de la imatge es transforma en coordenades de característiques locals que són invariants a translació, rotació, escala I d’altres paràmetres.

Page 55: Visio per Computador presentació

HOG

• Idea: histograma d’orientacions del gradient ponderat per la magnitud del gradient

Page 56: Visio per Computador presentació

LBP

• Idea: descriu cada píxel a partir de les diferències locals d’intensitat en el veïnatge

Page 57: Visio per Computador presentació

Aplicacions

Brown and Lowe, ICCV 03

• Mosaics

Page 58: Visio per Computador presentació

Aplicacions

Quak09

• Cerca en bases de dades d’imatges

Page 59: Visio per Computador presentació

Aplicacions

Wojek09

• Detecció de vianants

Page 60: Visio per Computador presentació

Bibliografia

• T. Tuytelaars and K. Mikolajczyk. Local Invariant FeatureDetectors: A Survey. Fundations and Trends ® in ComputerGraphics and Vision, Vol. 3, No. 3, (2007) 177-280.

• E. Trucco, A. Verri. Introductory Techniques for 3-D ComputerVision. Prentice Hall (1998). Chap 4 and 5.

• Apunts del Master de Computer Vision:– Josep Lladós

– Marçal Rusiñol

– David Gerónimo