interpretación semántica

44
N interpretación semántica 1 Interpretación semántica Interpretación semántica Semántica léxica Desambiguación de sentidos Word Sense Disambiguation (WSD)

Upload: nirav

Post on 12-Jan-2016

80 views

Category:

Documents


2 download

DESCRIPTION

Interpretación semántica. Interpretación semántica Semántica léxica Desambiguación de sentidos Word Sense Disambiguation (WSD). La Interpretación Semántica. semántica léxica "Pedro"  pedro. "rie"  (lambda(x), reir(x))) composición (lambda(x), reir(x)) pedro  reir(pedro). - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Interpretación semántica

PLN interpretación semántica 1

Interpretación semántica

• Interpretación semántica• Semántica léxica• Desambiguación de sentidos

• Word Sense Disambiguation (WSD)

Page 2: Interpretación semántica

PLN interpretación semántica 2

La Interpretación Semántica

• semántica léxica• "Pedro" pedro.

• "rie" (lambda(x), reir(x)))

• composición• (lambda(x), reir(x)) pedro reir(pedro).

• ¿Cómo llevar a cabo la IS? • función (o funciones) de composición

• momento de llevar a cabo la interpretación

Page 3: Interpretación semántica

PLN interpretación semántica 3

función de composición = lambda evaluación.

ORACION GN FV, (2 1)

GN np, (1)

FV vi, (1)

FV vt GN (1 2)

Pedro np, pedro

María np, maria

ríe vi, (lambda (x), reir(x))

ama a vt, ((lambda (x), (lambda (y), ama(y,x))))

Page 4: Interpretación semántica

PLN interpretación semántica 4

"Pedro rie"FRASE | SEM = (2 1) = (FV:SEM GN:SEM) = | ((lambda(x) reir(x)) pedro) = reir(pedro) | |_______GN | | SEM = (1) = (np:SEM) = pedro | | | |_______np | | SEM = pedro | | | Pedro |_______FV

| SEM = (1) = (vi:SEM) = (lambda(x) reir(x)) |_______vi

| SEM = (lambda(x) reir(x)) | ríe

ejemplo 1

Page 5: Interpretación semántica

PLN interpretación semántica 5

"Pedro ama a María"FRASE | SEM = (2 1) = (FV:SEM GN:SEM) = | ((lambda(x) amar(x,maria)) pedro) = amar(pedro,maria) |_______GN | | SEM = (1) = (np:SEM) = pedro | |________np | | SEM = pedro | Pedro |_______FV SEM=(1 2) = (vt:SEM GN:SEM) = (((lambda(y)

| (lambda(x) amar(x,y))) maria)=((lambda(x)amar(x,maria)) |_______vt | | SEM = ((lambda(y) (lambda(x) amar(x,y))) | ama a | |_______GN

| SEM = (1) = (np:SEM) = maria |_______np

| SEM = maria María

ejemplo 2

Page 6: Interpretación semántica

PLN interpretación semántica 6

Estrategias de la interpretacion semántica

• proceso posterior al análisis sintáctico• se parte del arbol de análisis

• unificacion del proceso sintáctico y semántico• existe un solo proceso de análisis.

• las categorias gramaticales se unifican: gramáticas semánticas

• proceso en paralelo sintaxis/semántica.• la semántica sirve para validar hipotesis de análisis sintáctico

• las interpretaciones (parciales) semánticas se construyen a medida que se construye el arbol de análisis.

• analizadores guiados por la semántica. • el papel de la sintaxis se reduce (si es que existe análisis sintáctico) a validar

determinadas hipotesis semánticas (ej. patrones de subcategorización o restricciones de selección) o a categorizar partes del texto.

Page 7: Interpretación semántica

PLN interpretación semántica 7

Análisis semántico independiente y posterior al sintáctico (Allen)

• aplicación de reglas de interpretación.

• <esquema> <descripcion parcial de la f.l.>

• el esquema consiste en un conjunto de restricciones selectivas, producto del análisis sintáctico.

• la representación semántica será una forma lógica. Las componentes de una construcción sintáctica darán lugar a formas lógicas parciales (con alguno de sus elementos aun no determinado).

• notacion:• * objeto (identificación única) descrito por la forma lógica

• t (<descritor>) tipo del constituyente

• v (<descritor>) interpretación semántica del constituyente

• ? elemento aún no determinado.

Page 8: Interpretación semántica

PLN interpretación semántica 8

Sintaxis de la forma lógica

• (<OPERADOR> <NOMBRE> <TIPO> <MODIFICADORES>)• Los operadores dependen del tipo de estructura a representar:

• Sintagmas nominales no cuantificados:• DEF/SING, DEF/PL, INDEF/SING, INDEF/PL

• Sintagmas nominales cuantificados• EACH, SOME

• Pronombres interrogativos• WH, WH/PL, WH/SING

• Pronombres personales• PRO

• Nombres propios• NAME

• Oraciones• ASSERT, Y/N_QUERY, WH_QUERY, COMMAND

• Sintagmas verbales• PAST, PRES, FUT, INF

• Relaciones• OR, AND, BUT

Page 9: Interpretación semántica

PLN interpretación semántica 9

Ejemplos de reglas de interpretacion 1

a green apple(NP DET a

ADJ (green)HEAD apple)

{(? A1 APPLE (COLOR C1 GR137)), (? A1 APPLE (UNRIPE C1))}

Page 10: Interpretación semántica

PLN interpretación semántica 10

Ejemplos de reglas de interpretacion 2

The man laughed(S SUBJ (NP DET the

HEAD manNUM {3s}SEM (DEF/SING M1 MAN))

MAIN-V laughTENSE past)

(? L1 LAUGH

[AGENT (DEF/SING M1 MAN)])

Page 11: Interpretación semántica

PLN interpretación semántica 11

Algoritmo de interpretacion semántica 1

• Se asume que cada subconstituyente se interpreta automáticamente cuando se efectúa la primera verificación semántica sobre él

• Se crea un nombre (reemplazando *)• Análisis del núcleo

• aplicar todas las reglas de interpretación indexadas por el núcleo

• mezclar las FLs parciales

• Para cada interpretación del núcleo aplicar lo siguiente hasta que todos los modificadores hayan actuado• seleccionar un modificador (componente sintáctico aún no interpretado)

• aplicar todas las reglas de interpretación indexadas por el head del modificador

• mezclar las FLs

• Producir las FLs mediante unificación

Page 12: Interpretación semántica

PLN interpretación semántica 12

Interpretacion de los constituyentes simples

• en general, la interpretacion de un constituyente comienza interpretando el nucleo de dicho constituyente (lo cual da lugar a llamadas recursivas al mecanismo de interpretacion).

• la interpretacion del nucleo suele obligar a la interpretacion de alguno de los modificadores. el resultado de esta fase (head analysis) es un conjunto de descripciones parciales correspondientes a la interpretacion del nucleo y una lista de modificadores ya utilizados).

• la siguiente fase (modifiers analysis) consiste en la interpretacion de los modificadores aun no interpretados y la incorporacion del resultado a la forma logica (parcial) que interpreta al componente.

Page 13: Interpretación semántica

PLN interpretación semántica 13

Algoritmo de unificación 1

• Unificador• ? unifica con cualquier cosa. • dos objetos identicos unifican• dos objetos con modificadores unifican si son

consistentes los modificadores correspondientes a los casos más internos.

• la unificación con valores ambiguos se realiza mediante la intersección de los valores de cada una de las interpretaciones parciales.

Page 14: Interpretación semántica

PLN interpretación semántica 14

Algoritmo de unificación 2

• ejemplos• (? R1 RUN [THEME (NAME J1 PERSON "John"]))

• (? R1 RUN [THEME (DEF/SING P1 PRINT-PRESS)])

• no son unificables• (? R1 RUN [AGENT (NAME J1 PERSON "John"]))

• (? R1 RUN [THEME (DEF/SING P1 PRINT-PRESS)])

• si lo son, dando lugar a:• (? R1 RUN [AGENT (NAME J1 PERSON "John"]))

[THEME (DEF/SING P1 PRINT-PRESS)])

Page 15: Interpretación semántica

PLN interpretación semántica 15

Algoritmo de interpretacion semántica 2

The dishwasher laughed(S SUBJ (NP DET the

NUM {3s}HEAD diswasher)

MAIN-V laugh TENSE past)

(the.1) (NP DET the NUM {3s}) (DEF/SING * ? ?)

(dishwasher.1) (NP HEAD dishwasher) (? * {PERSON_TYPE_43, APPLIANCE_TYPE_3} ?)

(laugh.1) (S SUBJ +animate MAIN_V laugh) (? * LAUGH [AGENT V(SUBJ)])

(past.1) (S TENSE PAST) (PAST ? ? ?)

Page 16: Interpretación semántica

PLN interpretación semántica 16

aplicacion de la regla laugh.1 ==> subj ha de tener la caracteristica +animate==> hay que analizar subj ==> hay que analizar np ==> aplicacion de the.1 y diswasher.1

(DEF/SING D1 ? ?)(? D1 {PERSON-TYPE-3,

APPLIANCE-TYPE-43} ?)

Algoritmo de interpretacion semántica 3

Page 17: Interpretación semántica

PLN interpretación semántica 17

se unifican las descripciones parcialesel resultado rellena el descriptor sem del np y del subj.

(S SUBJ (NP DET theNUM {3s}HEAD diswasherSEM (DEF/SING D1

{PERSON-TYPE-3, APPLIANCE-TYPE-43})

MAIN-V laughTENSE past)

Algoritmo de interpretacion semántica 4

Page 18: Interpretación semántica

PLN interpretación semántica 18

ahora ya es posible la aplicacion de la regla laugh.1, dando lugar a

(? L1 LAUGH [AGENT (DEF/SING D1 PERSON-TYPE-3)])

la interpretacion de TENSE, mediante la aplicacion de la regla past.1 da lugar a

(PAST ? ? ?)

y la posterior unificacion a

(PAST L1 LAUGH [AGENT (DEF/SING D1 PERSON-TYPE-3)])

Algoritmo de interpretacion semántica 5

Page 19: Interpretación semántica

PLN interpretación semántica 19

Jerarquía de reglas

(give.1) (S SUBJ +animate MAIN_V give) (? * GIVE1 [AGENT V(SUBJ)])(give.2) (S OBJ +physobj MAIN_V give) (? * GIVE1 [THEME V(OBJ)])(give.3) (S IOBJ +org MAIN_V give) (? * GIVE1 [TO_POSS V(IOBJ)])(give.4) (S MAIN_V give MODS (PP PREP to POBJ +org)) (? * TO_POSS [AGENT V(POBJ)])

action

obj/action

to/action inst/action

laugh

give break

Page 20: Interpretación semántica

PLN interpretación semántica 20

Interpretacion de los componentes complejos 1

The man gave the company a car at the fairgrounds

(S SUBJ (NP "the man")MAIN-V giveTENSE pastOBJ (NP "a car")IOBJ (NP "the company")MODS ([PP PREP at

POBJ (NP "the fairgrounds")]))

(? G1 GIVE1 [AGENT (DEF/SING M1 MAN)][THEME (INDEF/SING C1 AUTO)][TO-POS (DEF/SING C2 COMPANY_ORG)])

la aplicación del algoritmo sobre el núcleo da lugar a:

de forma que sólo TENSE y MODS quedan sin interpretar

Page 21: Interpretación semántica

PLN interpretación semántica 21

la interpretacion de tense, mediante la aplicacion de la regla past.1 da lugar a

(PAST ? ? ?)

la interpretacion de mods se realiza mediante la regla at.1. dando lugar a:

(? G1 ? (AT-LOC G1 (DEF/SING F1 FAIRGROUND)))

Interpretacion de los componentes complejos 2

Page 22: Interpretación semántica

PLN interpretación semántica 22

La posterior unificacion de estas dos formas con la resultante del nucleo produce:

(PAST G1 GIVE1 [AGENT (DEF/SING M1 MAN)][THEME (INDEF/SING C1 AUTO)][TO-POS (DEF/SING C2 COMPANY_ORG)](AT-LOC G1 (DEF/SING F1 FAIRGROUND)))

Interpretacion de los componentes complejos 3

Page 23: Interpretación semántica

PLN interpretación semántica 23

Gramáticas semánticas 1

• combinación de sintaxis y semántica en un único formalismo (normalmente gramáticas incontextuales)

• en las gramáticas semánticas los símbolos terminales son categorías semánticas.• tamaño mayor (número de reglas).

• número de palabras por categoría mucho menor.

• mayor ambigüedad.

• problema: generalidad

• aplicación: sistemas robustos y eficientes en dominios restringidos.• la construcción de la forma lógica a partir de la gramática se hace

directamente mediante simples extensiones.

Page 24: Interpretación semántica

PLN interpretación semántica 24

Gramáticas semánticas 2

RES_VP RESERVING, RES_MODSDEP_VP DEPARTING, DEP_MODS

RESERVING RESERVE_VERB, FLIGHTRES_MODS for, PERSONRES_MODS []

DEPARTING DEPART_VERBDEPARTING DEPART_VERB, SOURCE_LOCDEP_MODS DEP_MOD, DEP_MODSDEP_MODS []DEP_MOD to, DEST_LOCDEP_MOD from, SOURCE_LOC

Page 25: Interpretación semántica

PLN interpretación semántica 25

Semántica léxica

• Diccionarios semánticos• Ontologías

• Tipología

• Granularidad

• Ámbito

• Generalidad

• Ejemplos• UMLS

• WordNet

• EuroWordnet

• Otros recursos

Page 26: Interpretación semántica

PLN interpretación semántica 26

Ejemplo: UMLS

• UMLS (Unified Medical Language System) • National Library of Medecine, USA Department of Health and Human

Services

• Conjunto de recursos

• Metatesauro

• 330.000 conceptos, 735.000 términos

• Red Semántica

• Conjunto de categorías semánticas básicas (135 tipos semánticos, 51 relaciones)

• Enlaces con los Vocabularios fuente

• 30 fuentes (multilingües)

• Lexicón especializado

• con información morfo-sintáctica

Page 27: Interpretación semántica

PLN interpretación semántica 27

Ejemplo: WordNet

• WordNet • Universidad de Princeton (Fellbaum,1998)

• Conceptos lexicalizados (palabras, lexías)• synsets: conjunto de sinónimos (sinonimia en contexto)

• Cobertura en nombres, verbos, adjetivos y adverbios

• Relacionados entre sí por relaciones semánticas• sinonimia

• antonimia

• hiperonimia-hiponimia

• meronimia

• implicación

• causa

• ...

• Wn1.5, Wn1.6,Wn 1.7: 120.000 palabras, 100.000 synsets

• Wn2.0, Extended WordNet

http://www.cogsci.princeton.edu/~wn/

Page 28: Interpretación semántica

PLN interpretación semántica 28

{vehicle}

{conveyance; transport}

{car; auto; automobile; machine; motorcar}

{cruiser; squad car; patrol car; police car; prowl car} {cab; taxi; hack; taxicab; }

{motor vehicle; automotive vehicle}

{bumper}

{car door}

{car window}

{car mirror}

{hinge; flexible joint}

{doorlock}

{armrest}

hyperonym

hyperonym

hyperonym

hyperonymhyperonym

meronym

meronym

meronym

meronym

Fragmento de WN1.5

Page 29: Interpretación semántica

PLN interpretación semántica 29

EuroWordNet

• Proyecto LE-2 4003 Telematics Application Programme de la Unión Europea• Redes semánticas de diversas lenguas, integradas e interconectadas

• Inglés Universidad de Sheffield

• Holandés Univ. de Amsterdam

• Italiano I.L.C. de Pisa

• Español UB, UPC, U.N.E.D

• Cobertura básicamente nominal y verbal (50.000 acepciones por lengua)• Gran riqueza en las relaciones semánticas

• inter/intra linguales, inter/intra categoriales

• EWN2• Alemán, Checo, Estonio, Francés

• Extensiones al catalán, gallego y vasco• Extensiones y mejoras

http://www.hum.uva.nl/~ewn/http://www.lsi.upc.es/~nlp/

Page 30: Interpretación semántica

PLN interpretación semántica 30

Page 31: Interpretación semántica

PLN interpretación semántica 31

Levin classes (3100 verbs)

• 47 top level classes, 193 second and third level

• Basadas en pares de plantillas sintácticas.John broke the jar. / Jars break easily. / The jar broke.

John cut the bread. / Bread cuts easily. / *The bread cut. John hit the wall. / *Walls hit easily. / *The wall hit.

• Reflejan implícitamente los componentes semánticoscontact, directed motion, exertion of force, change of state

• Sinonimia, plantillas sintácticas (patrones de subcategorización)

Page 32: Interpretación semántica

PLN interpretación semántica 32

Intersective Levin classes

Page 33: Interpretación semántica

PLN interpretación semántica 33

Regular Sense Extensions

John pushed the chair. +force, +contact

John pushed the chairs apart. +ch-state

John pushed the chairs across the room. +ch-loc

John pushed at the chair. -ch-loc

The train whistled into the station. +ch-loc

The truck roared past the weigh station. +ch-loc

Page 34: Interpretación semántica

PLN interpretación semántica 34

VerbNet 1

• Lexicón verbal computacional• Asociaciones entre sintaxis y semántica

• Syntactic frames (patrones de subcategorización) y restricciones de selección.

• Información semántica léxica – estructura predicado/argumentos

• Componentes semánticos representados como predicados• Links a synsets de WordNet

• Entradas basadas en refinamiento de las clases de Levin

• Propiedades temporales inherentes representadas explícitamente• during(E), end(E), result(E)

Page 35: Interpretación semántica

PLN interpretación semántica 35

Hit Class

Basic Transitive A V P Manner (during(E), directedmotion,A)^

Manner (end(E), forceful,A)^

Contact(end(E),A,P)

Transitive with

Instrument

AVP with I Manner (during (E)directedmotion,I)^

Manner (end (E),forceful,I)^

Contact (end(E),I,P)

Conative AV at P Manner (during (E), directedmotion, A)

With/against alternation A V I against/on P

Manner(during (E), directedmotion, I)^

Manner(end(E), forceful, I)^

Contact (end(E), I, P)

<<MEMBERS>> [<hit1>, <kick1>,<slap1>…]<<THEMATIC ROLES>> Agent(A), Patient(P), Instrument(I)<<SELECT RESTRICTIONS>> Agent [+animate],

Patient [+concrete],Instrument [+concrete,-animate]

<<FRAMES and PREDICATES>>

VerbNet 2

Page 36: Interpretación semántica

PLN interpretación semántica 36

Penn Treebank

• 1,3 millones de palabras, 40.000 oraciones• Wall Street Journal y otras fuentes• POS tagged• Syntactically Parsed

Page 37: Interpretación semántica

PLN interpretación semántica 37

A TreeBanked Sentence

Analysts

S

NP-SBJ

VP

have VP

been VP

expecting NP

a GM-Jaguar pact

NP

that

SBAR

WHNP-1

*T*-1

S

NP-SBJVP

wouldVP

give

the US car maker

NP

NP

an eventual 30% stake

NP

the British company

NP

PP-LOC

in

(S (NP-SBJ Analysts) (VP have (VP been (VP expecting

(NP (NP a GM-Jaguar pact) (SBAR (WHNP-1 that)

(S (NP-SBJ *T*-1) (VP would

(VP give (NP the U.S. car maker)

(NP (NP an eventual (ADJP 30 %) stake) (PP-LOC in (NP the British

company))))))))))))

Analysts have been expecting a GM-Jaguar pact that would give the U.S. car maker an eventual 30% stake in the British company.

Page 38: Interpretación semántica

PLN interpretación semántica 38

Proposition Bank (Propbank)

Powell met Zhu Rongji

Proposition: meet(Powell, Zhu Rongji)Powell met with Zhu Rongji

Powell and Zhu Rongji met

Powell and Zhu Rongji had a meeting

. . .

When Powell met Zhu Rongji on Thursday they discussed the return of the spy plane.

meet(Powell, Zhu) discuss([Powell, Zhu], return(X, plane))

debate

consult

joinwrestle

battle

meet(Somebody1, Somebody2)

Generalización de oraciones a proposiciones

Page 39: Interpretación semántica

PLN interpretación semántica 39

The same sentence, PropBanked

Analysts

have been expecting

a GM-Jaguar pact

Arg0 Arg1

(S Arg0 (NP-SBJ Analysts) (VP have (VP been (VP expecting

Arg1 (NP (NP a GM-Jaguar pact) (SBAR (WHNP-1 that)

(S Arg0 (NP-SBJ *T*-1) (VP would

(VP give Arg2 (NP the U.S. car maker)

Arg1 (NP (NP an eventual (ADJP 30 %) stake)

(PP-LOC in (NP the British company))))))))))))that would give

*T*-1

the US car maker

an eventual 30% stake in the British company

Arg0

Arg2

Arg1

expect(Analysts, GM-J pact)give(GM-J pact, US car maker, 30% stake)

Page 40: Interpretación semántica

PLN interpretación semántica 40

Desambiguación de sentidos 1

• Sense (sentido, acepción)• distinción del significado de una palabra (word type)

observable en diferentes usos (word tokens)

• Word Sense Disambiguation (WSD)• dada una palabra (word token) en un contexto determinar cuál

es su sentido correcto

Page 41: Interpretación semántica

PLN interpretación semántica 41

Desambiguación de sentidos 2

• Problemas• Homonimia: significados no relacionados

• banco financiero, banco de pesca

• Polisemia: significados relacionados

• Polisemia regular (sistemática)• entré en (el edificio de) la universidad

• Metáfora• Me bebí un vaso de vino

• ¿Cuántos sentidos? ¿Cuáles?

• ¿Realmente es posible?

Page 42: Interpretación semántica

PLN interpretación semántica 42

Desambiguación de sentidos 3

• Problema similar al POS tagging• Se pueden intentar aproximaciones similares

• Pero es mucho más difícil

• Restricciones habituales• Yarowsky (1995)

• One sense per discourse

• One sense per collocation

Page 43: Interpretación semántica

PLN interpretación semántica 43

Desambiguación de sentidos 4

• Una posible solución (Naive Bayes)• Sea w la palabra a desambiguar

• Sean ck los posibles sentidos

• Sea el vector de contexto (p.ej. ventana fija de 100 palabras).

• Aplicando Bayes tenemos:

x

)|(maxarg' xcPc kck

Page 44: Interpretación semántica

PLN interpretación semántica 44

Desambiguación de sentidos 5

xinv

kkjc

kkc

kkc

kk

c

kc

jk

k

k

k

k

cPcvP

cPcxP

cPcxP

cPxP

cxP

xcPc

)(log)|(logmaxarg

)(log)|(logmaxarg

)()|(maxarg

)()(

)|(maxarg

)|(maxarg'