dicionario corpus

11
O Dicionario CLUVI inglés-galego A lingua galega na informática: desenvolvemento e integración de recursos lingüísticos IX Congreso da Asociación Internacional de Estudos Galegos TALG Grupo de investigación Tecnoloxías e Aplicacións da Lingua Galega

Upload: alberto-a-lugris

Post on 27-Jun-2015

424 views

Category:

Education


0 download

DESCRIPTION

PPT para a ponencia do congreso da AIEG de xullo de 2009. Sobre o dicionario cluvi e o corpus

TRANSCRIPT

Page 1: Dicionario Corpus

O Dicionario CLUVI inglés-galego

A lingua galega na informática: desenvolvemento e integración

de recursos lingüísticos

IX Congreso da Asociación Internacional de Estudos Galegos

TALGGrupo de investigación

Tecnoloxías e Aplicaciónsda Lingua Galega

Page 2: Dicionario Corpus

http://sli.uvigo.es/dicionario

Page 3: Dicionario Corpus

Dicionario CLUVI inglés-galego

• Destinatarios:– escolares e estudantes universitarios– profesionais da tradución e da interpretación

• Tamaño: – 20.000 lemas en inglés– 30.000 traducións galegas dos lemas– 60.000 exemplos reais e contextualizados

Page 4: Dicionario Corpus

Corpus CLUVICorpus paralelo, de traducións ao galego ou do galego, de máis de 20 millóns de palabras. de libre consulta na web

http://sli.uvigo.es/CLUVI/

O corpus CLUVI

Page 5: Dicionario Corpus

Corpus CLUVI

LOGALIZA

InformáticaEN-GL

2,4 M

UNESCO

Socioloxía EN-GL-ES-FR

3,7 M

TECTRATECTRA

LiterarioLiterarioEN-GL

1,5 M

VEIGA

SubtítulosEN-GL

0,8 M

Dicionario CLUVI inglés-galego

+8 millóns de palabras

Page 6: Dicionario Corpus

windows_15 ->fiestras_0.84175086,cristais_0.07912458,garaxe_0.07912458

longing_3 ->morriña_0.36656892,señardade_0.15835778,francia_0.15835778,formara_0.15835778,período_0.15835778

bed_96 ->cama_0.83687806,(null)_0.04077505,leito_0.03240258,deitar_0.02170320,entre_0.01576635,dei_0.01096033,durmir_0.01087335,sentárase_0.01054715

NATools (Simões e Almeida, 2003)

Page 7: Dicionario Corpus

DTD do diccionario CLUVI

<!ELEMENT dicionario (entrada+)><!ELEMENT entrada (lema, super_cat+)><!ELEMENT lema (#PCDATA)><!ELEMENT super_cat (categoria, acepcion+)><!ELEMENT categoria (#PCDATA)><!ELEMENT acepcion (plurilex?, traducion, exemplo)><!ELEMENT traducion (#PCDATA)><!ELEMENT plurilex (#PCDATA)><!ELEMENT exemplo (en, gl, fonte)><!ELEMENT en (#PCDATA)><!ELEMENT gl (#PCDATA)><!ELEMENT fonte (#PCDATA)>

Page 8: Dicionario Corpus

<entrada><lema>paint</lema><super_cat><categoria>transitive verb</categoria><acepcion><traducion>pintar</traducion><exemplo><en>"Perhaps I shall be able to @paint# your picture some day," said Edna with a smile when they were seated. </en><gl>--Quizabes poida @pinta-lo# seu retrato algún día --dixo Edna, cun sorriso, mentres sentaban. </gl><fonte>ESP (1514) </fonte></exemplo> </acepcion> </super_cat> <super_cat> <categoria>noun</categoria><acepcion><traducion>pintura</traducion><exemplo><en>After surveying the sketch critically she drew a broad smudge of @paint# across its surface, and crumpled the paper between her hands. </en><gl>E despois de botarlle unha ollada crítica ó bosquexo, atravesouno cun amplo brochazo de @pintura# e engurrouno entre as mans. </gl><fonte>ESP (274) </fonte></exemplo> </acepcion> </super_cat></entrada>

Page 9: Dicionario Corpus
Page 10: Dicionario Corpus
Page 11: Dicionario Corpus

Interface de consulta do dicionario e selección de entradas