pragmatización en la automatización del reconocimiento de ... · pdf filedel...

Download PRAGMATIZACIÓN EN LA AUTOMATIZACIÓN DEL RECONOCIMIENTO DE ... · PDF fileDEL RECONOCIMIENTO DE PALABRAS COMPUESTAS EN ESPAÑOL ... Alemany Bolufer, Almela ... ALMELA PÉREZ, Procedimientos

If you can't read please download the document

Upload: doduong

Post on 09-Feb-2018

237 views

Category:

Documents


2 download

TRANSCRIPT

  • PRAGMATIZACIN EN LA AUTOMATIZACINDEL RECONOCIMIENTO DE PALABRAS COMPUESTASEN ESPAOL

    OCTAVIO SANTANA SUREZUniversidad de Las Palmas de Gran Canaria

    JOS R. PREZ AGUIARUniversidad de Las Palmas de Gran Canaria

    VIRGINIA GUTIRREZ RODRGUEZUniversidad de La Laguna

    RESUMEN

    El objetivo del presente trabajo es analizar desde un punto de vista pragmticouno de los procedimientos de formacin de palabras ms eficaces de la lengua es-paola la composicin que permita de manera formal y automtica tratar neolo-gismos compositivos. Se presentan un conjunto de reglas de carcter lxico y decambio grfico para el reconocimiento de compuestos, construidas a partir del com-portamiento mayoritario observado en las diversas bases documentales tratadas.Se exponen las normas aplicadas inducidas a partir de la realidad explorada quepermiten solventar barreras lingsticas a travs del dominio informtico y ponerde manifiesto las irregularidades encontradas en su tratamiento. Los mecanismosutilizados para la deteccin de las reglas atienden a la categora gramatical delcompuesto y a la de sus elementos componentes; con el propsito de garantizar unconocimiento suficiente de la casustica que envuelve a este proceso, se conside-ran solo aquellos compuestos consolidados o perfectos, donde el grado de fusinde los elementos del compuesto es total.

    PALABRAS CLAVE : composicin, neologismos, reglas de formacin, procesamien-to del lenguaje natural, lingstica computacional.

    PRAGMATIC AUTOMATION TO RECOGNITION OF COMPOUND WORDS INSPANISH

    ABSTRACT

    The aim of this study is to analyze from a pragmatic perspective one of the mosteffective words formation procedures of the language in the field of compounding,that allows us in a regularly and automatically way deal with compounding neolo-gisms. It is introduced a series of lexical and graphic rules for the recognition of

    LEA, XXXV/2, 2013, pgs. 181-XX.

  • compounds extracted from the behavior shown in the various documentary data-bases that have been used. There are shown the rules applied which are inducedfrom the reality observed, that let us to solve linguistic barriers through the infor-matic domain, and, in addition, point out the irregularities found in its treatment.The mechanisms used for the detection of these rules belong to the grammaticalcategory of the compound and to its elements: with the aim of guarantee a basicknowledge of casuistic that is involved in this process, they are considered validonly those solid or perfect compounds where the fusion degree of its elements iscomplete.

    KEY WORDS : composition, neologisms, formation rules, natural language pro-cessing, computational linguistic.

    INTRODUCCIN

    Aunque tradicionalmente la composicin ha jugado un papel secundariofrente a la derivacin en la formacin de palabras en espaol, tanto desde laperspectiva de su productividad como por la escasez de bibliografa, se obser-va la presencia cada vez mayor de este mecanismo para crear neologismosmorfosintcticos, en particular, neologismos compositivos, gracias al influjoprovocado por los lenguajes tcnicos, publicitarios, sociales, entre otros hoyen da, la composicin es sin duda uno de los procesos de formacin de pa-labras ms prsperos que dispone la lengua para la creacin de unidadeslxicas, vocablos o giros nuevos.

    Resulta inexplicable la casi total carencia de estudios que se acerquenreflexivamente a las diversas cuestiones que ataen al reconocimiento auto-mtico de nuevos vocablos compositivos. En este trabajo se parte de elemen-tos ya presentes en el lenguaje o de otros tomados de fuera para reconocernuevos vocablos mediante la unin de dos o ms de tales elementos. Se estu-dian aquellos casos de composicin y de parasntesis que se han consolida-do como la unin grfica de los elementos que intervienen1; se tratan lospseudoprefijoides o pseudosufijoides como elementos compositivos no comomorfemas derivativos; se incluye la parasntesis por composicin2, desde unpunto de vista principalmente morfolgico, ni sintctico ni semntico, lo queno impide que en ocasiones sea necesario hacer referencia a tales aspectos.Se trata, en suma, de procedimientos que pueden crear neologismos, lo queconstituye un fructfero manantial para el enriquecimiento de la lengua.

    LEA, XXXV/2, 2013, pgs. 181-XX.182

    1 No se estudian aquellos compuestos donde sus elementos componentes han alcanzadouna coherencia sintctica y/o semntica pero sin fusin ortogrfica.

    2 Vase DAVID SERRANO DOLADER, Las formaciones parasintticas en espaol, Arco/Libros, Ma-drid, 1995.

  • 1. LA FORMACIN DE PALABRAS COMPUESTAS EN ESPAOL

    La perspectiva adoptada para el estudio de compuestos se basa en un an-lisis sincrnico debido a la dificultad que entraa la visin diacrnica ya quees prcticamente inexistente3. En los estudios realizados sobre composicinen espaol, se pone de manifiesto una falta de homogeneidad tanto en el es-tablecimiento de los diferentes tipos de compuestos como en el esclareci-miento de sus caractersticas se remite al lector a las obras de M. Lang, M.Alvar, S. Varela, Alemany Bolufer, Almela Prez, Bustos Gisbert, Val lvaro4,entre otros. No se ha llegado a dar una definicin de forma unnime, sobretodo a la hora de fijar la frontera entre composicin y derivacin, o bien en-tre los compuestos sintagmticos y las colocaciones y locuciones. La definicinms prxima a este estudio aparece en el Diccionario de la Real AcademiaEspaola DRAE procedimiento por el cual se forman vocablos agregando a unosimple una o ms preposiciones o partculas u otro vocablo ntegro o modificado poreufona coyotomate, quitaipn, cagalaolla, paraguas. Se aade que consiste enhacer de dos o ms elementos una nueva palabra cuyo significado muchasveces en sentido figurado suele ser distinto y ms extenso que la suma de losde sus componentes. Se considera que los elementos componentes que for-man un compuesto pueden ser palabras5 castellanas enteras o temas cultosde origen grecolatino denominados elementos prefijales o sufijales elementos com-positivos segn se antepongan o se pospongan. La Tabla 1 1 muestra el por-centaje en la formacin de palabras compuestas segn las combinacionesposibles de estos dos tipos de unidades lxicas, recogidas en la base docu-mental considerada en este estudio.

    LEA, XXXV/2, 2013, pgs. 181-XX. PALABRAS COMPUESTAS EN ESPAOL 183

    3 En la tesis doctoral de CRISTINA BUENAFUENTES DE LA MATA (Procesos de gramaticalizacin ylexicalizacin en la formacin de compuestos en espaol, Tesis Doctoral, Universidad Autnoma de Bar-celona, 2007, [1/10/2013]) se demues-tra que la diacrona juega un papel muy importante en el estudio de la formacin de palabrasy, en concreto, de la composicin; adems las teoras de la gramaticalizacin y la lexicalizacinson el mejor marco terico para alcanzar dicho objetivo. En este sentido, contribuye a llenar enparte el vaco bibliogrfico existente en el tratamiento histrico de la composicin.

    4 MERVING LANG, Formacin de palabras en espaol. Morfologa derivativa productiva en lxicomoderno, Ctedra, Madrid, 1992; MANUEL ALVAR ESQUERRA, La formacin de las palabras en espaol,Arco/Libros, Madrid, 2002; SOLEDAD VARELA, Morfologa Lxica: La formacin de palabras, Gredos,Madrid, 2005; JOS ALEMANY BOLUFER, Tratado de formacin de palabras en la lengua castellana. Laderivacin y la composicin. Estudios de los sufijos y prefijos empleados en una y otra, Victoriano Surez,Madrid, 1920; RAMN ALMELA PREZ, Procedimientos de formacin de palabras en espaol, Ariel, Bar-celona, 1999; EUGENIO BUSTOS GISBERT, La composicin nominal en espaol, Publicaciones de laUniversidad de Salamanca, Salamanca, 1986; JESS VAL LVARO, La composicin, en IGNACIOBOSQUE y VIOLETA DEMONTE (eds.), Gramtica descriptiva de la Lengua Espaola, Espasa-Calpe, vol.3, Madrid, 1999, pgs. 4757-4841.

    5 Se entiende palabra como aquella que tiene un solo lexema o un lexema unido a morfe-mas flexivos o la que est formada por un morfema libre o unido a morfemas flexivos.

  • En el lenguaje cientfico y tecnolgico es muy habitual la formacin denuevas palabras o neologismos utilizando races cultas grecolatinas. Las vocesen cuya formacin intervienen estos elementos podran no considerarse pro-piamente compuestas, ya que la mayora de estas races no pueden apare-cer de forma aislada, aunque tampoco pueden considerarse derivadas puestienen un comportamiento peculiar que los aleja de los autnticos afijos;es ms, tienen un significado lxico ms prximo al de las races que al delos afijos6; incluso estos elementos compositivos pueden ocupar tanto la po-

    LEA, XXXV/2, 2013, pgs. 181-XX.184

    6 Un reconocimiento automatizado de compuestos formados por elementos compositivostiene que considerar la distincin entre elementos compositivos y afijos: la combinacin entreverdaderos afijos no produce palabras en la lengua (*in-dad, *pre-cin o cualesquiera otras com-binaciones de prefijo y sufijo dan siempre malas formaciones lxicas, segn VARELA (MorfologaLxica: La formacin de palabras, op. cit.).

    ElementoCompositivo

    Palabra

    0 10 20 30 40

    2 e

    lem

    ento

    com

    pone

    nte

    1 Elemento ComponenteElemento Compositivo

    1 Elemento ComponentePalabra

    TABLA 1. Porcentajes en las combinaciones de distintas unidades lxicaspara formar palabras compuestas

    2 Elemento Componente

    ElementoPalabra Compositivo

    1 Elemento Palabra 23.97% 7.15%

    Componente Elemento Compositivo 31.42% 37.44%

  • sicin inicial como la posicin final en el compuesto frente a la posicin pre-determinada de los afijos cefalpodo, cefalotrax, dolicocfalo, mesocfalo.

    La Tabla 3 2 muestra informacin de los elementos compositivos estudia-dos, el nmero de elementos prefijales y sufijales considerados, el nmerode compuestos encontrados y el total de palabras tratadas contienen los ele-mentos compositivos fijados.

    TABLA 3. E