introducción traducción asistida
Post on 31-Jul-2016
240 Views
Preview:
DESCRIPTION
TRANSCRIPT
NOMBRE DEL MÓDULO TRADUCCIÓN ASISTIDA POR COMPUTADORA, TRADUCCIÓN
AUTOMÁTICA Y POSEDICIÓN
TÍTULO DE LECTURA:
Nociones teórico-prácticas en torno a la traducción asistida por computadora (TAC) y la traducción automática (TA): Introducción
REFERENCIA: Fernández Acosta, L. R. (2016) Nociones teórico-prácticas en torno a la traducción asistida por computadora (TAC) y la traducción automática (TA): Introducción. [Documento Inédito] Universidad Intercontinental.
México. D.F.
Material utilizado con fines didácticos
2
Contenido 1.1 Iniciación a la traducción asistida por computadora (TAC) y la traducción automática (TA) ... 3
1.1.1 ¿Qué son las herramientas TAC y cuál es su utilidad? ........................................................... 4
1.1.2 Tipos de licencias TAC ............................................................................................................ 7
1.1.3 Las herramientas TAC más utilizadas a nivel mundial. .......................................................... 8
1.1.4 Motivos para ser más eficientes en la industria de la traducción........................................ 12
1.1.5 Características generales de las herramientas TAC más utilizadas en la industria de la
traducción ..................................................................................................................................... 12
1.1.6 Principales motores de TA en el mercado ........................................................................... 15
3
1.1 Iniciación a la traducción asistida por computadora (TAC) y la
traducción automática (TA)
El nombre proviene de la traducción del inglés de CAT Tools (Computer-Assisted
Translation). En español, se les conoce como herramientas TAC o TAO. Esta
última abreviatura no tiene nada que ver con la filosofía china.
Prácticamente es la traducción que se hace con ayuda de programas informáticos
específicos que no hay que confundir con los motores de traducción automática
como Google Translate que es una aplicación donde interviene exclusivamente
una computadora conectada a un servidor sin ayuda del traductor. Veremos más
adelante (1.1.6.) sus características, funcionamiento y tipos de sistemas.
Las herramientas TAC son bases de datos que soportan el almacenamiento, la
navegación, la extracción y creación de recursos lingüísticos mediante la creación
de memorias de traducción (MT) y bases de datos terminológicas (BT). Son
consideradas tal vez las más utilizadas y especializadas por los traductores para
facilitar, agilizar el trabajo y ser más competitivos. El enfoque de la TAC se centra
más en el texto de destino y su comprensión que en el texto de origen.
La TAC y la TA (traducción automática) son dos conceptos que suelen confundirse
a menudo aunque son dos sistemas completamente diferentes que se
complementan e integran hoy en día en la mayoría de software comercial.
4
1.1.1 ¿Qué son las herramientas TAC y cuál es su utilidad?
La TAC se caracteriza principalmente por el uso de memorias de traducción (MT).
La MT es la base de este tipo de herramientas ya que es donde se almacenan
todos los segmentos traducidos en un formato bilingüe.
1) El texto se divide en dos principales columnas y muestra en forma de
segmentos (origen y destino) como se muestra en la imagen de abajo. Al unirse
ambos segmentos y confirmarse su traducción se crea una unidad de traducción
(UT).
Ejemplo del editor de la herramienta TAC de SDL Trados Studio 2014
2) Todos los segmentos traducidos se van almacenado en una base de datos
llamada «memoria de traducción» que podemos recuperar (reciclar) y reutilizar en
futuras traducciones con la misma temática. Es como si la información se
guardara en diferentes cajones y la sacamos cada vez que la necesitamos. Los
segmentos se parecen a una oración, pero no lo es ya que puede ser una palabra,
un número, una marca, una dirección electrónica, una sigla, una frase, etc.
Ejemplo de una memoria de traducción: http://www.textualia.com/memoria-de-traduccion/
Texto de origen Texto de destino
5
La mayoría de herramientas TAC funcionan con un estándar universal de
memorias de traducción: TMX (Translation Memory eXchange) que es un formato
abierto basado en XML el cual facilita la interoperabilidad de las memorias de
traducción entre diferentes herramientas TAC para que no se pierdan datos
importantes marcados por etiquetas de la traducción.
Actualmente, existe también otro estándar universal que está desplazando al TMX.
Se trata del XLIFF (XML Localization Interchange File Format), formato abierto
basado también en el XML que acepta cadenas de texto extraídas de un original
que se quieran traducir.
Ejemplo del flujo de trabajo de un proyecto de traducción en formato XLIFF:
https://www.google.com.mx/search?q=XML+y+XLIFF+imagen&rlz=1C1TSNG_enMX654MX654&es
pv=2&biw=1366&bih=667&tbm=isch&tbo=u&source=univ&sa=X&ved=0ahUKEwiUzb_-
_dzMAhXC44MKHT_FCN4QsAQIGQ&dpr=1#imgrc=ap1-_2lUh0j7fM%3A
El éxito en el uso de este tipo de herramientas depende en buena parte del tipo de
textos que cada traductor traduce. Son útiles para aquellas tipologías textuales
especializadas que provocan que el traductor esté traduciendo constantemente
textos muy parecidos o con muchas repeticiones: textos jurídicos, científicos,
técnicos, económicos, informáticos, médicos, farmacéuticos, entre otros.
6
Permiten mantener una coherencia terminológica a lo largo de cada texto
traducido, así como ahorrar mucho tiempo al memorizar términos y construcciones
que probablemente se repetirán en futuros textos del mismo tipo.
Además, nos libran de tareas extras tales como el formateo, la extracción de
contenido o la comprobación de la coherencia terminológica. Estos son cuatro de
las herramientas TAC comerciales más conocidas en el mercado de las cuales
usaremos las tres primeras más adelante.
En efecto, hay gran número de sectores que necesitan ser traducidos debido a la
escasez de traductores profesionales a nivel mundial. Para 2015, se registraron
863 105 652 sitios web en inglés en Internet, según cifras del sitio «internet live
stats»: http://www.internetlivestats.com/total-number-of-websites/.
Ahora veamos los sectores que más demanda han tenido según este cuadro
dividido en traducción realizada por humanos, con posedición o traducción
automática:
7
Fuente: http://www.slideshare.net/SDL-Language-Technologies/sdl-machine-translation-for-post-
editing
1.1.2 Tipos de licencias TAC
Existen dos tipos de licencias:
a) Licencias libres o gratuitas: OmegaT, Across, Anaphraseus, Google
Translator ToolKit o Wordfast Anywhere. Estas permiten cubrir las necesidades
básicas sin invertir nada ya que algunas funcionan en la nube, pero con algunas
restricciones. Por lo que su desarrollo no es tan amplio. Sin embargo, pueden
funcionar muy bien para llevar a cabo proyectos pequeños.
b) Licencias comerciales o de paga: SDL Trados Studio 2015, MemoQ Pro,
WordFast Pro o Classic, Déjà Vu X3 Professional, Fluency Translation Suite,
Translation Workplace, MadCap Lingo, Smartling Translation Management
System, MetaTexis, CafeTran Espresso, SwordFish Translation Editor, Transit
NXT Professional, MemSource Cloud, XTM Cloud, Heartsome Translation Studio,
etc.
Ya algunas herramientas TAC han conseguido acaparar el grueso del mercado ya
que contienen una serie de funciones avanzadas y son mucho más potentes y
sofisticadas que otras en su desarrollo.
8
Fuente: http://www.polyglot.lv/es/tecnologa-de-traduccin
1.1.3 Las herramientas TAC más utilizadas a nivel mundial.
Según la última encuesta realizada en marzo-abril de 2013 a 440 traductores
voluntarios de la organización Translators without Borders, arrojó que las principal
herramientas TAC más utilizadas por los traductores son:
Trados (40.2 %).
Wordfast (12.9 %).
MemoQ (5.5 %).
Déjà Vu (2.1 %).
Across (1.7 %).
4.29 % reporta que usa otras herramientas TAC.
Un tercio (33.3 %) reporta que no usa ninguna herramienta TAC.
Fuente: http://translatorswithoutborders.org/twbnewsletter/04/the-translators-without-borders-
translator-survey/
El último informe «State of the industry: freelance translators» de 2012 que realiza
desde 2010 la empresa estadounidense ProZ.com
(http://cdn1.proz.com/file_resources/other/624ef9448c436b3256d99120d18fe1bd_ProZ.co
m%20State%20of%20the%20industry%20for%20freelance%20translators%202012.pdf)
9
arrojó que Trados Studio es el software más utilizado con un 64 %. Wordfast le
sigue con un 16 %; Déjà Vu con un 12 % y MemoQ con un 6 %.
En 2013, la misma empresa realiza otra encuesta en su blog a unos 3000
traductores independientes sobre el uso y preferencias de las herramientas TAC
para traducir. SDL Trados Studio volvió a destacar con un 70 %. Le sigue
Wordfast con un 36 % y MemoQ con un 27 %.
Fuente: https://prozcomblog.com/2013/03/28/cat-tool-use-by-translators-what-are-they-
using/
En este sentido, el artículo en línea de Jacques Drillon
(http://bibliobs.nouvelobs.com/actualites/20140116.OBS2713/traduire-plus-pour-
gagner-moins-grandeur-et-misere-des-
traducteurs.html?goback=%2Egde_1617477_member_5832855681576767491#%
21), publicado el 25 de enero de 2014 en L’OBS menciona que alrededor de un
70 % de los traductores técnicos franceses utilizan herramientas muy
especializadas (Wordfast, OmegaT, Trados y Déjà Vu) para traducir más rápido y
ser más productivos por tratarse de textos similares: palabras, expresiones y
frases repetitivas.
10
Siguiendo en este mismo tenor, el Departamento de Traducción e Interpretación
del Centro de Enseñanza de Lenguas Extranjeras de la Universidad Nacional
Autónoma de México (UNAM) realiza, de enero a noviembre de 2014, la Encuesta
nacional del perfil del traductor profesional en México a 477 traductores en todo el
territorio mexicano, de los cuales 21 % usan SDL Trados Studio en sus diferentes
versiones, siendo el software más utilizado en el país.
Fuente:http://es.slideshare.net/raul4319/resultados-de-la-encuesta-del-perfil-del-traductor-
profesional-en-mxico
En 2015, la Société française des traducteurs (SFT) publica los resultados
preliminares de la encuesta sobre las prácticas profesionales de los puestos
relativos a la traducción donde participaron 1140 traductores. De los cuales 894
(78.42 %) utilizan una herramienta TAC y 246 (21.58 %) traductores no al utilizan.
Dentro de las tres herramientas TAC más utilizadas por los traductores franceses
se encuentran, en orden de importancia, SDL Trados con 620 traductores (54.39
%). Luego, le sigue MemoQ con 204 traductores (17.89 %) y Wordfast con 228 (20
%). Hay un 21.58 % de traductores (246) que todavía no utiliza ninguna
herramienta TAC. Es interesante ver las dos herramientas favoritas de libre
acceso de los franceses: Across (3.95 %) y OmegaT (4.47 %).
11
Fuente:
http://www.sft.fr/clients/sft/telechargements/news/fichier/1730_f1_2015_resultats_preliminaires.pdf
Por último, veamos un comparativo de la evolución de las herramientas TAC en
Francia en los resultados preliminares de la encuesta 2015 frente a la encuesta de
2008.
Fuente:
http://www.sft.fr/clients/sft/telechargements/news/fichier/1730_f1_2015_resultats_preliminaires.pdf
12
1.1.4 Motivos para ser más eficientes en la industria de la traducción
Los motivos por los cuales un traductor debe ser eficiente van de la experiencia, el
manejo de las herramientas TAC, el tamaño de las memorias de traducción hasta
el hecho de capturar rápido o incluso utilizar una herramienta de reconocimiento
vocal de la voz como las que traen actualmente los teléfonos inteligentes para
grabar su voz y buscar una información, por ejemplo.
Fuente: https://www.youtube.com/watch?v=zHHVAoUMv_g
1.1.5 Características generales de las herramientas TAC más utilizadas en
la industria de la traducción
Como ya vimos en las encuestas anteriores, las cuatro herramientas TAC
comerciales más utilizadas son SDL Trados Studio, MemoQ, Wordfast y Déjà Vu
de las cuales les presentaremos algunas de sus características.
NOMBRE: SDL Trados Studio.
PRECIO: Freelance 695 €, Freelance Plus 855 € , Freelance Ultimate 1.455 €,
Professional Single User 2.595 €.
FORMATOS: Trabaja con 70 formatos.
13
DURACIÓN DE LA LICENCIA: Definitiva.
SISTEMA OPERATIVO: Windows 7, 8 o 10.
SOPORTE TÉCNICO: Soporte gratis para la instalación de la licencia y servicios
de mantenimiento.
REQUERIMIENTOS DEL SISTEMA: 1 gigahertz (GHz) o más, procesador de
32-bit (x86) o 64-bit (x64) y 2 GB RAM (32-bit) o 4 GB RAM (64-bit), Microsoft
Windows PC y una resolución de pantalla de 1280x1024.
PRUEBA GRATIS: Demo por 30 días gratis.
IDIOMAS: Cualquier idioma de Microsoft Word.
NÚMERO DE USUARIOS: Alrededor de 225 000. FUENTE: http://www.translationzone.com/products/trados-studio/freelance/
NOMBRE: MemoQ Pro 2015.
PRECIO: 620 €.
FORMATOS: Adobe Framemaker™ (.MIF), Adobe InCopy™, Adobe InDesign™,
Adobe InDesign™ (.INX), Adobe InDesign™ Markup Language (.IDML), AuthorIT
(.XML), DITA (.DITA, .XML), FreeMind mind maps (.MM), GetText (.PO), HTML
(.HTML, .HMT, .SHT), Java properties, JSON, Microsoft Word™ 2003 (.DOC,
.RTF, .BAK, .DOT), Microsoft Word™ 2007-2010 (.DOCX), Microsoft Excel™
2003 (.XLS, .XML), Microsoft Excel™ 2007-2010 (.XLSX, .XLSM), Microsoft
Excel™ documents (.XLS, .XLT), Microsoft PowerPoint™ 2003 (.PPT, .PPS,
.POT), Microsoft PowerPoint™ 2007-2010 (.PPTX, .PPSX, .POTX, .SLDX),
Microsoft Visio™ (.VDX), MS Help™ Workshop (.HHC, .HHK), OpenDocument
text documents (.ODT, .ODF), Plain text (.TXT, .INF, .INI, .REG), Plain text from
PDF files (.PDF), Rich Text Format™ (.RTF, two-column .RTF), Scalable Vector
Graphics (.SVG), SDL Studio package (.SDLPPX), SDL TradosTag (.TTX), SDL
Trados bilingual RTF (.RTF or .DOC, .BAK), SDLXLIFF (.SDLXLIFF), TMX filter,
Typo3 pages (.XML), Wordfast Professional TXML (.TXML), ResX (.RESX), XML
(.XML), XLIFF (.XLF, .XLIF, .XLIFF), XLIFF:doc, YAML.
DURACIÓN DE LA LICENCIA: Definitiva.
SISTEMA OPERATIVO: Windows 7, 8 y 10, Windows 2000, Windows XP,
Windows Vista.
14
REQUERIMIENTOS DEL SISTEMA: .NET Framework Version 3.5 SP1, 512 MB,
1 GB o más, 60 MB (sin incluir el .NET Framework), resolución de pixels de
1024×768.
SOPORTE TÉCNICO Y ACTUALIZACIONES: Soporte en la instalación, 1 año
de soporte técnico gratis.
PRUEBA GRATIS: Demo por 45 días gratis, pero cuando se acaba el periodo de
prueba se puede seguir utilizando el programa
con ciertas restricciones.
IDIOMAS: Prácticamente todos los idiomas, interfaz de usuario en 10 idiomas. FUENTE: https://www.memoq.com/
NOMBRE: Wordfast.
PRECIO: 400 dólares americanos.
FORMATOS: MS Word, MS Excel, MS Powerpoint, HTML, XML, ASP/JSP/Java,
INX (InDesign), MIF, FrameMaker, TTX, PDF.
DURACIÓN DE LA LICENCIA: 3 años.
SISTEMA OPERATIVO: Windows Vista, Windows 7, 8 y 10, Mac OS X 10.4 o
superior, Linux.
SOPORTE TÉCNICO Y ACTUALIZACIONES: Tutoriales en línea,
actualizaciones gratis durante los tres años de la licencia.
PRUEBA GRATIS: Demo para trabajar hasta con 500 unidades de traducción.
IDIOMAS: Wordfast Pro y Classsic trabaja con cualquier idioma de Microsoft
Word. FUENTE: https://www.wordfast.net/
15
NOMBRE: Déjà Vu X3.
PRECIO: 420 €.
FORMATOS: XML, Open Office 2007, WB (Workbench).
DURACIÓN DE LA LICENCIA: Definitiva.
SISTEMA OPERATIVO: Windows Vista, Windows 7 y 8, Windows 2000,
Windows XP.
REQUERIMIENTOS DEL SISTEMA: 1GHz o MÁS 32-bit (x86) o procesador de
64-bit (x64), 1GB RAM.
SOPORTE TÉCNICO Y ACTUALIZACIONES: Soporte técnico gratis a través del
Centro de Soporte Técnico (support ticket center), actualizaciones gratis, pero no
la actualización de la versión.
PRUEBA GRATIS: Déjà Vu X3 FREE con restricciones.
IDIOMAS: Cualquier idioma que trabaje con Unicode de Microsoft Word.
FUENTE: http://www.atril.com/
1.1.6 Principales motores de TA en el mercado
La oferta de este tipo de programas es abundante, existen decenas de motores de
traducción en línea en Internet (Apertium, Babelfish, babylon, Dictionary, SDL
FreeTranslation, Frengly, Idiomax, Intertran, Linguatec - Personal Translator
Online, Microsoft – Bing, Orange Traduction (hasta 300 caracteres, traduce webs),
Reverso, Systran (se desarrolló en EE. UU. durante la Guerra Fría, traduce bien el
ruso), Traductor de Google (el más común, incluso con lenguas como el latín),
Voila, Utile, WebTrance, World lingo, entre otros.
Este tipo de software realiza la traducción de un texto de forma automática.
Básicamente se encarga de sustituir una serie de palabras en una lengua de
16
partida por sus equivalentes en la lengua de llegada. Para ello, el software de TA
realizará un análisis lingüístico del texto origen e intentará proporcionar un
resultado lo más correcto posible en la lengua de llegada. Veamos algunos
ejemplos de la interfaz de un traductor automático, que se compone básicamente
de tres partes: una en donde elegimos las lenguas de partida y llegada, otra en
donde pegamos o escribimos el texto que queremos que el software traduzca y
por último, el espacio donde sale el resultado de la traducción.
https://www.apertium.org/index.spa.html?dir=tat-kaz#translation
https://www.babelfish.com/
17
http://traduction.babylon-software.com/
http://translate.reference.com/
18
https://www.freetranslation.com/
https://translate.google.com/
19
http://www.systranet.com/translate/
La traducción automática, también conocida como Machine Translation en inglés,
se centra en el estudio de la traducción automatizada de lenguas naturales
basándose en la lingüística computacional, es decir, en el análisis del lenguaje
verbal humano desde la perspectiva de la ingeniería informática. En los últimos
años, los traductores automáticos se han convertido en herramientas
verdaderamente útiles pues constituyen el medio ideal para conseguir
traducciones a muy bajo o nulo costo, en un tiempo récord y, aunque el producto
final no se caracteriza por ser un texto perfectamente coherente y comprensible, sí
permite superar los obstáculos comunicativos, por lo que en gran parte cumple la
función de la traducción.
En el ámbito empresarial e institucional internacional (ONU, UE, UNESCO), esto
se traduce en términos de rentabilidad y rapidez por lo que es razonable que todas
estas entidades hayan realizado inversiones que permitan desarrollar y crear
herramientas de traducción automática cada vez más sofisticadas y eficaces.
El funcionamiento de los traductores automáticos consiste en la entrada de
información en una lengua (lengua origen) dentro del sistema para descomponerla
20
en unidades sintácticas y morfológicas que más tarde analizará con el fin de
encontrar sus equivalentes en la lengua meta y así componer el texto en esa
lengua. Tal como su nombre indica, el proceso de traducción automática no
requiere la intervención de ninguna acción manual, es decir, es un proceso
totalmente independiente que proporciona un resultado automáticamente.
El comienzo de la traducción automática se inicia con el 701 Translator, un
software de traducción automática desarrollado por la multinacional IBM en 1954
para traducir del ruso al inglés.
Fuente: https://www-03.ibm.com/ibm/history/exhibits/701/701_141502.html
En esta dirección, podemos leer la noticia de prensa en 1954 cuando se
anunciaba el lanzamiento de este gran «cerebro» traductor: https://www-
03.ibm.com/ibm/history/exhibits/701/701_translator.html.
Existen diferentes sistemas de traducción automática que generalmente podemos
clasificar en tres grupos. Por un lado, aquellos que se basan en la lingüística
computacional y en inteligencia artificial. Pueden ser directos ya que carecen de
una fase intermedia y dan lugar a estructuras sintácticas inapropiadas debido a
que no cuentan con una base lingüística apropiada. Otros son los indirectos que
(interlingua, transferencia) que podemos ver de manera esquemática en el
Triángulo de Vaquois que representa los tipos de sistemas con conocimiento
lingüístico (Oliver, Moré y Climent, 2008: 36).
21
Fuente de la imagen: http://elies.rediris.es/elies9/3-2.htm
Estos métodos utilizan una representación intermedia a partir de la que se genera
el texto en la lengua meta.
Por otro lado, los que están basados en el estudio y procesamiento de corpus
lingüísticos como es el caso de “linguee” que todos hemos consultado alguna vez
para conocer el contexto de un término: http://www.linguee.es/.
22
Utilizan corpus o bases de datos de textos en diversas lenguas y modelos
estadísticos para la resolución de problemas de optimización. Su traducción
automática está basada fundamentalmente en ejemplos (Example-Based M T) y
estadísticas que se extraen de un corpus paralelo que contiene alineación de
oraciones, locuciones y palabras en diferentes lenguas.
top related