La traducción automática

Sin desvirtuar nada de lo dicho hasta ahora, hay que aclarar no obstante que la traducción humana tal y como se ha venido haciendo durante siglos, esto es, la traducción realizada con la única ayuda de los propios conocimientos lingüísticos y culturales por un lado, y de algunos diccionarios y obras de referencia por otro, resulta impensable a principios del siglo XXI.

Desde mediados del siglo XX se han hecho intentos más o menos exitosos de construir máquinas traductoras que permitan sustituir total o parcialmente a los traductores humanos. Por ello actualmente se hacen clasificaciones de la Traducción en las que el parámetro a tener en cuenta es el grado de automatización de la misma. Es en este contexto en el que aparecen los conceptos de Traducción Automática (TA) y Traducción Asistida por Ordenador (TAO). Podría decirse que la traducción humana tradicional y la automática se hallarían en los extremos opuestos de una hipotética clasificación del método de la traducción según su grado de automatización. Pero las cosas no son tan simples.

Los sistemas de TA funcionan prescindiendo del ser humano en el proceso traductológico. Conviene señalar no obstante que, aunque existen algunos buenos programas de TA (como Systran, usado por los traductores de la Unión Europea), si lo que se desea obtener es un producto de calidad, aún se precisa que un humano revise el documento traducido por la máquina.

Dentro de los programas de TA, los que dan mejores resultados son los traductores automáticos especializados, que proporcionan traducciones bastante fiables que no precisan ser revisadas o post-editadas. Ahora bien, esos programas se limitan a temas sumamente específicos. El mejor ejemplo lo constituye el software canadiense Taum-Meteo, diseñado para la traducción de partes meteorológicos.

Ente la traducción humana tradicional y la TA hay dos estadios intermedios. Uno es el de la Traducción Asistida por Ordenador (TAO), según la cual un traductor humano realiza su tarea con la ayuda de los procesadores de textos dotados de correctores ortográficos, diccionarios electrónicos, bases de datos terminológicas, corpus lingüísticos especializados, etc. Este tipo de traducción es la que impera desde la última década del siglo XX. De hecho resulta inconcebible que un traductor profesional no emplee todos los recursos documentales e idiomáticos a su alcance para hacer mejor y más rápidamente su trabajo. Se puede asegurar que la TAO es la forma habitual de traducción profesional ahora mismo.

El segundo estadio se denomina Traducción Automática asistida por el hombre, y se sobreentiende que es el sistema informático el responsable principal de la traducción del documento. Sin embargo, el traductor humano "ayudará" a la máquina realizando la pre-edición del texto (sustituyendo expresiones por otras más simples o precisas, limitando el lenguaje usado, etc.), o bien durante el propio proceso de la traducción, escogiendo una de las propuestas de traducción que haga la máquina. Se suele desaconsejar la post-edición, puesto que los costes en tiempo y dinero sólo resultan lógicos si el texto resultante es de buena calidad (como en el caso de Systran).

Finalmente, comentar que los sistemas en que la mayor responsabilidad traductora recae sobre las máquinas no están pensados para traducir textos literarios, si no únicamente documentos técnicos altamente especializados, porque estos sistemas se limitan a trabajar con campos del lenguaje muy definidos, y no "se llevan bien" con las figuras retóricas, los juegos de palabras, las frases desestructuradas, diferentes registros del lenguaje, etc.

El impulso moderno a la aplicación de las máquinas a la traducción de lenguas naturales parte de la propuesta de usar el modelo matemático de comunicación.

Los primeros sistemas operaban entre un par de lenguas en concreto y en una sola dirección, esto es, sin realizar traducción inversa o retrotraducción. El proceso constaba de los siguientes estadios:

• Introducción del TO

• Análisis morfológico

• Localización de palabras en un diccionario bilingüe

• Reformulación sintáctica

• Creación del TT

Se trataba de una traducción palabra por palabra, por lo que los resultados eran bastante deficientes.

Los programas Systran actuales han mejorado mucho su calidad y los usan muchas instituciones publicas y privadas (fuerzas aéreas de los EEUU, General Motors, Bundesbahn, Aérospatiale y Xerox.

Los deficientes resultados tempranos de esta aproximación directa llevaron al desarrollo de dos aproximaciones indirectas: la interlingua y la de transfer.

Los sistemas interlingua se plantean construir una representación semántica universal de la que después se puedan generar textos en otras lenguas. Un sistema interlingua consta de dos módulos: el de análisis de la L1 y el de generación de la L2. La ventaja de esta división es que se podrían diseñar sistemas multilingües que funcionen en ambas direcciones. La desventaja es que hasta hoy es imposible construir representaciones semánticas que sean independientes de las lenguas envueltas en el proceso, incluso cuando son lenguas próximas.

Ejemplos del sistema interlingua son el de Rosetta, GENESE; Distributed Languaje Translation.

La 3ª generación de sistemas de traducción automática, los transfer, usa representaciones intermedias dependientes de las lenguas implicadas. El sistema consta de tres módulos:

Análisis en la L1, transferencia L1-L2 y generación en la L2.

La utilizan los sistemas Eurotra, Ariane, Metal y Susy.

Los sistemas transfer obtienen mejores resultados que los anteriores, pero resultan demasiado costosos y su calidad sigue siendo inaceptable para los lectores no especializados.

Para remediarlo muchos sistemas han recurrido a dos tipos de estrategias de mejora externas a los programas: la intervención humana y la restricción lingüística de los TO. La intervención humana se puede dar antes, durante o después del proceso de traducción automática. La actividad posterior al proceso se conoce como preedición: la realizan lingüistas o mediadores y consiste en identificar y reformular las partes del TO que el programa no puede traducir. La actividad posterior, postedición, consiste en reformular el TO producido por el programa para corregir los problemas de traducción y para hacer el TO legible.

Frente a los programas de traducción autónomos, los interactivos requieren la presencia e intervención de una persona durante el proceso.

La otra estrategia, la restricción lingüística, se puede realizar en diversos grados. Es habitual especializar el sistema en la traducción de un cierto tipo de textos. El paso siguiente es controlar la redacción de los TO.

Un ejemplo extremo de restricción lingüística es el desarrollo de un sistema para un campo muy concreto, con un vocabulario y estructuras sintácticas controladas.

Las enormes inversiones y los escasos resultados alientan también aproximaciones más prácticas, en las que no se busca la traducción completamente automática de alta calidad, sino la asistencia informática a la traducción humana, la traducción asistida por ordenador.

La tendencia dominante es la de crear conjuntos modulares de programas informáticos que mejoren la productividad gracias a la automatización de la creación y manipulación de documentos, el uso eficiente de bases de datos y el aprovechamiento del trabajo realizado anteriormente.

Estos workbenches pueden componerse de diccionarios residentes en memoria, una memoria de traducción que identifica las oraciones ya traducidas con anterioridad o las próximas y ofrece la anterior solución, procesadores de textos multilingües, programas de edición textual y gráfica, importación y exportación de archivos en distintos formatos, reconocimiento óptico de caracteres, herramientas de control terminológico, programas de telecomunicaciones...

Algunos también incluyen los elementos necesarios para acceder a sistemas de traducción automática por módem.

Ante todo lo expuesto puede decirse que el ámbito de la traducción debe contemplarse desde una doble perspectiva. Por un lado, el traductor humano no debería temer (al menos a corto y medio plazo) verse sustituido por las máquinas: bien al contrario, el objetivo de los programas de TA y las herramientas de apoyo de todo tipo que constituyen la TAO es ayudarlo, haciendo que su tarea sea menos repetitiva y se convierta en más creativa y rápida.

Por otro lado, para los usuarios especializados en alguna disciplina científica, se abren nuevas facilidades de comprensión de la información contenida en los documentos, puesto que éstos pueden ser traducidos de una forma rápida y con una calidad aceptable (entre el 60 y el 80% de fiabilidad) por las máquinas, y puestos a disposición de los usuarios (ya sea con una revisión ulterior o bien entregados "en bruto") para su propio consumo.