¿Traductores vs. Inteligencia Artificial?

¿Traductores vs. Inteligencia Artificial?

 

Las transformaciones, más importantes y más inmediatas, que Inteligencia Artificial Generativa está logrando vienen ocurriendo en los campos de la programación de la computación y en la traducción.





Especial de Laszlo Beke

Sin embargo y a pesar de los impresionantes avances en marcha, el valor de hablar otro idioma no desaparecerá. Las herramientas de traducción son útiles para navegar el mundo, pero son solamente una herramienta. No pueden reemplazar la experiencia humana del aprendizaje de un idioma en términos de entender de dónde vienen otras personas, de identificar las diferentes características de otras visiones y de otros lugares.

La historia

Las primeras traducciones por computadora se intentaron hace 70 años, cuando una computadora IBM fue programada con un vocabulario de 250 palabras en inglés y ruso y con seis reglas gramaticales. El enfoque basado-en-reglas fue sustituido por un enfoque “estadístico” en los 1990’s, aprovechando el procesamiento de grandes conjuntos de data y predominó hasta que se lanzó Google Translate en 2006. El campo explotó, cuando en 2016, Google cambió a una máquina “neuronal”, predecesora de los modelos grandes de lenguaje (LLM) actuales. A partir de allí, la influencia fluyó en ambos sentidos, mejoraron los LLM y también se continuó superando la traducción automática,

La traducción automática presente

No es sorprendente que exista optimismo entre los fabricantes-de-modelos de IA. La traducción automática se ha vuelto tan confiable y ubicua y tan rápidamente, que muchos usuarios ni siquiera piensan que la están aplicando. Los expertos en traducción siempre pensaron que, a pesar de los avances de Inteligencia Artificial, lograr que las máquinas tradujeran idiomas tan bien como los traductores profesionales siempre requeriría la participación de un humano en el proceso. Los resultados de una competencia organizada por un emprendimiento basado en Lisboa (Unbabel), donde se enfrentaron su modelo de IA más reciente y traductores humanos, cambió dicha percepción. Hoy en día, en el sector de la traducción la participación humana a nivel global es de 95%, en tres años podría estar acercándose a 0%. La traducción automática es prácticamente un problema resuelto, lo difícil es hacerlo perfecta. Interpretar los significados o los sentidos, en lugar de solamente palabras y oraciones, será una tarea titánica.

En la prueba realizada por Unbabel, se le solicitó a los traductores humanos y a los automáticos que realizaran todo tipo de traducción: mensajes de texto informales, contratos legales densos e incluso traducción del inglés arcaico de una pieza de Marco Aurelio. El modelo de Unbabel respondió. Usando las métricas de Multidimensional Quality Metrics, la cual mide la calidad de la traducción, los humanos eran mejores que la máquina si dominaban ambos idiomas y también eran expertos en el material siendo traducido. Sin embargo, la diferencia era pequeña, y resulta difícil pensar que en dos o tres años las máquinas alcanzaran y pasaran a los humanos.

Las traducciones complejas enfrentan los mismos problemas que afectan a los LLM en general. Sin la habilidad de planificar, ubicar referencias a memorias duraderas, extraer de fuentes fácticas o de revisar su producción, incluso las mejores herramientas de traducción tienen dificultades con trabajos de la longitud-de-un-libro o con tareas de precisión, como mantener un título traducido dentro de una cierta longitud. Incluso tareas que son triviales para un humano pueden hacer fallar el modelo. Por ejemplo, ellos “olvidan” frases estáticas como los nombres de tiendas, traduciéndolas de nuevo, cada vez que las encuentran. Pueden alucinar con información que no cuadra con las estructuras gramaticales del idioma objetivo. Realmente para hacer una traducción perfecta deberían también tener inteligencia-a-nivel-humano. Sin un poeta competente, es difícil traducir un “haiku”.

Traducción perfecta

El problema de traducir una oración está “bastante cerca de ser resuelto” para los idiomas de “muchos recursos”, con más datos de entrenamiento. Pero, ir más allá de ese punto para hacer la traducción automática tan buena como una persona multilingüe – especialmente para idiomas que no tienen toneladas de data de entrenamiento disponible – será una tarea mucho más desafiante.

Por otro lado, existen visiones conflictivas sobre aquello que es una traducción perfecta. En la traducción hay un conflicto de larga data entre “transparencia” y “fidelidad” – la escogencia entre traducir oraciones exactamente como se les encuentra en el idioma original, o exactamente como se sienten en la audiencia objetivo. Una traducción transparente dejaría una frase idiomática tal como está, le permitiría a un polaco ignorar un problema como “no es mi circo, no son mis monos”. Otro muy leal cambiaría incluso las referencias culturales y no le molestaría que, para un estadounidense, “en forma de futbol” sea una frase para describir un objeto esférico.

La traducción entre idiomas, en ocasiones, puede requerir más información que aquella presente en el material fuente, por ejemplo: para traducir “Tú me gustas” del español al japonés, la persona necesita conocer el género de la persona que está hablando, la relación con aquel a quién se le está dirigiendo el mensaje e idealmente su nombre, para evitar el uso descortés del “tú”. Una máquina de traducción perfecta debería interpretar y replicar todas estas señales e inflexiones sutiles. Agregarles casillas de verificación a una interfase pudiera confundir a los usuarios. Por lo tanto, en la práctica un traductor automático perfecto debería tener un nivel-humano tanto en la calidad de su producto final como en el método de realizar el ingreso de la solicitud. Los requerimientos para realizar preguntas de seguimiento, para conocer cuando intercambiar transparencia por fidelidad, y para entender el uso que se le dará a la traducción, implican que, para una traducción avanzada, se requiere información adicional a la del texto original.

También está el tema de los idiomas de “escasos recursos”, donde la falta de textos escritos disponibles significa que la precisión de las traducciones no es mejorada por las innovaciones de los LLM, las cuales han transformado el resto de los sectores. Se están probando enfoques con menos requerimientos de data. Como ejemplo, un equipo en Google construyó un sistema para la traducción voz-a-voz para 15 idiomas africanos. En lugar de entrenar al sistema con gigabytes de data, está aprendiendo con palabras escritas tal como lo haría un niño, asociando sonidos de la voz con secuencias de caracteres en forma escrita.

Asimismo, se está trabajando en traducción en vivo. DeepL lanzó en noviembre un sistema de traducción voz-a-voz, ofreciendo interpretación para conversaciones en persona, uno-a-uno, y para video chat con múltiples miembros. Unabel ha demostrado un dispositivo capaz de leer pequeños movimientos en las muñecas o en las cejas y compaginándolos con texto generado-por-LLM, para permitir la comunicación sin la necesidad de hablar o escribir. La empresa espera convertirlo en un dispositivo de asistencia para personas, con una enfermedad motor-neuronal, que ya no puedan hablar.


Se hace referencia a Machine translation is almost a solved problem. Making it perfect will be a hard problem. También aparece en mi Portal https://tinyurl.com/44ky9c4j. La imagen es cortesía de Bing Image Creator.