Reading Time: 4 minutes

Picture by @gettyimages via Canva

  1. Què és la Traducció Automàtica?

  2. Quins tipus de TA hi ha?

  3. Quan la podem fer servir?

  4. Com em pot ajudar a reduir costos a la meva empresa


1. Què és la Traducció Automàtica o TA?

La Traducció Automàtica (TA), que no s’ha de confondre amb la Traducció Assistida (CAT, Computer Assisted Translation), és una branca de la lingüística computacional que investiga l’ús d’eines de software per traduir textos o veu d’un idioma a un altre, fent servir la IA (Intel·ligència Artificial).

A la pàgina del Dr. Jason Brownlee  trobem la següent afirmació: “Donada una seqüència de text en una llengua d’origen, no hi ha una única millor traducció d’aquest text a un altre idioma. Això es deu a l’ambigüitat i flexibilitat naturals del llenguatge humà. Això dificulta el repte de la traducció automàtica, potser un dels més difícils de la intel·ligència artificial:

El cas és que una traducció acurada requereix coneixements previs per resoldre l’ambigüitat i establir el contingut de la frase. (Pàgina 21 del llibre Artificial Intelligence, A Modern Approach, dels autors Stuart Russell & Peter Norvig)”

Segons el Grup de Recerca en TA Estadística de la Universitat d’Edimburg (https://statmt.org/ued/), “el somni de traduir documents de forma automàtica d’una llengua a una altra és una de les àrees d’investigació més antigues de la Intel·ligència artificial. Donada la quantitat d’exemples de traduccions i la gran capacitat dels ordinadors, ens trobem davant d’un avanç important cap a l’assoliment d’aquest somni.”

2. Quins tipus de TA hi ha?

Segons el Dr. Jason Brownlee, “la traducció automàtica és potser una de les tasques més difícils de la intel·ligència artificial, donada la fluïdesa del llenguatge humà. En el passat s’utilitzaven sistemes basats en regles, que es van substituir als anys noranta per mètodes estadístics (TA estadística). Més recentment, els models de xarxes neuronals profundes aconsegueixen resultats d’última generació en un camp que s’anomena adequadament traducció automàtica neuronal.”

  • Traducció Automàtica Estadística:

Segons la organització Statistical Machine Translation, la TA estadística “és la traducció d’un text d’una llengua a una altra realitzat per un ordinador que ha après a traduir a base d’una gran quantitat de textos traduïts”, fent servir l’estadística. Per exemple, en el diagrama de sota podeu veure com funciona aquest tipus de TA (exemple extret del tutorial sobre TA Estadística del Kevin Knight i el Philipp Koehn, de la University of Southern California):

Sistema de traducció automàtica

Font: http://people.csail.mit.edu/koehn/publications/tutorial2003.pdf

Per tant, és un tipus de Traducció Automàtica que es va alimentant i va millorant amb la incorporació de noves traduccions.

  • Traducció Automàtica Neuronal:

Segons la Wikipèdia, “la traducció automàtica neuronal (NMT per les sigles en anglès, Neural Machine translation) és un mètode de traducció automàtica que utilitza una xarxa neuronal enorme. Es distancia de les traduccions estadístiques basades en frases que usen subcomponents dissenyats per separat. Els serveis de traducció de Google, Yandex i Microsoft actualment utilitzen NMT. Google utilitza Google Neural Machine Translation (GNMT) amb preferència sobre els seus mètodes estadístics usats anteriorment. Microsoft utilitza una tecnologia similar per als seus traductors de veu (inclòs Microsoft Translator live i Skype Translator). El grup Harvard NLP ha llançat un sistema de TA neuronal de codi obert, OpenNMT.”

La TA neuronal està donant molt bons resultats i és la que s’està fent servir més habitualment en aquests moments.

A casa nostra també tenim un servei de TA, el de Softcatalà, una associació sense ànim de lucre amb la missió de fomentar la presència i l’ús del català en tots els àmbits de les noves tecnologies (TIC). : https://www.softcatala.org/traductor/

3. Quan podem fer servir la TA?

La traducció automàtica no funciona sempre correctament i s’ha d’analitzar molt bé el projecte per saber si ens en podem beneficiar. A LocalizationLab fem servir eines de traducció automàtica neuronal quan veiem que pot reduir costos i temps, sense afectar a la qualitat final de la traducció. En aquest article podeu llegir un cas d’èxit en el que vam utilitzar la traducció automàtica per a textos tècnics i legals.

Abans de proposar a un client aquest servei, primer analitzem la temàtica, el volum i la combinació lingüística i fem una prova amb un extracte del text (que fem revisar per un dels nostres lingüistes) per decidir si el resultat és òptim.

També és molt important tenir en compte que després de la traducció automàtica sempre hi ha d’haver una revisió per un lingüista nadiu especialitzat, aquesta tasca s’anomena postedició  o MTPE per les seves sigles en anglès (Machine Translation Post-Edition). Es tracta d’una revisió exhaustiva que no s’ha de confondre amb una revisió o correcció d’un text traduït per un traductor professional, ja que requereix molta atenció al detall i la temàtica del text.

4. Com em pot ajudar a reduir costos a la meva empresa?

La traducció automàtica et pot ajudar a reduir costos de traducció i aconseguir molt volum de documentació en diversos idiomes a un cost més baix, però s’ha de fer ben fet. No tots els lingüistes volen treballar fent postedició, ja que si la traducció automàtica no és de qualitat, pot fer perdre molt temps al revisor.

La feina del revisor que fa la postedició és molt important en aquest procés, ja que serà l’únic que revisarà el text i s’haurà d’assegurar que és correcte 100%. Detectar els errors en un text traduït de forma automàtica és complicat. De fet, és més fàcil veure un error flagrant que adonar-se que falta un “no”, cosa que pot tenir conseqüències greus a una clàusula contractual.

Si tens molt contingut que necessites en altres idiomes o documents molt extensos o repetitius, és probable que la traducció automàtica et pugui ajudar a aconseguir els teus objectius a un cost i temps menor.

 

Envia’ns un mail a info@localizationlab.com i et farem una estimació de cost i temps perquè puguis valorar-la.