Reading Time: 4 minutes

intel·ligència artificial

Estem vivim temps difícils. Les coses estan canviant ràpidament en el món en general i en el sector dels serveis lingüístics en particular. La intel·ligència artificial està cada vegada més present en tots els àmbits de la nostra vida i la nostra feina. Com podem adaptar-nos i crear oportunitats per ajudar millor als nostres clients?

Comencem amb algunes definicions per entendre millor tots els conceptes relacionats amb la intel·ligència artificial en el sector del serveis lingüístics:

  1. Traducció automàtica neuronal (NMT):

La traducció automàtica neuronal (NMT) és un mètode de traducció automàtica basat en xarxes neuronals artificials que ha experimentat importants millores en els últims anys. Abans de l’arribada de la NMT, els motors de traducció automàtica es basaven en mètodes estadístics, que tenen més limitacions i errors.

  1. Postedició de traducció automàtica (MTPE):

La postedició de traducció automàtica (MTPE) es refereix a la revisió d’un text traduït automàticament (produït per un motor NMT) per part d’un traductor professional o un lingüista especialitzat. El treball del traductor en el procés de postedició és diferent al d’altres tipus de revisió ja que ha de tenir en compte que la traducció ha estat feta amb intel·ligència artificial, que no sempre és coherent i pot cometre errors culturals i contextuals.

  1. Model de llenguatge extens (LLM):

Un model de llenguatge extens (LLM) és un model estadístic gegant que utilitza una gran quantitat de dades per produir contingut.  “Un model de llenguatge extens (amb acrònim, MLE, i també coneguts per les sigles angleses LLM) és un model de llenguatge que consisteix en una xarxa neuronal amb molts paràmetres (normalment milers de milions o més), entrenats en grans quantitats de text i mitjançant aprenentatge no supervisat. Els MLE van sorgir al voltant del 2018 i funcionen bé en una gran varietat de tasques. Això ha desplaçat el focus de la investigació sobre el processament del llenguatge natural del paradigma anterior de formació de models supervisats especialitzats per a tasques específiques.”* Alguns LLM són privats (com el ChatGPT  OpenAI) i d’altres són de codi obert.

*Font: Viquipèdia

  1. Enginyeria de missatges d’indicació (prompts):

“L’enginyeria de missatges d’indicació és el procés d’estructuració d’un text que es pot interpretar i entendre mitjançant un model d’intel·ligència artificial generatiu. Un missatge d’indicació o prompt és un text en llenguatge natural que descriu la tasca que ha de realitzar una intel·ligència artificial (IA).”*

*Font: Viquipèdia (en castellà)

Exemples d’enginyeria de missatges d’indicació:

Si simplement preguntem a ChatGPT en anglès què és un LLM, no ens dona la resposta esperada. No obstant això, si després li donem més context, l’LLM ho fa bé:

Quan vam preguntar a ChatGPT: “Explica’m què és un LLM”, tenim la següent resposta:

A continuació, hem preguntat a ChatGPT: «I en el context d’un model lingüístic?» i vam obtenir la següent resposta:

Alternativament, podem començar per incloure més informació a la pregunta inicial, la qual cosa donarà com a resultat una millor resposta. És el que s’anomena “enginyeria de missatges d’indicació”:

  1. Intel·ligència artificial generativa:

“La intel·ligència artificial generativa o IA generativa és un tipus de sistema d’intel·ligència artificial (IA) capaç de generar text, imatges o altres mitjans en resposta a comandes. Els models d’IA generativa aprenen els patrons i l’estructura de les seves dades d’entrenament d’entrada i després generen noves dades que tenen característiques similars.”*

*Font: Viquipèdia

A continuació us detallem algunes de les característiques dels LLM:

  1. Es basen en milions de segments.
  2. Es poden combinar amb memòries de traducció (TM) i traducció automàtica (MT) + glossari per prendre decisions basades en tots aquests recursos.
  3. Donen més opcions als traductors, el que significa que la tasca de revisió és una part crucial del procés, la de l’elecció humana, i per tant el traductor es converteix en una peça clau per millorar la creativitat i la naturalitat d’un text.
  4. Podem utilitzar el llenguatge natural per interactuar amb els LLM i rebre respostes coherents.
  5. Hi ha diferents nivells d’ús dels LLM:
  6. Enginyeria de prompts (no personalitzable)
  7. Personalització de models LLM amb Python (models de codi obert)
  8. Creació el teu propi LLM

Ara que sabem què són els LLM i com funcionen, mirem alguns exemples de casos reals i de com es poden fer servir:

  1. Creació de glossaris: Et permeten extreure termes d’un text per afegir-los a un glossari. Fins i tot pot afegir una definició per a cada terme.
  2. Reestructuració d’arxius .srt (per a subtítols): Poden convertir línies segmentades en frases reals en fitxers .srt perquè les eines CAT puguin processar-les correctament.
  3. Revisió de la qualitat de la traducció (LQA): Poden analitzar textos i realitzar comprovacions de qualitat en diferents idiomes.

Queda clar que els LLM ofereixen avantatges per a la indústria lingüística, però hi ha algunes advertències a tenir en compte:

  1. Hi ha al voltant de 7.000 idiomes al món, però els LLM només s’han entrenat en uns 20, majoritàriament en anglès, el que significa que encara queda un llarg camí per recórrer.
  2. Els LLM poden cometre errors, per la qual cosa és fonamental que els experts en la matèria revisin la informació que generen.
  3. En funció de l’LLM que utilitzem, hem de tenir en compte que qualsevol informació que pugem s’utilitzarà per entrenar-lo i perdrem el control de la informació confidencial.

Conclusió

Hem de convertir-nos en experts en IA per ajudar els nostres clients a implementar-la en els seus processos. Hem d’aprendre a utilitzar NMT, LLM i qualsevol altra eina d’intel·ligència artificial (IA) que ens pugui fer més productius, reduir costos i ajudar els nostres clients en funció de les seves necessitats.

Si vols saber com implementar la IA en els teus processos, envia’ns un correu electrònic i analitzarem el teu projecte. Serà un plaer ajudar-te.