Web of Science: 2 citas, Scopus: 3 citas, Google Scholar: citas
English-Catalan Neural Machine Translation : state-of-the-art technology, quality, and productivity
Briva-Iglesias, Vicent (Dublin City University)

Título variante: Traducció automàtica neuronal anglès-català : tecnologia punta, qualitat i productivitat
Título variante: Traducción automática neuronal inglés-catalán : tecnología punta, calidad y productividad
Fecha: 2022
Resumen: Recent major changes and technological advances have consolidated machine translation (MT) as a key player to be considered in the language services world. In numerous instances, it is even an essential player due to budget and time constraints. Much attention has been paid to MT research recently, and MT use by professional or amateur users has increased. Yet, research has focused mainly on language combinations with huge amounts of online available corpora (e. g. English-Spanish). The situation for minoritized or stateless languages like Catalan is different. This study analyses Softcatalà's new open-source, neural machine translation engine and compares it with Google Translate and Apertium in the English-Catalan language pair. Although MT engine developers use automatic metrics for MT engine evaluation, human evaluation remains the gold standard, despite its cost. Using TAUS DQF tools, translation quality (in terms of relative ranking, adequacy and fluency) and productivity (comparing editing times and distances) have been evaluated with the participation of 11 evaluators. Results show that Softcatalà's Translator offers higher quality and productivity than the other engines analysed.
Resumen: Els recents i importants canvis i avenços tecnològics han consolidat la traducció automàtica (TA) com un actor clau a tenir en compte en el món dels serveis lingüístics. En molts casos, és fins i tot un actor essencial a causa de les limitacions de pressupost i temps. Últimament, la recerca en TA ha rebut molta atenció i se n'ha augmentat l'ús per part d'usuaris professionals i aficionats. De tota manera, la recerca s'ha centrat principalment en les combinacions lingüístiques amb grans quantitats de corpus disponibles en línia (per exemple, anglès-castellà). La situació de les llengües minoritàries o no oficials a un estat, com el català, és diferent. Aquest estudi analitza el nou motor de traducció automàtica neuronal de codi obert de Softcatalà i el compara amb el Google Traductor i l'Apertium en la combinació lingüística anglès-català. Tot i que els desenvolupadors de motors de traducció automàtica fan servir mètriques automàtiques per avaluar-los, l'avaluació humana continua sent la pràctica de referència, tot i el cost que implica. Per mitjà de les eines TAUS DQF, s'ha avaluat la qualitat de la traducció (en termes de classificació relativa, adequació i fluïdesa) i la productivitat (comparant els temps d'edició i les distàncies) amb la participació d'11 avaluadors. Els resultats mostren que el traductor de Softcatalà ofereix una qualitat i productivitat majors que els altres motors analitzats.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, fins i tot amb finalitats comercials, sempre i quan es reconegui l'autoria de l'obra original. Creative Commons
Lengua: Anglès
Documento: Article ; recerca ; Versió publicada
Materia: Machine translation ; Translation technologies ; Human evaluation ; Catalan ; Translation quality ; Quality evaluation ; Traducció automàtica ; Tecnologies de la traducció ; Avaluació humana ; Català ; Qualitat de la traducció ; Avaluació de la qualitat ; Traducción automática ; Tecnologías de la traducción ; Evaluación humana ; Catalán ; Calidad de la traducción ; Evaluación de la calidad
Publicado en: Tradumàtica, Núm. 20 (2022) , p. 149-176 (Tradumàtica oberta) , ISSN 1578-7559

Adreça original: https://revistes.uab.cat/tradumatica/article/view/n20-briva-iglesias
DOI: 10.5565/rev/tradumatica.303


28 p, 478.3 KB

El registro aparece en las colecciones:
Artículos > Artículos publicados > Revista Tradumàtica
Artículos > Artículos de investigación

 Registro creado el 2022-12-20, última modificación el 2023-03-26



   Favorit i Compartir