Traducció automàtica de la parla : creació i avaluació de sis motors de TAE
Jiménez Molina, Noelia
Sánchez Gijón, María Pilar, dir. (Universitat Autònoma de Barcelona)
Universitat Autònoma de Barcelona. Facultat de Traducció i d'Interpretació

Additional title: Traducción automática del habla : Creación y evaluación de seis motores de TAE
Additional title: Spoken Language Translation : Creating and Evaluating Six SMT Engines
Date: 2020
Abstract: La traducció automàtica (TA) ha millorat notablement aquests darrers anys. No obstant això, la traducció de la parla i el processament del llenguatge natural encara són un desafiament per als sistemes de TA. Aquest treball sorgeix amb la motivació d'aportar una possible solució a la manca de naturalitat de la traducció automàtica per veu. La hipòtesi és que es pot millorar l'oralitat de les traduccions mitjançant corpus orals transcrits i optimitzacions en l'entrenament dels sistemes de TA. Per demostrar aquesta hipòtesi, es creen amb KantanMT (després d'haver provat amb MTradumàtica) sis motors de traducció automàtica estadística entrenats amb diferents corpus orals transcrits i escrits per després, evaluar-los.
Abstract: La traducción automática (TA) ha mejorado notablemente en los últimos años; sin embargo, la traducción del habla y el procesamiento del lenguaje natural siguen siendo todo un reto para los sistemas de TA. Este trabajo surge con la motivación de aportar una posible solución a la falta de naturalidad en la traducción automática del habla. Se parte de la hipótesis de que se puede mejorar la oralidad de las traducciones introduciendo corpus orales transcritos y optimizaciones en el entrenamiento de los sistemas de TA. Para probar esta hipótesis, se crean con KantanMT -tras probar MTradumàtica- seis motores de traducción automática estadística entrenados con distintos corpus orales transcritos y escritos y, después, se evalúan.
Abstract: Machine Translation (MT) has been greatly improved in recent years. Nevertheless, Spoken Language Translation (SLT) and natural language processing remain a major challenge for MT engines. The purpose of this work is to provide a possible solution to the lack of naturalness in SLT. The work is based on the hypothesis that it is possible to improve the orality of translations by introducing transcribed oral corpus and optimizations in the training process of MT systems. To test this hypothesis, six statistical machine translation engines, trained with different transcribed oral and written corpora, were created with KantanMT, after trying MTradumàtica, and then evaluated.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Castellà
Studies: Tradumàtica: Tecnologies de la Traducció [4315970]
Study plan: Màster Universitari en Tradumàtica: Tecnologies de la Traducció [1350]
Document: Treball de fi de postgrau ; Text
Subject: Traducció automàtica de la parla ; Reconeixement automàtic de la parla ; Traducció automàtica estadística ; MTradumàtica ; KantanMT ; Traducción automática del habla ; Reconocimiento automático del habla ; Traducción automática estadística ; Spoken language translation ; Automatic speech recognition ; Statistical machine translation



95 p, 1.8 MB

The record appears in these collections:
Research literature > Dissertations > Translation and Interpreting. MT

 Record created 2021-10-08, last modified 2022-07-02



   Favorit i Compartir