Mejora léxica del motor de traducción Catalán-Gallego de Apertium
Toboso Sala, Patricia
Riera Irigoyen, Marc, dir.
Orjales Otero, Enrique
Universitat Autònoma de Barcelona. Facultat de Traducció i d'Interpretació

Additional title: Millora lèxica del motor de traducció català-gallec d'Apertium
Additional title: Lexical Improvement of the Catalan-Galician Translation Engine of Apertium
Date: 2022
Abstract: Aquest treball de fi de màster té com a objectiu reprendre i millorar el motor de traducció automàtica basada en regles d'Apertium entre el parell de llengües minoritzades català-gallec. Concretament, pretén millora la qualitat lingüística del motor augmentant la cobertura lèxica i disminuint els valors de les mètriques WER i PER. És per aquest motiu que la part central del treball es basa en tres fases: l'optimització del motor, les avaluacions d'aquest en el seu estat previ i posterior a les nostres modificacions i la comparació juntament amb l'anàlisi dels resultats obtinguts de les avaluacions del motor en el seu estat inicial i final. Així mateix, una altra fase crucial consisteix en l'explicació al detall de la preparació dels recursos que s'han necessitat per dur a terme aquest treball. En particular, aquests comprenen la creació d'un text de referència, la instal·lació d'Apertium, l'obtenció de cobertures lèxiques, l'extracció de les mètriques WER i PER i, per últim, l'execució de proves de vocabulari.
Abstract: Este trabajo de fin de máster tiene como objetivo retomar y mejorar el motor de traducción automática basada en reglas de Apertium entre el par de lenguas minorizadas catalán-gallego. Concretamente, pretende mejorar la calidad lingüística del motor aumentando la cobertura léxica y disminuyendo los valores de las métricas WER y PER. Es por este motivo que la parte central del trabajo se basa en tres fases: la optimización del motor, las evaluaciones de este en su estado previo y posterior a nuestras modificaciones y la comparación junto con el análisis de los resultados obtenidos de las evaluaciones del motor en su estado inicial y final. Asimismo, otra fase crucial consiste en la explicación al detalle de la preparación de los recursos que se han necesitado para llevar a cabo este trabajo. En particular, estos abarcan la creación de un texto de referencia, la instalación de Apertium, la obtención de coberturas léxicas, la extracción de las métricas WER y PER y, por último, la ejecución de pruebas de vocabulario.
Abstract: The main purpose of this master's dissertation is to resume and improve the rule-based machine translation engine of Apertium between the minoritised languages of Catalan and Galician. Specifically, it aims at improving the linguistic quality of this engine by increasing its lexical coverage as well as lowering the WER and PER metric scores. This is why the core of this paper is based on three stages: on the one hand, the optimisation of the engine; on the other hand, its evaluation before and after our modifications; and, finally, the comparison and analysis of the obtained results from the evaluations of the engine in its initial and current state. Furthermore, another crucial phase consists of the detailed explanation of the preparation of the resources needed to perform this dissertation. In particular, these resources encompass the creation of a reference text, the installation of Apertium, the extraction of both lexical coverages and WER and PER metrics, and, last but not least, the execution of vocabulary tests.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Castellà
Studies: Tradumàtica: Tecnologies de la Traducció [4315970]
Study plan: Màster Universitari en Tradumàtica: Tecnologies de la Traducció [1350]
Document: Treball de fi de postgrau ; Text
Subject: Apertium ; Traducció automàtica basada en regles ; Llengües minoritzades ; Motor de traducció català-gallec ; Millora lèxica ; Traducción automática basada en reglas ; Lenguas minorizadas ; Motor de traducción catalán-gallego ; Mejora léxica ; Rule-based machine translation ; Minoritised languages ; Catalan-Galician translation engine ; Lexical improvement



48 p, 2.7 MB

The record appears in these collections:
Research literature > Dissertations > Translation and Interpreting. MT

 Record created 2023-07-24, last modified 2023-07-30



   Favorit i Compartir