Evaluación comparativa de corpus usados en el entrenamiento de un motor de TAE para la traducción de guías docentes de la Universidad Autónoma de Barcelona
Pacheco Ortiz, Lucía Carolina
Piqué Huerta, Ramon, dir. (Universitat Autònoma de Barcelona)
Universitat Autònoma de Barcelona. Facultat de Traducció i d'Interpretació

Fecha: 2020
Resumen: En este trabajo de fin de máster se lleva a cabo la creación de seis motores de traducción automática estadística (EN>ES) mediante la plataforma de MTradumática, entrenados con corpus de entrenamiento y optimización reunidos a partir de guías docentes de programas del área de Humanidades de la Universidad Autónoma de Barcelona. Se realiza una comparación entre las traducciones realizadas con dichos motores, así como entre ellas y las traducciones creadas con el motor de traducción automática Google Translate, para lo cual se usa el sistema de evaluación BLEU. Así se pretende establecer si un motor de traducción automática estadística personalizado ofrece mejores resultados a la hora de traducir las guías docentes de la UAB que un motor de traducción automática neuronal de carácter general tal como Google Translate, e igualmente se pretende discernir cuál es el mejor de los motores especializados y qué características deben cumplir un corpus de entrenamiento y un corpus de optimización.
Resumen: For this Master's Degree Dissertation, six statistical machine translation engines (EN>ES) were created using the MTradumática platform, trained with training and optimization corpus gathered from syllabi for programs in the Humanities area of the Universidad Autónoma de Barcelona. A comparison is made between the translations created with those engines, as well as between them and the translations created with the Google Translate machine translation engine; using the BLEU evaluation system. The aim is to establish whether a customized statistical machine translation engine offers better results when translating the UAB syllabi than a general neural machine translation engine such as Google Translate, and also to discern which is the best of the specialized engines, and what features should a training corpus and an optimization corpus have.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Lengua: Castellà
Titulación: Tradumàtica: Tecnologies de la Traducció [4315970]
Plan de estudios: Màster Universitari en Tradumàtica: Tecnologies de la Traducció [1350]
Documento: Treball final de grau ; Text
Materia: Traducción automática ; BLEU ; Motor de traducción automática ; MTradumática ; Corpus de entrenamiento ; Corpus de optimización ; Machine translation ; Machine translation engine ; Training corpus ; Optimization corpus



70 p, 1.2 MB

El registro aparece en las colecciones:
Documentos de investigación > Trabajos de investigación y proyectos de final de carrera > Traducción e Interpretación. TFM

 Registro creado el 2021-10-08, última modificación el 2022-07-02



   Favorit i Compartir