La Wikipedia com una font de dades per un corpus paral·lel ES-NL
Fernández Veloso, Ana María
Gibert Bonet, Ona de, dir.
Universitat Autònoma de Barcelona. Facultat de Traducció i d'Interpretació

Additional title: Wikipedia as data source for an ES-NL parallel corpus
Date: 2021
Abstract: En plena era de la globalització, la comunicació internacional es fa indispensable en el procés d'evolució econòmica, política, social i cultural de cada país. En aquest cas concret, la barrera terrenal que hi ha entre Espanya, Bèlgica i els Països Baixos es veu ara difuminada pel creixent turisme entre aquestes àrees. I, consegüentment, l'actual situació lingüística d'aquestes regions posa en evidència la necessitat de recursos fiables i de qualitat que permetin l'apropament, la comunicació fluida i l'aprenentatge de les llengües. Per això, aquest treball proposa, d'una banda, la construcció d'un corpus paral·lel neerlandès - espanyol com a combinació lingüística, i l'entrenament d'un motor de traducció automàtica neuronal (TAN) a partir d'aquest; i de l'altra, la posterior avaluació i comparació amb un motor existent ja entrenat.
Abstract: En plena era de la globalización, la comunicación internacional se vuelve indispensable en el proceso de evolución económica, política, social y cultural de cada país. En este caso concreto, la barrera terrenal que existe entre España, Bélgica y Países Bajos se ve ahora difuminada por el creciente turismo entre dichas áreas. Y, consecuentemente, la actual situación lingüística de sendas regiones pone en evidencia la necesidad de recursos fiables y de calidad que permitan el acercamiento, la comunicación fluida y el aprendizaje de sus lenguas. Por ello, el presente trabajo propone, por un lado, la construcción de un corpus paralelo neerlandés - español como combinación lingüística, y el entrenamiento de un motor de traducción automática neuronal (TAN) a partir del mismo; y por el otro, su posterior evaluación y comparación con un motor existente ya entrenado.
Abstract: During these times of globalization, international communication is becoming indispensable in the process of economic, political, social and cultural evolution of each country. In this particular case, the barrier that exists between Spain, Belgium and the Netherlands is now blurred by the growing tourism between these areas. And, consequently, the current linguistic situation of both regions highlights the need for reliable and quality resources that allow the rapprochement, fluid communication and learning of their languages. Therefore, the present thesis proposes, on one hand, the construction of a parallel Dutch-Spanish corpus as a linguistic combination, and the training of a neural machine translation engine (TAN) based on this same corpus; and on the other hand, its evaluation and comparison with an existing engine that had already been trained.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Castellà
Studies: Màster Universitari en Tradumàtica: Tecnologies de la Traducció [1350]
Study plan: Tecnologies de la Traducció [4315970]
Document: Treball final de grau ; Text
Subject: Lingüística computacional ; Corpus paral·lel ; Traducció automàtica ; TA ; Traducció automàtica neuronal ; TAN ; Llengua espanyola ; Llengua neerlandesa ; Entrenament d'un motor de traducció ; MutNMT ; Corpus paralelo ; Traducción automática ; Traducción automática neuronal ; Lengua española ; Lengua neerlandesa ; Entrenamiento de un motor de traducción ; Computational linguistics ; Paralel corpus ; Machine Translation ; MT ; Neural Machine Translation ; NMT ; Spanish Language ; Dutch Language ; Machine translation training



63 p, 2.1 MB

The record appears in these collections:
Research literature > Bachelor's degree final project > Faculty of Translation and Interpreting

 Record created 2023-07-24, last modified 2023-10-21



   Favorit i Compartir