Análisis de dos sistemas de reconocimiento del habla para su combinación con un editor de subtítulos para programas en directo o sin guion

Esquer Salom, Andrea

Bibliographic citation -- Permanent link: https://ddd.uab.cat/record/210866

Análisis de dos sistemas de reconocimiento del habla para su combinación con un editor de subtítulos para programas en directo o sin guion
Esquer Salom, Andrea
Martín Mor, Adrià,

tut. (Universitat Autònoma de Barcelona. Àrea de Traducció i Interpretació)
Universitat Autònoma de Barcelona. Facultat de Traducció i d'Interpretació

Additional title:	Anàlisi de dos sistemes de reconeixement de la parla per la seva combinació amb un editor de subtítols per programes en directe o sense guió
Additional title:	Analysis of two speech recognition systems for their combination with a subtitle editor for live or non-scripted programs
Date:	2019
Description:	35 p.
Abstract:	És cada cop més comú l'ús de sistemes de reconeixement de la parla per dur a terme diferents tasques, com buscar amb els nostres dispositius o dictar text. En aquest treball es pretén analitzar dos sistemes de reconeixement de la parla per a la seva combinació amb un editor de subtítols per programes en directe o sense guió. El principal objectiu és analitzar el dictat de dos vídeos, un en espanyol i l'altre en anglès, i els errors que apareixen després d'aquest dictat. Per fer-ho, s'han utilitzat els sistemes de reconeixement de la parla Dragon NaturallySpeaking i Windows Speech Recognition, amb un entrenament d'aquests bàsic, i s'han dictat dos textos extrets de programes d'entrevistes d'un minut de durada. Després de realitzar l'anàlisi dels resultats obtinguts podem afirmar que la majoria d'errors que cometen els sistemes de reconeixement de la parla són de reconeixement d'alguns termes que poden afectar a la comprensió del text. En conclusió, perquè els sistemes funcionin de manera correcta, s'han de tenir en compte diversos factors, com un bon entrenament. I, en el cas de la seva combinació amb un editor de subtítols també s'ha de parar atenció a tot allò relacionat amb la subtitulació, com per exemple el pautatge del text.
Abstract:	Es cada vez más común el uso de sistemas de reconocimiento del habla para llevar a cabo distintas tareas, como buscar con nuestros dispositivos o dictar texto. En este trabajo se pretende analizar dos sistemas de reconocimiento del habla para su combinación con un editor de subtítulos para programas en directo o sin guion. El principal objetivo es analizar el dictado de dos vídeos, uno en español y otro en inglés, y los errores que aparecen tras este dictado. Para ello se han usado los sistemas de reconocimiento del habla Dragon NaturallySpeaking y Windows Speech Recognition, con un entrenamiento de estos básico, y se han dictado dos textos extraídos de programas de entrevistas de un minuto de duración. Tras realizar el análisis de los resultados obtenidos podemos afirmar que la mayoría de errores que cometen los sistemas de reconocimiento del habla son de reconocimiento de algunos términos que pueden afectar a la comprensión del texto. En conclusión, para que los sistemas funcionen de manera correcta se deben tener en cuenta diversos factores, como un buen entrenamiento. Y, en el caso de su combinación con un editor de subtítulos también se debe prestar atención a todo aquello relacionado con la subtitulación, como por ejemplo el pautaje del texto.
Abstract:	It is increasingly common to use speech recognition systems to carry out different tasks, such as searching with our devices or dictating text. In this paper, we intend to analyse two speech recognition systems for their combination with a subtitle editor for live or non-scripted programs. The main objective is to analyse the dictation of two videos, one in Spanish and one in English, and the errors that appear after this dictation. To this end, speech recognition systems Dragon NaturallySpeaking and Windows Speech Recognition have been used, with a basic training of these, and two texts extracted from one-minute talk programs have been dictated. After carrying out the analysis of the obtained results, we can affirm that the majority of errors that the speech recognition systems make are recognition of some terms that may affect the comprehension of the text. In conclusion, for systems to function correctly, several factors must be taken into account, such as good training. And, in the case of its combination with a subtitle editor, attention should be also paid to everything related to subtitling, such as for example the parameters of the text.
Rights:	Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.
Language:	Castellà
Studies:	Tradumàtica: Tecnologies de la Traducció [4315970]
Series:	Facultat de Traducció i d'Interpretació. Màster en Tradumàtica. tecnologies de la traducció
Document:	Treball de fi de postgrau
Subject:	Tecnologia -- Traducció ; Reconeixement automàtic de la parla ; Subtitulació ; Interfícies d'usuari (Informàtica) -- Avaluació ; Audiovisuals -- Traducció ; Programes d'entrevistes ; Percepció del llenguatge ; Micròfons ; So -- Aparells i instruments ; Transcripció ; Pronunciació ; Dicció

35 p, 895.7 KB

The record appears in these collections:
Research literature > Dissertations > Translation and Interpreting. MT

Record created 2019-07-23, last modified 2025-03-28

Similar records

Add to personal basket
Export as Citation, BibTeX, MARC, MARCXML, DC, EDM OpenAire4