Evaluación de la transcripción generada automáticamente con Whisper aplicada a la traducción audiovisual y la accesibilidad a contenido audiovisual
Acedo Ortega, Anna
Sánchez-Gijón, Pilar, dir. (Universitat Autònoma de Barcelona. Departament de Traducció i d'Interpretació i d'Estudis de l'Àsia Oriental)
Universitat Autònoma de Barcelona. Facultat de Traducció i d'Interpretació

Títol variant: Avaluació de la transcripció generada automàticament amb Whisper aplicada a la traducció audiovisual i la accessibilitat a contingut audiovisual
Títol variant: Evaluation of Whisper's automatically generated transcription applied to audiovisual translation and accessibility to audiovisual content
Publicació: Bellaterra : Universitat Autònoma de Barcelona, 2023
Resum: El present estudi busca analitzar la qualitat de la transcripció de l'eina Whisper des d'un punt de vista general de la correcció de la llengua. Per a això, es farà una comparació d'aquesta transcripció amb els subtítols generats automàticament de l'eina YouTube Studio i, finalment, amb la transcripció humana creada per l'autora del present treball. L'objectiu final d'aquest estudi és observar la correcció lingüística o nivell d'encert de la transcripció de Whisper, la viabilitat de l'ús d'aquesta eina que usa el reconeixement de la parla amb transcripció automàtica, aplicat al camp de la traducció audiovisual. Per a dur a terme aquestes tasques, s'ha realitzat un estudi amb 25 mostres en 5 idiomes i 1 dialecte: espanyol, anglès, francès, català, valencià i japonès. S'espera obtenir resultats que reflecteixin si l'ús de la transcripció generada a partir del reconeixement de la parla pot ajudar en la tasca de la traducció audiovisual i l'accessibilitat a aquesta mena de contingut.
Resum: El presente estudio busca analizar la calidad de la transcripción de la herramienta Whisper desde un punto de vista general de la corrección de la lengua. Para ello, se hará una comparación de dicha transcripción con los subtítulos generados automáticamente de la herramienta YouTube Studio y, finalmente, con la transcripción humana creada por la autora del presente trabajo. El objetivo final de este estudio es observar la corrección lingüística o nivel de acierto de la transcripción de Whisper, la viabilidad del uso de esta herramienta que usa el reconocimiento del habla con transcripción automática, aplicado al campo de la traducción audiovisual. Para llevar a cabo estas tareas, se ha realizado un estudio con 25 muestras en 5 idiomas y 1 dialecto: español, inglés, francés, catalán, valenciano y japonés. Se espera obtener resultados que reflejen si el uso de la transcripción generada a partir del reconocimiento del habla puede ayudar en la tarea de la traducción audiovisual y la accesibilidad a este tipo de contenido.
Resum: The present study wants to analyze the quality of the transcription automatically generated by Whisper from a general point of view of language correctness. For this purpose, a comparison will be made between the transcription and the subtitles automatically generated by YouTube Studio and, finally, with the human transcription created by the author of this paper. The final purpose of this study is to observe the linguistic correctness or level of accuracy of the Whisper transcription, and the feasibility of using this tool that uses speech recognition with automatic transcription, applied to the field of audiovisual translation. To determine this, a study has been carried out with 25 samples in 5 languages and 1 dialect: Spanish, English, French, Catalan, Valencian and Japanese. It is expected to obtain results that reflect whether the use of transcription generated from speech recognition can help in the task of audiovisual translation and accessibility to this type of content.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Castellà
Titulació: Màster Universitari en Tradumàtica: Tecnologies de la Traducció [1350]
Pla d'estudis: Tecnologies de la Traducció [4315970]
Document: Treball de fi de postgrau ; Text
Matèria: Traducció ; Reconeixement de la parla ; Traducció Audiovisual ; Whisper ; Open AI ; Tradumática ; Reconocimiento del habla ; Traducción Audiovisual ; Translation ; Speech Recognition ; Audiovisual Translation



74 p, 2.6 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de recerca i projectes de final de carrera > Traducció i Interpretació. TFM

 Registre creat el 2023-10-16, darrera modificació el 2023-10-20



   Favorit i Compartir