Desenvolupament d'un sistema dereconeixement de Llengua de Signes
Torres Ruiz, Josep Maria
Sánchez Albaladejo, Gemma, tut. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Desarrollo de un Sistema de Reconocimiento de Lengua de Signos Mediante Visión por Computador y Aprendizaje Automático
Títol variant: Development of a Sign Language Recognition System using Computer Vision and Deep Learning
Data: 2025
Resum: En aquest treball s'estudia el reconeixement automàtic de llengua de signes mitjançant tècniques de visió per computador i aprenentatge profund. Es presenten diverses arquitectures que combinen xarxes convolucionals (CNN) amb models seqüencials (LSTM i Transformers), incorporant mecanismes d'atenció per millorar la comprensió temporal. També s'exploren estratègies de tractament de dades, detecció de regions rellevants amb YOLOv8 i solucions al desbalanceig de classes. El projecte proporciona una anàlisi comparativa de diferents enfocaments i proposa línies futures per millorar el reconeixement de signes en vídeo.
Resum: En este trabajo se estudia el reconocimiento automático de lengua de signos mediante técnicas de visión por computador y aprendizaje profundo. Se presentan diversas arquitecturas que combinan redes convolucionales (CNN) con modelos secuenciales (LSTM y Transformers), incorporando mecanismos de atención para mejorar la comprensión temporal. También se exploran estrategias de tratamiento de datos, detección de regiones relevantes con YOLOv8 y soluciones al desbalanceo de clases. El proyecto proporciona un análisis comparativo de diferentes enfoques y propone líneas futuras para mejorar el reconocimiento de signos en vídeo.
Resum: This project explores the task of automatic sign language recognition using computer vision and deep learning techniques. Several architectures are proposed, combining convolutional neural networks (CNNs) with sequential models such as LSTM and Transformers, enhanced with attention mechanisms to better capture temporal dynamics. The study also includes data preprocessing strategies, key region detection using YOLOv8, and methods to address class imbalance. The project offers a comparative analysis of different approaches and outlines future directions for improving sign recognition from video sequences.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Català
Titulació: Grau en Enginyeria de Dades [2503758]
Pla d'estudis: Enginyeria de Dades [1394]
Document: Treball final de grau ; Text
Matèria: Llengua de signes ; Reconeixement automàtic ; Visió per computador ; Deep learning ; CNN ; LSTM ; Transformers ; Atenció ; YOLOv8 ; Lengua de signos ; Reconocimiento automático ; Visión por computador ; Aprendizaje profundo ; Atención ; Sign language ; Automatic recognition ; Computer vision ; Attention ; YoloV8



13 p, 1.5 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2025-07-15, darrera modificació el 2025-07-23



   Favorit i Compartir