tut. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
| Títol variant: |
Web automatic exercise repetiton counter using Computer Vision |
| Títol variant: |
Web de contador automático de repeticiones de ejercicio con Visión por Computador |
| Data: |
2026 |
| Resum: |
La Visió per Computador ofereix noves eines que poden aportar millores i més precisió d'anàlisi i arbitratge als esports professionals, amb mètodes com l'estimació de pose i el reconeixement automàtic d'accions. L'objectiu en aquest projecte és el d'a partir d'un vídeo d'exercici pujat a la web per l'usuari, l'eina desenvolupada sigui capaç de identificar l'exercici i comptar les repeticions que es realitzen. Per a reconèixer l'acció de l'usuari, s'utilitza una xarxa LSTM, entrenada amb el model Sapiens d'estimació de pose de Meta. Per al comptatge de repeticions s'utilitza Estimació de Pose amb YOLOv11 i una transformació homogràfica de la estimació a un pla de referència per corregir la perspectiva de la càmera. L'eina és accessible a través de un navegador, i aquesta ha estat desenvolupada en un entorn frontend React amb una API backend FastAPI. La característica principal en aquesta eina és la seva robustesa a la variació d'angle de gravació, que permet un comptatge precís amb una tolerància gran a les variacions introduïdes per l'usuari al vídeo d'entrada. |
| Resum: |
Computer Vision offers new tools that can add improvements and more precise analysis and refereeing to professional sports, with methods such as Pose Estimation and automatic action recognition. This project's objective is that from an exercise video uploaded to the web by the user, the developed tool is capable of identifying the exercise and counting the repetitions made. To recognize the user's action, a LSTM Network is utilized, trained by Meta's Sapiens Pose Estimation model. For repetition counting, YOLOv11 Pose Estimation is used, along with an homography transformation that converts the estimation to a reference plane, adapting the camera's angle. The tool is accessible through a browser, and has been developed using a React frontend environment and a backend API FastAPI. The project's main feature is its robustness to the camera angle variation, that allows for an accurate counting with high tolerance to variations introduced by the user in the input video. |
| Resum: |
La Visión por Computador ofrece nuevas herramientas que pueden aportar mejoras y más precisión de análisis y arbitraje a los deportes profesionales , con métodos como la estimación de pose y el reconocimiento automático de acciones. El objetivo en este proyecto es el de a partir de un video de ejercicio subido a la web por el usuario, la herramienta desarrollada sea capaz de indentificar el ejercicio y cuente las repeticiones que se realizan. Para reconocer la acción del usuario, se utiliza una red neuronal LSTM, entrenada con el modelo Sapiens de estimación de pose de Meta. Para el conteo de repeticiones se utiliza la Estimación de Pose con YOLOv11 y una transformación homográfica a un plano de referencia para corregir la perspectiva de la cámara. La herramienta es accesible a través de un navegador, i ésta ha estado desarrollada en un entorno frontend React con una API backend FastAPI. La característica principal de esta herramienta es su robustez a la variación del ángulo de grabación, que permite un conteo preciso con una tolerancia grande a las variaciones introducidas por el usuario en el vídeo de entrada. |
| Drets: |
Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra, i la creació d'obres derivades, sempre que no sigui amb finalitats comercials i que es distribueixin sota la mateixa llicència que regula l'obra original. Cal que es reconegui l'autoria de l'obra original.  |
| Llengua: |
Català |
| Titulació: |
Enginyeria Informàtica [2502441] |
| Pla d'estudis: |
Enginyeria Informàtica [958] |
| Document: |
Treball final de grau |
| Àrea temàtica: |
Menció Tecnologies de la Informació |
| Matèria: |
Visió per Computador ;
Estimació de Pose ;
LSTM ;
Sapiens ;
YOLOv11 ;
FastAPI ;
React ;
Comptador de Repeticions ;
Computer Vision ;
Pose Estimation ;
Repetition Counter ;
Visión por Computador ;
Estimación de Pose ;
Contador de Repeticiones |