Integration of Language Models in Sequence to Sequence Optical Music Recognition Systems
Torras Coloma, Pau
Fornes Bisquerra, Alicia, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Baró Mas, Arnau, dir.
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Integració de Models de Llenguatge en sistemes Sequence to Sequence de Reconeixement Òptic de Partitures
Títol variant: Integración de Modelos de Lenguaje en sistemas Sequence to Sequence de Reconocimiento Óptico de Partituras
Data: 2021
Resum: El present projecte és un estudi del potencial d'integrar per mitjà de diverses tècniques un model de llenguatge a un sistema de Reconeixement Òptic de Partitures (OMR) basat en una arquitectura Sequence to Sequence. L'objectiu és millorar el rendiment del model sobre partitures manuscrites antigues, que són especialment complexes d'interpretar a causa del seu elevat grau de variabilitat i les distorsions que solen incorporar.
Resum: The following project is a study of the potential of integrating a language model into a Sequence to Sequence-based Optical Music Recognition (OMR) system through various techniques. The goal is to improve the performance of the model on handwritten old music scores, whose interpretation is particularly error-prone due to their high degree of variability and distortion.
Resum: El presente proyecto es un estudio del potencial de integrar por medio de varias técnicas un modelo de lenguaje a un sistema de Reconocimiento Óptico de Partituras (OMR) basado en una arquitectura Sequence to Sequence. El objetivo es mejorar el rendimiento del modelo sobre partituras manuscritas antiguas, que son especialmente complicadas de interpretar a causa de su elevado grado de variabilidad y las distorsiones que suelen incorporar.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Anglès
Titulació: Grau en Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Àrea temàtica: Menció Computació
Matèria: Deep Learning ; Reconeixement d'escriptura a mà ; Reconeixement Òptic de Partitures ; Sequence to Sequence ; Model de llenguatge ; Visió per Computador ; Xarxes Neuronals Recurrents ; Computer Vision ; Handwriting Recognition ; Language Model ; Optical Music Recognition ; Recurrent Neural Networks ; Reconocimiento de Escritura a mano ; Reconocimiento Óptico de Partituras ; Modelo de Lenguaje ; Visión por Computador ; Redes Neuronales



10 p, 3.0 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2021-04-09, darrera modificació el 2023-07-22



   Favorit i Compartir