Integration of Language Models in Sequence to Sequence Optical Music Recognition Systems
Torras Coloma, Pau
Fornes Bisquerra, Alicia, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Baró Mas, Arnau, dir.
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title: Integració de Models de Llenguatge en sistemes Sequence to Sequence de Reconeixement Òptic de Partitures
Additional title: Integración de Modelos de Lenguaje en sistemas Sequence to Sequence de Reconocimiento Óptico de Partituras
Date: 2021
Abstract: El present projecte és un estudi del potencial d'integrar per mitjà de diverses tècniques un model de llenguatge a un sistema de Reconeixement Òptic de Partitures (OMR) basat en una arquitectura Sequence to Sequence. L'objectiu és millorar el rendiment del model sobre partitures manuscrites antigues, que són especialment complexes d'interpretar a causa del seu elevat grau de variabilitat i les distorsions que solen incorporar.
Abstract: The following project is a study of the potential of integrating a language model into a Sequence to Sequence-based Optical Music Recognition (OMR) system through various techniques. The goal is to improve the performance of the model on handwritten old music scores, whose interpretation is particularly error-prone due to their high degree of variability and distortion.
Abstract: El presente proyecto es un estudio del potencial de integrar por medio de varias técnicas un modelo de lenguaje a un sistema de Reconocimiento Óptico de Partituras (OMR) basado en una arquitectura Sequence to Sequence. El objetivo es mejorar el rendimiento del modelo sobre partituras manuscritas antiguas, que son especialmente complicadas de interpretar a causa de su elevado grado de variabilidad y las distorsiones que suelen incorporar.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Anglès
Studies: Grau en Enginyeria Informàtica [2502441]
Study plan: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Subject area: Menció Computació
Subject: Deep Learning ; Reconeixement d'escriptura a mà ; Reconeixement Òptic de Partitures ; Sequence to Sequence ; Model de llenguatge ; Visió per Computador ; Xarxes Neuronals Recurrents ; Computer Vision ; Handwriting Recognition ; Language Model ; Optical Music Recognition ; Recurrent Neural Networks ; Reconocimiento de Escritura a mano ; Reconocimiento Óptico de Partituras ; Modelo de Lenguaje ; Visión por Computador ; Redes Neuronales



10 p, 3.0 MB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

 Record created 2021-04-09, last modified 2023-07-22



   Favorit i Compartir