Reconocimiento de partituras musicales
Santaella Trujillo, Toni
Fornes Bisquerra, Alicia, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Recognition of musical sheets
Títol variant: Reconeixement de partitures musicals
Data: 2022
Resum: El Optical Music Recognition (OMR) es un campo de investigación que investiga como leer computacionalmente notación musical en documentos, dicho campo ha demostrado ser díficil de tratar debido a la calidad de los resultados que se obtiene. Muchos han intentado acercarse a este problema usando métodos de Deep Learning, diviendo el problema en diferentes pasos como el reconocimiento de los símbolos musicales de la partitura y la reconstrucción de la información musical para poder formar un modelo que de una descripción de esta partitura. La mayoría de sistemas OMR solo cubren una parte de todo este sistema sin llegar a producir un archivo con el que podamos escuchar la notación musical que estos analizan. En este documento se propone un modelo sequence-to-sequence capaz de producir archivos MIDI a partir de imágenes que contengan notación musical.
Resum: Optical Music Recognition (OMR) is research field that has proven to be difficult to deal with because of the quality of the results researchers have obtained. Many have tried to approach this problem using Deep Learning methods, breaking the problem into different steps as music symbol recognition and musical information reconstruction to form a model that can give a description of the sheet. The majority of this OMR systems only cover a part of all this system without getting to produce a file which can reproduce the musical notation they are analyzing. In this paper we propose a sequence-to-sequence model that can produce MIDI files from images containing musical notation.
Resum: L'Optical Music Recognition (OMR) és un camp de recerca que investiga com llegir computacionalment notació musical en documents, aquest camp ha demostrat ser difícil de tractar a causa de la qualitat dels resultats que s'obté. Molts han intentat apropar-se a aquest problema usant mètodes de Deep Learning, divint el problema en diferents passos com ara el reconeixement dels símbols musicals de la partitura i la reconstrucció de la informació musical per poder formar un model que d'una descripció d'aquesta partitura. La majoria de sistemes OMR només cobreixen una part de tot aquest sistema sense arribar a produir un arxiu amb què puguem escoltar la notació musical que aquests analitzen. En aquest document es proposa un model sequence-to-sequence capaç de produir fitxers MIDI a partir d'imatges que continguin notació musical.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Castellà
Titulació: Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Àrea temàtica: Menció Computació
Matèria: Seq2seq ; WAV ; OMR



10 p, 897.3 KB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2022-07-21, darrera modificació el 2025-07-20



   Favorit i Compartir