Sistema de reconocimiento de partituras musicales y generación de archivos sonoros
Echevarría Naharro, Daniel
Fornes Bisquerra, Alicia, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title: System for the recognition of musical scores and generation of sound files
Additional title: Sistema de reconeixement de partitures musicals i generació d'arxius sonors
Date: 2021
Abstract: El OMR o Reconocimiento Óptico de Música es una tecnología utilizada para el reconocimiento de partituras musicales a partir de imágenes para posteriormente procesarlas y crear un archivo de salida en formato de texto. Mi objetivo es utilizar un modelo ya utilizado en otros campos y adaptarlo para que la salida final sea un archivo de sonido reproducible sin pasos intermedios. Para ello, en este proyecto se utiliza un modelo Sequence to Sequence para generar a partir de una imagen de una partitura su correspondiente fichero de audio que posteriormente podrá ser tratado o editado. Los modelos Sequence to Sequence son un tipo de arquitectura de deep learning que han resultado dar muy buenos resultados en aplicaciones con reconocimiento de voz, traducción automática o descripción de videos entre muchos otros.
Abstract: The OMR or Optical Music Recognition is a technology used for the recognition of musical sheets from images to later process them and create an output file in text format. My objective is to use a model that has been already used in other fields and adapt it to make the output file into a reproducible sound archive with no intermediate steps. To achieve this, in this project it has been used a Sequence to Sequence model to generate, from a musical sheet image, a musical sheet audiofile which can be edited later. The Sequence to Sequence models are a type of deep learning architecture that give great results in applications such as voice recognition, automatic translation, or video description among others.
Abstract: El OMR o Reconeixement Òptic de Música és una tecnologia utilitzada per al reconeixement de partitures musicals a partir d'imatges per posteriorment processar-les i crear un arxiu de sortida en format de text. El meu objectiu és utilitzar un model ja utilitzat en altres camps i adaptar-lo perquè la sortida final sigui un arxiu de so reproduïble sense passos intermedis. Per a això, en aquest projecte s'utilitza un model Sequence to Sequence per generar a partir d'una imatge d'una partitura seva corresponent fitxer d'àudio que posteriorment podrà ser tractat o editat. Els models Sequence to Sequence són un tipus d'arquitectura de deep learning que han resultat donar molt bons resultats en aplicacions amb reconeixement de veu, traducció automàtica o descripció de vídeos entre molts altres.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Castellà
Studies: Grau en Enginyeria Informàtica [2502441]
Study plan: Grau en Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Subject area: Menció Computació
Subject: Seq2seq ; Deep learning ; Partitura musical ; Music script



8 p, 700.1 KB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

 Record created 2021-04-09, last modified 2024-06-15



   Favorit i Compartir