Sistema de reconocimiento de partituras musicales y generación de archivos sonoros

Echevarría Naharro, Daniel

Bibliographic citation -- Permanent link: https://ddd.uab.cat/record/238421

Sistema de reconocimiento de partituras musicales y generación de archivos sonoros
Echevarría Naharro, Daniel
Fornes Bisquerra, Alicia,

dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title:	System for the recognition of musical scores and generation of sound files
Additional title:	Sistema de reconeixement de partitures musicals i generació d'arxius sonors
Date:	2021
Abstract:	El OMR o Reconocimiento Óptico de Música es una tecnología utilizada para el reconocimiento de partituras musicales a partir de imágenes para posteriormente procesarlas y crear un archivo de salida en formato de texto. Mi objetivo es utilizar un modelo ya utilizado en otros campos y adaptarlo para que la salida final sea un archivo de sonido reproducible sin pasos intermedios. Para ello, en este proyecto se utiliza un modelo Sequence to Sequence para generar a partir de una imagen de una partitura su correspondiente fichero de audio que posteriormente podrá ser tratado o editado. Los modelos Sequence to Sequence son un tipo de arquitectura de deep learning que han resultado dar muy buenos resultados en aplicaciones con reconocimiento de voz, traducción automática o descripción de videos entre muchos otros.
Abstract:	The OMR or Optical Music Recognition is a technology used for the recognition of musical sheets from images to later process them and create an output file in text format. My objective is to use a model that has been already used in other fields and adapt it to make the output file into a reproducible sound archive with no intermediate steps. To achieve this, in this project it has been used a Sequence to Sequence model to generate, from a musical sheet image, a musical sheet audiofile which can be edited later. The Sequence to Sequence models are a type of deep learning architecture that give great results in applications such as voice recognition, automatic translation, or video description among others.
Abstract:	El OMR o Reconeixement Òptic de Música és una tecnologia utilitzada per al reconeixement de partitures musicals a partir d'imatges per posteriorment processar-les i crear un arxiu de sortida en format de text. El meu objectiu és utilitzar un model ja utilitzat en altres camps i adaptar-lo perquè la sortida final sigui un arxiu de so reproduïble sense passos intermedis. Per a això, en aquest projecte s'utilitza un model Sequence to Sequence per generar a partir d'una imatge d'una partitura seva corresponent fitxer d'àudio que posteriorment podrà ser tractat o editat. Els models Sequence to Sequence són un tipus d'arquitectura de deep learning que han resultat donar molt bons resultats en aplicacions amb reconeixement de veu, traducció automàtica o descripció de vídeos entre molts altres.
Rights:	Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.
Language:	Castellà
Studies:	Grau en Enginyeria Informàtica [2502441]
Study plan:	Grau en Enginyeria Informàtica [958]
Document:	Treball final de grau ; Text
Subject area:	Menció Computació
Subject:	Seq2seq ; Deep learning ; Partitura musical ; Music script

8 p, 700.1 KB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

Record created 2021-04-09, last modified 2024-06-15

Similar records

Add to personal basket
Export as Citation, BibTeX, MARC, MARCXML, DC, EDM OpenAire4