Sistema de reconocimiento de partituras musicales y generación de archivos sonoros

Echevarría Naharro, Daniel

Cita bibliográfica -- Enlace permanente: https://ddd.uab.cat/record/238421

Sistema de reconocimiento de partituras musicales y generación de archivos sonoros
Echevarría Naharro, Daniel
Fornés Bisquerra, Alicia dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Título variante:	System for the recognition of musical scores and generation of sound files
Título variante:	Sistema de reconeixement de partitures musicals i generació d'arxius sonors
Fecha:	2021
Resumen:	El OMR o Reconocimiento Óptico de Música es una tecnología utilizada para el reconocimiento de partituras musicales a partir de imágenes para posteriormente procesarlas y crear un archivo de salida en formato de texto. Mi objetivo es utilizar un modelo ya utilizado en otros campos y adaptarlo para que la salida final sea un archivo de sonido reproducible sin pasos intermedios. Para ello, en este proyecto se utiliza un modelo Sequence to Sequence para generar a partir de una imagen de una partitura su correspondiente fichero de audio que posteriormente podrá ser tratado o editado. Los modelos Sequence to Sequence son un tipo de arquitectura de deep learning que han resultado dar muy buenos resultados en aplicaciones con reconocimiento de voz, traducción automática o descripción de videos entre muchos otros.
Resumen:	The OMR or Optical Music Recognition is a technology used for the recognition of musical sheets from images to later process them and create an output file in text format. My objective is to use a model that has been already used in other fields and adapt it to make the output file into a reproducible sound archive with no intermediate steps. To achieve this, in this project it has been used a Sequence to Sequence model to generate, from a musical sheet image, a musical sheet audiofile which can be edited later. The Sequence to Sequence models are a type of deep learning architecture that give great results in applications such as voice recognition, automatic translation, or video description among others.
Resumen:	El OMR o Reconeixement Òptic de Música és una tecnologia utilitzada per al reconeixement de partitures musicals a partir d'imatges per posteriorment processar-les i crear un arxiu de sortida en format de text. El meu objectiu és utilitzar un model ja utilitzat en altres camps i adaptar-lo perquè la sortida final sigui un arxiu de so reproduïble sense passos intermedis. Per a això, en aquest projecte s'utilitza un model Sequence to Sequence per generar a partir d'una imatge d'una partitura seva corresponent fitxer d'àudio que posteriorment podrà ser tractat o editat. Els models Sequence to Sequence són un tipus d'arquitectura de deep learning que han resultat donar molt bons resultats en aplicacions amb reconeixement de veu, traducció automàtica o descripció de vídeos entre molts altres.
Derechos:	Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.
Lengua:	Castellà
Titulación:	Enginyeria Informàtica [2502441]
Plan de estudios:	Enginyeria Informàtica [958]
Documento:	Treball final de grau ; Text
Área temática:	Menció Computació
Materia:	Seq2seq ; Deep learning ; Partitura musical ; Music script

8 p, 700.1 KB

El registro aparece en las colecciones:
Documentos de investigación > Trabajos de Fin de Grado > Escuela de Ingeniería. TFG

Registro creado el 2021-04-09, última modificación el 2026-01-29

Registros similares

Añadir a la cesta personal
Exportar como Citation, BibTeX, MARC, MARCXML, DC, EDM OpenAire4