From image to MIDI: Implementing a complete OMR system for sheet music
Alcon Acedo, Arnau Josep
Fornes Bisquerra, Alicia, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: D'imatge a MIDI : Implementació d'un sistema OMR complert per llegir partitures
Títol variant: De imagen a MIDI : Implementación de un sistema OMR completo para leer partituras
Data: 2023
Resum: Computationally reading the information contained in music scores presents many challenges. One of those challenges is having to coordinate several separate processes. Deep learning allows to consolidate a few of these processes into a single step. This project proposes a complete sheet detection system with a seq2seq solution as its base that takes small, bar-sized sheet music chunks in PNG format at the input and creates a prediction MIDI file at the output. It implements the required functionalities to have the entire pipeline. These functionalities include segmenting a score into its bars, doing predictions on these segments and combining all the MIDI outputs into a single MIDI file.
Resum: Llegir de manera computacional la informació que conté una partitura presenta molts reptes. Un d'aquests reptes és la necessitat de coordinar diversos processos diferents. Aplicar deep learning permet consolidar alguns d'aquests processos en un sol pas. Aquest projecte proposa un sistema complert de predicció de partitures partint d'un model seq2seq que pren petits troçets de partitura, de la mida d'un compàs, en format PNG a l'entrada, i crea un arxiu MIDI amb la predicció a la sortida. S'implementen les funcionalitats necessàries per tenir el pipeline sencer. Aquestes funcionalitats inclouen segmentar la partitura en compassos, realitzar prediccions sobre aquests, i agrupar tots els MIDIs resultants en un de sol.
Resum: Leer de forma computacional la información que contiene una partitura presenta muchos retos. Uno de estos retos es la necesidad de coordinar varios procesos distintos. Las técnicas de deep learning permiten fusionar algunos de estos procesos en uno solo. Este proyecto propone un sistema completo de lectura de partituras musicales basado en un modelo seq2seq que toma pequeños segmentos de partitura, del tamaño de un compás, en formato PNG como entrada y crea un archivo MIDI con la predicción a la salida. Se implementan las funcionalidades necesarias para tener un pipeline entero. Estas funcionalidades incluyen segmentar partituras en compases, ejecutar predicciones sobre estos, y combinar todas las salidas MIDIs en un solo archivo.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Anglès
Titulació: Grau en Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Àrea temàtica: Menció Computació
Matèria: OMR ; Segmentació de partitures ; MIDI (Musical Instrument Digital Interface) ; Pentagrames ; Compassos ; Deep learning ; Seq2seq ; Segmentación de partituras ; Pentagramas ; Compases ; Score segmentation ; Staves ; Bars



10 p, 924.2 KB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2023-03-07, darrera modificació el 2023-07-22



   Favorit i Compartir