Compressió de dades òmiques i genòmiques
Perez Yepes, Oscar
Serra-Sagristà, Joan tut. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title: Compression of omic and genomic data
Additional title: Compresión de datos ómicos y genómicos
Date: 2026
Abstract: En el camp de la bioinformàtica, el volum de dades genòmiques ha experimentat un creixement exponencial durant els darrers anys. Aquest increment massiu ha generat nombroses difi cultats i ha plantejat nous reptes relacionats amb l'emmagatzemament i processament d'aquestes quantitats d'informació. En resposta a aquesta problemàtica, els acadèmics i la comunitat científi ca han impulsat el desenvolupament d'algorismes i tècniques centrades en la compressió de dades genòmiques. Primerament, es presenta una taxonomia dels algorismes de compressió, descrivint els principals compressors i exposant les idees algorísmiques que les sustenten. Posteriorment, es duu a terme una anàlisi quantitativa del seu rendiment, tenint en compte les mètriques més rellevants. Aquest treball té com a objectiu revisar i analitzar l'estat de l'art dels algorismes de codi lliure més utilitzats per detectar les limitacions actuals i es presenten possibles línies de recerca futura, com poden ser algorismes de compressió basats en machine-learning o que facin servir xarxes neuronals.
Abstract: In the field of bioinformàtics, the volume of genomic data has experienced exponential growth in recent years. This massive increase has generated numerous difficulties and posed new challenges related to the storage and processing of such quantities of information. In response to this problem, academics and the scientific community have driven the development of algorithms and techniques focused on the compression of genomic data. Firstly, a taxonomy of compression algorithms is presented, describing the main compressors and outlining the algorithmic ideas that underpin them. Subsequently, a quantitative analysis of their performance is carried out, taking into account the most relevant metrics. This project aims to review and analyse the state of the art of the most widely used open-source algorithms to identify their current limitations, and present future lines of research, such as compression algorithms based on machine learning or using neural networks.
Abstract: En el campo de la bioinformática, el volumen de datos genómicos ha experimentado un crecimiento exponencial durante los últimos años. Este incremento masivo ha generado numerosas dificultades y ha planteado nuevos retos relacionados con el almacenamiento y procesamiento de estas cantidades de información. En respuesta a esta problemática, los académicos y la comunidad científica han impulsado el desarrollo de algoritmos y técnicas centradas en la compresión de datos genómicos. Primeramente, se presenta una taxonomía de los algoritmos de compresión, describiendo los principales compresores y exponiendo las ideas algorítmicas que las sustentan. Posteriormente, se lleva a cabo un análisis cuantitativo de su rendimiento, teniendo en cuenta las métricas más relevantes. Este trabajo tiene como objetivo revisar y analizar el estado del arte de los algoritmos de código libre más utilizados para detectar las limitaciones actuales y se presentan posibles líneas de investigación futura, como pueden ser algoritmos de compresión basados en machine-learning o que usen redes neuronales.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Català
Studies: Enginyeria Informàtica [2502441]
Study plan: Enginyeria Informàtica [958]
Document: Treball final de grau
Subject area: Menció Tecnologies de la Informació
Subject: Dades Genòmiques ; Compressió de dades ; GeCo3 ; Gzip ; DNACompress ; Creixement Exponencial ; ADN ; ARN ; Sense Pèrdua ; Taxa de compressió ; Pèrdua de dades ; Reducció d'emmagatzematge ; Generalització i Especialització ; Genomic data ; Data compression ; Exponential growth ; DNA ; RNA ; Lossless ; Compression ratio ; Data loss ; Storage reduction ; Generalisation and specialisation ; Datos genómicos ; Compresión de datos ; Crecimiento exponencial ; Sin perdida ; Tasa de compresión ; Perdida de datos ; Reducción del almacenamiento ; Generalización y Especialización



10 p, 815.5 KB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

 Record created 2026-03-11, last modified 2026-03-22



   Favorit i Compartir