tut. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
| Título variante: |
Compression of omic and genomic data |
| Título variante: |
Compresión de datos ómicos y genómicos |
| Fecha: |
2026 |
| Resumen: |
En el camp de la bioinformàtica, el volum de dades genòmiques ha experimentat un creixement exponencial durant els darrers anys. Aquest increment massiu ha generat nombroses difi cultats i ha plantejat nous reptes relacionats amb l'emmagatzemament i processament d'aquestes quantitats d'informació. En resposta a aquesta problemàtica, els acadèmics i la comunitat científi ca han impulsat el desenvolupament d'algorismes i tècniques centrades en la compressió de dades genòmiques. Primerament, es presenta una taxonomia dels algorismes de compressió, descrivint els principals compressors i exposant les idees algorísmiques que les sustenten. Posteriorment, es duu a terme una anàlisi quantitativa del seu rendiment, tenint en compte les mètriques més rellevants. Aquest treball té com a objectiu revisar i analitzar l'estat de l'art dels algorismes de codi lliure més utilitzats per detectar les limitacions actuals i es presenten possibles línies de recerca futura, com poden ser algorismes de compressió basats en machine-learning o que facin servir xarxes neuronals. |
| Resumen: |
In the field of bioinformàtics, the volume of genomic data has experienced exponential growth in recent years. This massive increase has generated numerous difficulties and posed new challenges related to the storage and processing of such quantities of information. In response to this problem, academics and the scientific community have driven the development of algorithms and techniques focused on the compression of genomic data. Firstly, a taxonomy of compression algorithms is presented, describing the main compressors and outlining the algorithmic ideas that underpin them. Subsequently, a quantitative analysis of their performance is carried out, taking into account the most relevant metrics. This project aims to review and analyse the state of the art of the most widely used open-source algorithms to identify their current limitations, and present future lines of research, such as compression algorithms based on machine learning or using neural networks. |
| Resumen: |
En el campo de la bioinformática, el volumen de datos genómicos ha experimentado un crecimiento exponencial durante los últimos años. Este incremento masivo ha generado numerosas dificultades y ha planteado nuevos retos relacionados con el almacenamiento y procesamiento de estas cantidades de información. En respuesta a esta problemática, los académicos y la comunidad científica han impulsado el desarrollo de algoritmos y técnicas centradas en la compresión de datos genómicos. Primeramente, se presenta una taxonomía de los algoritmos de compresión, describiendo los principales compresores y exponiendo las ideas algorítmicas que las sustentan. Posteriormente, se lleva a cabo un análisis cuantitativo de su rendimiento, teniendo en cuenta las métricas más relevantes. Este trabajo tiene como objetivo revisar y analizar el estado del arte de los algoritmos de código libre más utilizados para detectar las limitaciones actuales y se presentan posibles líneas de investigación futura, como pueden ser algoritmos de compresión basados en machine-learning o que usen redes neuronales. |
| Derechos: |
Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.  |
| Lengua: |
Català |
| Titulación: |
Enginyeria Informàtica [2502441] |
| Plan de estudios: |
Enginyeria Informàtica [958] |
| Documento: |
Treball final de grau |
| Área temática: |
Menció Tecnologies de la Informació |
| Materia: |
Dades Genòmiques ;
Compressió de dades ;
GeCo3 ;
Gzip ;
DNACompress ;
Creixement Exponencial ;
ADN ;
ARN ;
Sense Pèrdua ;
Taxa de compressió ;
Pèrdua de dades ;
Reducció d'emmagatzematge ;
Generalització i Especialització ;
Genomic data ;
Data compression ;
Exponential growth ;
DNA ;
RNA ;
Lossless ;
Compression ratio ;
Data loss ;
Storage reduction ;
Generalisation and specialisation ;
Datos genómicos ;
Compresión de datos ;
Crecimiento exponencial ;
Sin perdida ;
Tasa de compresión ;
Perdida de datos ;
Reducción del almacenamiento ;
Generalización y Especialización |