Compressió de punts de control d'entrenament d'IA
Estapé Ayén, Marc
Bartrina Rapesta, Joan, tut. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title: Compresión de puntos de control d'entrenamiento de IA
Additional title: AI training checkpoint compression
Date: 2025
Abstract: Aquest projecte presenta el disseny i la implementació d'un compressor adaptatiu sense pèrdua, orientat a la compressió eficient de fitxers de punts de control generats durant el procés d'entrenament de models d'intel·ligència artificial. Aquests fitxers binaris estan formats principalment per tensors numèrics de diferents tipus com poden ser float32 o int64 i poden assolir una mida de diversos gigabytes, fet que representa una limitació tant per a l'emmagatzematge com la distribució. El sistema proposat analitza el contingut intern de cada fitxer i selecciona dinàmicament el compressor òptim per a cada tipus de dada. A més, s'han aplicat millores a l'estructura dels headers per reduir la seva sobrecàrrega i millorar l'adaptabilitat amb el sistema. Els resultats obtinguts mitjançant un banc de proves mostren una taxa mitjana de compressió de 1. 0961, superior a la dels mètodes actuals com 7-Zip.
Abstract: Este proyecto presenta el diseño y la implementación de un compresor adaptativo sin pérdida, orientado a la compresión eficiente de archivos de puntos de control generados durante el proceso de entrenamiento de modelos de inteligencia artificial. Estos archivos binarios estan formados principalmente por tensores numéricos de diferentes tipos como pueden ser float32 o int64 y pueden alcanzar un tamaño de varios gigabytes, lo que representa una limitación tanto para el almacenamiento como para la distribución. El sistema propuesto analiza el contenido interno de cada archivo y selecciona dinámicamente el compresor óptimo para cada tipo de dato. Además, se han aplicado mejoras en la estrucutra de los headers para reducir su sobrecarga i mejorar la adaptabilidad con el sistema. Los resultados obtenidos mediante un banco de pruebas muestran una tasa media de compresión de 1. 0961, superior a la de los métodos actuales como 7-Zip.
Abstract: This project presents the design and implementation of a lossless adaptive compressor aimed at the efficient compression of checkpoint files generated during the training process of artificial intelligence models. These binary files are primarily composed of numerical tensors of various types, such as float32 or int64, and can reach sizes of several gigabytes, representing a clear limitation for both storage and distribution. The proposed system analyzes the internal content of each file and dynamically selects the most suitable compressor for each data type. In addition, structural optimizations have been applied to the headers to reduce their overhead and improve the system's modularity and adaptability. The results obtained from a benchmark evaluation show an average compression ratio of 1. 0961, which outperform existing general-purpose methods such as 7-Zip.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. Creative Commons
Language: Català
Studies: Enginyeria Informàtica [2502441]
Study plan: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Subject area: Menció Tecnologies de la Informació
Subject: Compressió sense pèrdua ; Punts de control ; Intel·ligència artificial ; Tensors numèrics ; Optimització de fitxers ; Compressió adaptativa ; Compresión sin pérdida ; Puntos de control ; Inteligencia artificial ; Tensores numéricos ; Optimización de archivos ; Compresión adaptativa ; Loseless compresssion ; Checkpoints ; Artificial intelligence ; Numerical tensors ; File optimization ; Adaptative compression



9 p, 450.2 KB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

 Record created 2025-07-17, last modified 2025-07-23



   Favorit i Compartir