Paral·lelitzacio de xarxes neuronals
Germer Margüenda, Christian
Sikora, Anna, tut. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Parallelization of neural networks
Data: 2025
Resum: En aquest article exposarem el treball realitzat al llarg del desenvolupament del treball de final de grau. L'objectiu d'aquest projecte es tracta d'estudiar i analitzar el codi seqüencial que disposem i aplicar-li les modificacions necessàries per treballar amb una versió fiable, estable i flexible per configurar. A continuació tractarem també de resoldre la qüestió de com paral·lelitzar el codi anterior de xarxes neuronals amb OpenMP i CUDA. Al llarg d'aquest article explicarem les modificacions realitzades al codi inicial seqüencial i el propòsit d'aquestes i a continuació les modificacions i proves de paral·lelitzacio amb OpenMP i CUDA sobre el codi. També exposarem els canvis realitzats sobre el codi i l'estructura de fitxers per poder establir un millor nivell d'organització a més de preparar el codi per el seu futur ús en activitats docents.
Resum: In this article, we will present the work carried out throughout the development of the final degree project. The objective of this project is to study and analyze the sequential code we have and apply the necessary modifications to obtain a reliable, stable, and configurable version. Next, we will also address the question of how to parallelize the previous neural network code using OpenMP and CUDA. Throughout the article, we will explain the modifications made to the initial sequential code and their purpose, followed by the modifications and parallelization tests with OpenMP and CUDA on the code. We will also present the changes made to the code and the file structure to establish a better level of organization, as well as to prepare the code for its future use in teaching activities.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Català
Titulació: Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Àrea temàtica: Menció Enginyeria de Computadors
Matèria: Xarxes neuronals ; Computació d'altes prestacions ; OpenMP ; CUDA ; Optimització ; Paral·lelització ; Redes neuronales ; Computación de altas prestaciones ; Optimización ; Paralelización ; Neural networks ; High performance computing ; Optimization ; Parallelism



14 p, 2.2 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2025-03-03, darrera modificació el 2025-07-20



   Favorit i Compartir