Paral·lelització de xarxes neuronals
Llauradó Crespo, Blanca Mercedes
Sikora, Anna, dir. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Neural Network Parallelization
Títol variant: Paralelización de redes neuronales
Data: 2021
Resum: Aquest treball té per objectiu la modificació i l'optimització d'una xarxa neuronal, escrita en C, de manera que, a partir de tres aproximacions d'HPC (High Performance Computing), concretament OpenMP, MPI i CUDA, s'incrementi el seu rendiment pel que fa al temps d'execució. En aquest article es fa un estudi de la paral·lelització de la xarxa utilitzant les tres aproximacions esmentades anteriorment, modificant les estructures d'emmagatzematge de dades i l'obtenció dels patrons d'entrenament. D'aquesta manera, per una banda, es decrementa el temps destinat a l'entrenament de la xarxa. Per l'altra, s'incrementa la fiabilitat dels resultats, ja que s'utilitzarà un entrenament de patrons aleatori.
Resum: This paper aims to modify and optimize a neural network, written in C, so that, from three HPC (High Performance Computing) approaches -specifically OpenMP, MPI and CUDA- increase its performance in terms of runtime. This article examines network parallelization using the three approaches mentioned above, modifying data storage structures and how training patterns are obtained. On the one hand, the time spent on network training is reduced. On the other hand, the reliability of the results increases, as random pattern training will be used.
Resum: Este trabajo tiene por objetivo la modificación y optimización de una red neuronal, escrita en C, de forma que, a partir de tres aproximaciones de HPC (High Performance Computing), concretamente OpenMP, MPI y CUDA, se incremente su rendimiento en cuanto al tiempo de ejecución. En este artículo se hace un estudio de la paralelización de la red utilizando las tres aproximaciones mencionadas anteriormente, modificando las estructuras de almacenamiento de datos y la obtención de los patrones de entrenamiento. De esta forma, por un lado, se decrementa el tiempo destinado al entrenamiento de la red. Por otro, se incrementa la fiabilidad de los resultados, ya que se utilizará un entrenamiento de patrones aleatorio.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Català
Titulació: Grau en Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Àrea temàtica: Menció Enginyeria de Computadors
Matèria: Xarxes neuronals ; Neural Networks ; Redes neuronales ; Feedforward ; Backpropagation ; HPC ; OpenMP ; MPI ; CUDA ; Aplicacions paral·leles ; Parallel applications ; Aplicaciones paralelas ; Optimitzacions ; Optimizations ; Optimizaciones



15 p, 1.3 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2022-04-06, darrera modificació el 2023-07-22



   Favorit i Compartir