Análisis funcional y de rendimiento de tensor cores
Melero Sánchez, Xavier
Sikora, Anna, tut. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Functional and performance analysis of tensor cores
Data: 2025
Resum: En este trabajo se investiga el funcionamiento de los Tensor Cores y se realizan pruebas para comparar su rendimiento con el de los CUDA Cores. Para cumplir el primer objetivo, se llevó a cabo una revisión de la literatura y la documentación relacionada con la tecnología en estudio. En cuanto al segundo objetivo, se desarrollaron kernels para realizar operaciones matriciales en el entorno de CUDA, y se compararon sus tiempos de ejecución en varios casos utilizando ambas tecnologías por separado. Los resultados mostraron un rendimiento superior de los CUDA Cores de hasta x3. 8 en las sumas de matrices. Por otro lado, el uso de Tensor Cores permitió obtener un speedup de entre x4. 55 y x19. 85 en los productos de matrices. Se recomienda realizar más pruebas, ya sea con otras implementaciones de kernels, o incluyendo el uso de PTX Code para tratar de maximizar el rendimiento.
Resum: In this work, the functioning of Tensor Cores is investigated and tests are conducted to compare their performance with that of CUDA Cores. To achieve the first objective, a review of the literature and documentation related to the technology under study was carried out. In terms of the second objective, kernels were developed to perform matrix operations in the CUDA environment, and their execution times were compared in several cases using both technologies separately. The results showed a superior performance of the CUDA Cores of up to x3. 8 in matrix addition. On the other hand, the use of Tensor Cores allowed for a speedup of between x4. 55 and x19. 85 in matrix multiplication, depending on the case executed. It is recommended to conduct further tests, either with other implementations of kernels or by including the use of PTX Code to try to maximize performance.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. Creative Commons
Llengua: Castellà
Titulació: Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Àrea temàtica: Menció Enginyeria de Computadors
Matèria: Tensor Cores ; CUDA Cores ; Rendimiento ; NVIDIA ; Operaciones matriciales ; Performance ; Matrix operations ; GPU



15 p, 8.9 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2025-03-03, darrera modificació el 2025-07-20



   Favorit i Compartir