Análisis funcional y de rendimiento de tensor cores
Melero Sánchez, Xavier
Sikora, Anna, tut. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Título variante: Functional and performance analysis of tensor cores
Fecha: 2025
Resumen: En este trabajo se investiga el funcionamiento de los Tensor Cores y se realizan pruebas para comparar su rendimiento con el de los CUDA Cores. Para cumplir el primer objetivo, se llevó a cabo una revisión de la literatura y la documentación relacionada con la tecnología en estudio. En cuanto al segundo objetivo, se desarrollaron kernels para realizar operaciones matriciales en el entorno de CUDA, y se compararon sus tiempos de ejecución en varios casos utilizando ambas tecnologías por separado. Los resultados mostraron un rendimiento superior de los CUDA Cores de hasta x3. 8 en las sumas de matrices. Por otro lado, el uso de Tensor Cores permitió obtener un speedup de entre x4. 55 y x19. 85 en los productos de matrices. Se recomienda realizar más pruebas, ya sea con otras implementaciones de kernels, o incluyendo el uso de PTX Code para tratar de maximizar el rendimiento.
Resumen: In this work, the functioning of Tensor Cores is investigated and tests are conducted to compare their performance with that of CUDA Cores. To achieve the first objective, a review of the literature and documentation related to the technology under study was carried out. In terms of the second objective, kernels were developed to perform matrix operations in the CUDA environment, and their execution times were compared in several cases using both technologies separately. The results showed a superior performance of the CUDA Cores of up to x3. 8 in matrix addition. On the other hand, the use of Tensor Cores allowed for a speedup of between x4. 55 and x19. 85 in matrix multiplication, depending on the case executed. It is recommended to conduct further tests, either with other implementations of kernels or by including the use of PTX Code to try to maximize performance.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. Creative Commons
Lengua: Castellà
Titulación: Enginyeria Informàtica [2502441]
Plan de estudios: Enginyeria Informàtica [958]
Documento: Treball final de grau ; Text
Área temática: Menció Enginyeria de Computadors
Materia: Tensor Cores ; CUDA Cores ; Rendimiento ; NVIDIA ; Operaciones matriciales ; Performance ; Matrix operations ; GPU



15 p, 8.9 MB

El registro aparece en las colecciones:
Documentos de investigación > Trabajos de Fin de Grado > Escuela de Ingeniería. TFG

 Registro creado el 2025-03-03, última modificación el 2025-07-20



   Favorit i Compartir