Análisis funcional y de rendimiento de tensor cores
Melero Sánchez, Xavier
Sikora, Anna, 
tut. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
Universitat Autònoma de Barcelona.
Escola d'Enginyeria
| Additional title: |
Functional and performance analysis of tensor cores |
| Date: |
2025 |
| Abstract: |
En este trabajo se investiga el funcionamiento de los Tensor Cores y se realizan pruebas para comparar su rendimiento con el de los CUDA Cores. Para cumplir el primer objetivo, se llevó a cabo una revisión de la literatura y la documentación relacionada con la tecnología en estudio. En cuanto al segundo objetivo, se desarrollaron kernels para realizar operaciones matriciales en el entorno de CUDA, y se compararon sus tiempos de ejecución en varios casos utilizando ambas tecnologías por separado. Los resultados mostraron un rendimiento superior de los CUDA Cores de hasta x3. 8 en las sumas de matrices. Por otro lado, el uso de Tensor Cores permitió obtener un speedup de entre x4. 55 y x19. 85 en los productos de matrices. Se recomienda realizar más pruebas, ya sea con otras implementaciones de kernels, o incluyendo el uso de PTX Code para tratar de maximizar el rendimiento. |
| Abstract: |
In this work, the functioning of Tensor Cores is investigated and tests are conducted to compare their performance with that of CUDA Cores. To achieve the first objective, a review of the literature and documentation related to the technology under study was carried out. In terms of the second objective, kernels were developed to perform matrix operations in the CUDA environment, and their execution times were compared in several cases using both technologies separately. The results showed a superior performance of the CUDA Cores of up to x3. 8 in matrix addition. On the other hand, the use of Tensor Cores allowed for a speedup of between x4. 55 and x19. 85 in matrix multiplication, depending on the case executed. It is recommended to conduct further tests, either with other implementations of kernels or by including the use of PTX Code to try to maximize performance. |
| Rights: |
Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original.  |
| Language: |
Castellà |
| Studies: |
Enginyeria Informàtica [2502441] |
| Study plan: |
Enginyeria Informàtica [958] |
| Document: |
Treball final de grau ; Text |
| Subject area: |
Menció Enginyeria de Computadors |
| Subject: |
Tensor Cores ;
CUDA Cores ;
Rendimiento ;
NVIDIA ;
Operaciones matriciales ;
Performance ;
Matrix operations ;
GPU |
The record appears in these collections:
Research literature >
Bachelor's degree final project >
School of Engineering. TFG
Record created 2025-03-03, last modified 2025-07-20