dir. (Universitat Autònoma de Barcelona. Departament de Microelectrònica i Sistemes Electrònics)
| Títol variant: |
Adaptació d'un framework d'IA per processadors vectorials per l'espai |
| Títol variant: |
Adapting an AI framework on vector processors for space |
| Data: |
2024 |
| Resum: |
En aquest treball s'ha avaluat l'ús d'instruccions vectorials amb intrínsecs i auto-vectorització en compressors V2F i JPEG-Turbo. L'avaluació s'ha realitzat sobre el hardware Kendryte MV-K230 amb RVV 1. 0. A més, s'ha analitzat l'eficàcia de l'extensió vectorial (RVV) dins un entorn més controlat, implementant les funcions REDUCE, SAXPY, VVADD, MATMUL i CONVOLUCIÓ2D. Per aquestes funcions, s'ha trobat el LMUL òptim i s'ha determinat la millor implementació de VL per mides d'array no múltiples del registre vectorial. Tot això, amb l'objectiu final de comparar-ho amb l'execució escalar per CHAR, INT, FLOAT i DOUBLE. |
| Resum: |
En este trabajo se ha evaluado el uso de instrucciones vectoriales con intrínsecos y auto-vectorización en los compresores V2F y JPEG-TURBO. La evaluación se ha realizado en el hardware Kendryte MV-K230 con RVV 1. 0. Además, se ha analizado la eficacia de la extensión vectorial (RVV) en un entorno más controlado, implementando las funciones REDUCE, SAXPY, VVADD, MATMUL y la CONVOLUCIÓN2D. Para estas funciones, se ha encontrado el LMUL óptimo y se ha determinado la mejor implementación de VL para tamaños de array no múltiplos del registro vectorial. Todo esto, con el objetivo final de compararlo con la ejecución escalar para CHAR, INT, FLOAT y DOUBLE. |
| Resum: |
This paper evaluates the use of vector instructions through intrinsics and auto-vectorization in the V2F and JPEG-TURBO. The evaluation was performed by the Kendryte MV-K230 hardware with RVV 1. 0. Additionally, the efficiency of the vector extension (RVV) was analyzed in a more controlled environment by implementing the REDUCE, SAXPY, VVADD, MATMUL and CONVOLUCIÓN2D. For these functions, the optimal LMUL was determined, and the best implementation of VL for array sizes that are not multiples of the vector register was identified. All of this was conducted with the goal of comparing it to scalar execution for CHAR, INT, FLOAT, and DOUBLE. |
| Drets: |
Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.  |
| Llengua: |
Castellà |
| Titulació: |
Enginyeria Informàtica [2502441] |
| Pla d'estudis: |
Enginyeria Informàtica [958] |
| Document: |
Treball final de grau ; Text |
| Àrea temàtica: |
Menció Tecnologies de la Informació |
| Matèria: |
RISC-V ;
RVV ;
V2F ;
Compressor ;
JPEG-Turbo ;
Auto-vectorització ;
GCC-14 ;
Clang-17 ;
Xuantie-C908 ;
Compresor ;
Auto-vectorización ;
Auto-vectorization |