Adaptación de un framework de IA en procesadores vectoriales para el espacio
Valdivieso González, Aleix
Montón Macian, Màrius, dir. (Universitat Autònoma de Barcelona. Departament de Microelectrònica i Sistemes Electrònics)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Adaptació d'un framework d'IA per processadors vectorials per l'espai
Títol variant: Adapting an AI framework on vector processors for space
Data: 2024
Resum: En aquest treball s'ha avaluat l'ús d'instruccions vectorials amb intrínsecs i auto-vectorització en compressors V2F i JPEG-Turbo. L'avaluació s'ha realitzat sobre el hardware Kendryte MV-K230 amb RVV 1. 0. A més, s'ha analitzat l'eficàcia de l'extensió vectorial (RVV) dins un entorn més controlat, implementant les funcions REDUCE, SAXPY, VVADD, MATMUL i CONVOLUCIÓ2D. Per aquestes funcions, s'ha trobat el LMUL òptim i s'ha determinat la millor implementació de VL per mides d'array no múltiples del registre vectorial. Tot això, amb l'objectiu final de comparar-ho amb l'execució escalar per CHAR, INT, FLOAT i DOUBLE.
Resum: En este trabajo se ha evaluado el uso de instrucciones vectoriales con intrínsecos y auto-vectorización en los compresores V2F y JPEG-TURBO. La evaluación se ha realizado en el hardware Kendryte MV-K230 con RVV 1. 0. Además, se ha analizado la eficacia de la extensión vectorial (RVV) en un entorno más controlado, implementando las funciones REDUCE, SAXPY, VVADD, MATMUL y la CONVOLUCIÓN2D. Para estas funciones, se ha encontrado el LMUL óptimo y se ha determinado la mejor implementación de VL para tamaños de array no múltiplos del registro vectorial. Todo esto, con el objetivo final de compararlo con la ejecución escalar para CHAR, INT, FLOAT y DOUBLE.
Resum: This paper evaluates the use of vector instructions through intrinsics and auto-vectorization in the V2F and JPEG-TURBO. The evaluation was performed by the Kendryte MV-K230 hardware with RVV 1. 0. Additionally, the efficiency of the vector extension (RVV) was analyzed in a more controlled environment by implementing the REDUCE, SAXPY, VVADD, MATMUL and CONVOLUCIÓN2D. For these functions, the optimal LMUL was determined, and the best implementation of VL for array sizes that are not multiples of the vector register was identified. All of this was conducted with the goal of comparing it to scalar execution for CHAR, INT, FLOAT, and DOUBLE.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Castellà
Titulació: Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Àrea temàtica: Menció Tecnologies de la Informació
Matèria: RISC-V ; RVV ; V2F ; Compressor ; JPEG-Turbo ; Auto-vectorització ; GCC-14 ; Clang-17 ; Xuantie-C908 ; Compresor ; Auto-vectorización ; Auto-vectorization



13 p, 1.2 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2024-07-17, darrera modificació el 2025-07-20



   Favorit i Compartir