Sequence alignment acceleration using an FPGA MPSoC

Santigosa Lepe, Eric

Bibliographic citation -- Permanent link: https://ddd.uab.cat/record/326532

Sequence alignment acceleration using an FPGA MPSoC
Santigosa Lepe, Eric
Moure, Juan C. tut. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title:	Alineament de seqüències genètiques utilitzant un FPGA MPSoC
Additional title:	Alineamiento de secuencias genéticas usando un FPGA MPSoC
Date:	2026
Abstract:	L'alineament de seqüències és un coll d'ampolla computacional crític en la genòmica moderna, fet que impulsa la necessitat d'acceleració per maquinari especialitzat. Arquitectures com l'SMX demostren un potencial significatiu en simulació, però salvar la distància entre el disseny lògic teòric i el desplegament físic continua sent un repte major. La fabricació d'ASICs és prohibitivament costosa, per la qual cosa les implementacions en silici de dissenys experimentals són una raresa. El prototipatge amb FPGA ofereix una alternativa prometedora, però sovint depèn d'interfícies no coherents i desplegaments bare-metal que oculten les mètriques reals de rendiment a nivell de sistema. En aquest treball, presentem la integració full-stack i l'optimització de l'accelerador d'alineament de seqüències SMX en l'FPGA d'un MPSoC heterogeni. Desenvolupem un pont de memòria RTL personalitzat que adapta la lògica interna de l'accelerador al port coherent de l'últim nivell de memòria cau del processador, permetent així l'intercanvi de dades zero-copy fortament acoblat entre l'FPGA i la CPU hoste. Aquest maquinari està orquestrat per una pila de programari personalitzada construïda sobre el Xilinx Runtime (XRT), exposant l'accelerador a un sistema operatiu Linux estàndard com una funció de llibreria transparent. El nostre sistema SMX integrat aconsegueix una acceleració de fins a 92× respecte al programari optimitzat amb SIMD.
Abstract:	Sequence alignment is a critical computational bottleneck in modern genomics, driving the need for specialized hardware acceleration. Architectures like SMX demonstrate significant potential in simulation, but bridging the gap between theoretical logic design and physical deployment remains a major challenge. ASIC manufacturing is prohibitorily expensive, so silicon implementations of experimental designs are a rare occurrence. FPGA prototyping offers a promising alternative, but it often relies on non-coherent interfaces and bare-metal deployments that obscure true system-level performance metrics. In this work, we present the optimization and full-stack integration of the SMX sequence alignment accelerator into the FPGA of a heterogeneous MPSoC. We develop a custom RTL memory bridge that adapts the accelerator's internal logic to a processor's last-level cache coherent port, enabling tightly coupled, zero-copy data sharing between the FPGA and the host CPU. This hardware is orchestrated by a custom software stack built on the Xilinx Runtime (XRT), exposing the accelerator to a standard Linux OS as a seamless library function. Our integrated SMX system achieves up to 92× speedup over SIMD-optimized software.
Abstract:	El alineamiento de secuencias es un cuello de botella computacional crítico en la genómica moderna, lo que impulsa la necesidad de aceleración por hardware especializado. Arquitecturas como SMX demuestran un potencial significativo en simulación, pero cerrar la brecha entre el diseño lógico teórico y el despliegue físico sigue siendo un desafío mayor. La fabricación de ASICs es prohibitivamente costosa, por lo que las implementaciones en silicio de diseños experimentales son una rareza. El prototipado con FPGA ofrece una alternativa prometedora, pero a menudo depende de interfaces no coherentes y despliegues bare-metal que ocultan las métricas reales de rendimiento a nivel de sistema. En este trabajo, presentamos la integración full-stack y optimización del acelerador de alineamiento de secuencias SMX en la FPGA de un MPSoC heterogéneo. Desarrollamos un puente de memoria RTL personalizado que adapta la lógica interna del acelerador al puerto coherente del último nivel de memoria caché del procesador, permitiendo así el intercambio de datos zero-copy fuertemente acoplado entre la FPGA y la CPU anfitriona. Este hardware está orquestado por una pila de software personalizada construida sobre el Xilinx Runtime (XRT), exponiendo el acelerador a un sistema operativo Linux estándar como una función de librería transparente. Nuestro sistema SMX integrado logra una aceleración de hasta 92× respecto al software optimizado con SIMD.
Rights:	Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.
Language:	Anglès
Studies:	Enginyeria Informàtica [2502441]
Study plan:	Enginyeria Informàtica [958]
Document:	Treball final de grau
Subject area:	Menció Enginyeria de Computadors
Subject:	Enginyeria del rendiment ; Alineament de seqüències ; Acceleració hardware ; Field Programmable Gate Array (FPGA) ; Performance engineering ; Sequence alignment ; Hardware acceleration ; Ingeniería del rendimiento ; Alineamiento de secuencias ; Aceleración hardware

11 p, 827.1 KB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

Record created 2026-03-09, last modified 2026-03-22

Similar records

Add to personal basket
Export as Citation, BibTeX, MARC, MARCXML, DC, EDM OpenAire4