Characterizing CPU-GPU collaboration in Modern Heterogeneous Systems
Llorà Nieto, Ferran
Moure, Juan C. tut.
Soria, Victor tut.
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title: Caracterització de la col·laboració CPU-GPU en sistemes heterogenis moderns
Additional title: Caracterización de la colaboración CPU-GPU en sistemas heterogéneos modernos
Date: 2026
Abstract: Els sistemes heterogenis són omnipresents i es troben en plataformes tan diverses com telèfons mòbils, ordinadors portàtils i supercomputadors d'altes prestacions. Tot i que les CPU tradicionals no poden oferir prou rendiment per a càrregues de treball intensives en còmput, les GPU per si soles tampoc són adequades per a tot tipus de tasques. Per aquest motiu, les aplicacions més exigents requereixen la integració d'ambdós tipus de dispositius en un únic sistema heterogeni. En aquest context, l'eficiència de la comunicació i el grau de col·laboració entre aquests dispositius han adquirit una importància creixent en els darrers anys. Els arquitectes de computadors necessiten mecanismes i metodologies que permetin avaluar amb precisió la integració de sistemes heterogenis. Aquest nivell d'integració es pot mesurar mitjançant l'estudi acurat del comportament del sistema sota diferents patrons de col·laboració. Tanmateix, aquests patrons són difícils d'analitzar, ja que depenen d'un gran nombre de variables. La suite d'aplicacions CHAI és un conjunt de nuclis de programa dissenyats per mesurar el grau d'integració entre CPU i GPU mitjançant càrregues de treball col·laboratives que posen a prova aquests patrons de col·laboració. No obstant això, CHAI va ser introduïda l'any 2015, amb l'objectiu de donar suport a arquitectures modestes de telèfons mòbils, amb poques CPU i una GPU petita. Avui dia, fins i tot els supercomputadors són heterogenis, integrant desenes de CPU i GPU de gran capacitat. Aquest TFG té com a objectiu refactoritzar les aplicacions originals per aprofitar les funcionalitats de versions més recents de CUDA, així com reescriure-les utilitzant les extensions de programació HIP d'AMD. A més, es pretén obtenir mesures de rendiment en maquinari modern, abastant des de sistemes de consum fins a grans plataformes HPC. Atès que aquestes aplicacions van ser dissenyades per a maquinari molt menys potent, s'escala la mida dels problemes originals per tal d'obtenir resultats significatius en els sistemes actuals.
Abstract: Heterogeneous systems are ubiquitous, present in systems as diverse as mobile phones, laptops, and high-end supercomputers. While traditional CPUs cannot provide sufficient throughput for compute-intensive workloads, GPUs alone are not suitable for all tasks. Thus, demanding applications require integrating both types of devices into a single heterogeneous system. As such, the efficiency of communication and the level of collaboration between these devices have become increasingly important in recent years. Computer architects need mechanisms and methodologies that accurately assess the integration of heterogeneous systems. This level of integration can be measured by carefully studying a system's behaviour under different collaboration patterns. However, these collaboration patterns are challenging to study because they depend on many variables. The CHAI application suite is a set of program kernels designed to measure the degree of integration between CPU and GPU through collaborative workloads that test these collaboration patterns. However, CHAI was introduced in 2015 to target modest mobile phone architectures with few CPUs and a small GPU. Nowadays, even supercomputers are heterogeneous, integrating tens of CPUs and large GPUs. This TFG aims to refactor the original applications to leverage features of more recent CUDA versions and to rewrite them for AMD's HIP programming extensions. We also want to gather performance measurements on modern hardware, ranging from consumer to large HPC systems. Since these applications were designed for much less capable hardware, this work presents a scaling with the problem sizes used by the original applications to ones that yield meaningful results on modern CPU-GPU systems.
Abstract: Los sistemas heterogéneos son omnipresentes y están presentes en plataformas tan diversas como teléfonos móviles, ordenadores portátiles y supercomputadores de altas prestaciones. Aunque las CPU tradicionales no pueden proporcionar un rendimiento suficiente para cargas de trabajo intensivas en cómputo, las GPU por sí solas tampoco resultan adecuadas para todo tipo de tareas. Por este motivo, las aplicaciones más exigentes requieren la integración de ambos tipos de dispositivos en un único sistema heterogéneo. En este contexto, la eficiencia de la comunicación y el grado de colaboración entre estos dispositivos han cobrado una importancia creciente en los últimos años. Los arquitectos de computadores necesitan mecanismos y metodologías que permitan evaluar con precisión la integración de sistemas heterogéneos. Este nivel de integración puede medirse mediante el estudio cuidadoso del comportamiento del sistema bajo distintos patrones de colaboración. Sin embargo, dichos patrones son difíciles de analizar, ya que dependen de un gran número de variables. La suite de aplicaciones CHAI es un conjunto de núcleos de programa diseñados para medir el grado de integración entre CPU y GPU mediante cargas de trabajo colaborativas que ponen a prueba estos patrones de colaboración. No obstante, CHAI fue introducida en 2015 con el objetivo de dar soporte a arquitecturas modestas de teléfonos móviles, con pocas CPU y una GPU de pequeño tamaño. En la actualidad, incluso los supercomputadores son heterogéneos, integrando decenas de CPU y GPU de gran capacidad. Este TFG tiene como objetivo refactorizar las aplicaciones originales para aprovechar las funcionalidades de versiones más recientes de CUDA, así como reescribirlas utilizando las extensiones de programación HIP de AMD. Asimismo, se pretende obtener medidas de rendimiento en hardware moderno, abarcando desde sistemas de consumo hasta grandes plataformas HPC. Dado que estas aplicaciones fueron diseñadas para hardware mucho menos potente, se escalan los tamaños de los problemas originales con el fin de obtener resultados significativos en los sistemas actuales.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. Creative Commons
Language: Anglès
Studies: Enginyeria Informàtica [2502441]
Study plan: Enginyeria Informàtica [958]
Document: Treball final de grau
Subject area: Menció Enginyeria de Computadors
Subject: Enginyeria del rendiment ; GPU ; Sistemes heterogenis ; Performance engineering ; Heterogeneous systems ; Ingeniería del rendimiento ; Sistemas heterogéneos



10 p, 1.4 MB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

 Record created 2026-03-06, last modified 2026-03-09



   Favorit i Compartir