Results overview: Found 20 records in 0.02 seconds.
Articles, 8 records found
Contributions to meetings and congresses, 1 records found
Research literature, 11 records found
Articles 8 records found  
1.
11 p, 640.9 KB Embedded real-time stereo estimation via semi-global matching on the GPU / Hernández Juárez, Daniel (Universitat Autònoma de Barcelona) ; Chacón, Alejandro (Universitat Autònoma de Barcelona) ; Espinosa, Antonio (Universitat Autònoma de Barcelona) ; Vázquez, David (Universitat Autònoma de Barcelona) ; Moure, Juan C. (Universitat Autònoma de Barcelona) ; López Peña, Antonio M. (Universitat Autònoma de Barcelona)
Dense, robust and real-time computation of depth information from stereo-camera systems is a computationally demanding requirement for robotics, advanced driver assistance systems (ADAS) and autonomous vehicles. [...]
2016 - 10.1016/j.procs.2016.05.305
Procedia computer science, Vol. 80 (2016) , p. 143-153  
2.
13 p, 792.2 KB Improving the execution performance of FreeSurfer / Delgado, Jordi (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Moure, Juan C. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Vives-Gilabert, Yolanda (Institut de Física d'Altes Energies) ; Delfino, Manuel (Universitat Autònoma de Barcelona. Departament de Física) ; Espinosa, Antonio (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Gómez-Ansón, Beatriz (Hospital de la Santa Creu i Sant Pau (Barcelona, Catalunya)) ; Port d'Informació Científica
A scheme to significantly speed up the processing of MRI with FreeSurfer (FS) is presented. The scheme is aimed at maximizing the productivity (number of subjects processed per unit time) for the use case of research projects with datasets involving many acquisitions. [...]
2014 - 10.1007/s12021-013-9214-1
Neuroinformatics, Vol. 12 (2014) , p. 413-421  
3.
11 p, 1.3 MB GPU acceleration of Levenshtein distance computation between long strings / Castells-Rufas, David (Universitat Autònoma de Barcelona. Departament de Microelectrònica i Sistemes Electrònics)
Computing edit distance for very long strings has been hampered by quadratic time complexity with respect to string length. The WFA algorithm reduces the time complexity to a quadratic factor with respect to the edit distance between the strings. [...]
2023 - 10.1016/j.parco.2023.103019
Parallel Computing, Vol. 116 (July 2023) , art. 103019  
4.
14 p, 1.3 MB 3D Perception With Slanted Stixels on GPU / Hernández Juárez, Daniel (SLAMcore Ltd.) ; Espinosa, Antonio (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Vázquez Bermúdez, David (Element AI) ; López Peña, Antonio M. (Centre de Visió per Computador (Bellaterra, Catalunya)) ; Moure, Juan C. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
This article presents a GPU-accelerated software design of the recently proposed model of Slanted Stixels, which represents the geometric and semantic information of a scene in a compact and accurate way. [...]
2021 - 10.1109/TPDS.2021.3067836
IEEE transactions on parallel and distributed systems, Vol. 30, Issue 10 (October 2021) , p. 2434-2447  
5.
10 p, 1.1 MB Real-time 16K video coding on a GPU with complexity scalable BPC-PaCo / de Cea Dominguez, Carlos (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions) ; Moure, Juan C (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Bartrina Rapesta, Joan (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions) ; Aulí Llinàs, Francesc (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
The advent of new technologies such as high dynamic range or 8K screens has enhanced the quality of digital images but it has also increased the codecs' computational demands to process such data. This paper presents a video codec that, while providing the same coding features and performance as those of JPEG2000, can process 16K video in real time using a consumer-grade GPU. [...]
2021 - 10.1016/j.image.2021.116503
Signal Processing: Image Communication, Vol. 99 (November 2021) , art. 116503  
6.
15 p, 550.1 KB GPU-oriented architecture for an end-to-end image/video codec based on JPEG2000 / de Cea Dominguez, Carlos (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions) ; Moure, Juan C (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Bartrina Rapesta, Joan (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions) ; Aulí Llinàs, Francesc (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
Modern image and video compression standards employ computationally intensive algorithms that provide advanced features to the coding system. Current standards often need to be implemented in hardware or using expensive solutions to meet the real-time requirements of some environments. [...]
2020 - 10.1109/ACCESS.2020.2985859
IEEE Access, Vol. 8 (April 2020) , p. 68474-68487
2 documents
7.
13 p, 1.2 MB GPU implementation of bitplane coding with parallel coefficient processing for high performance image compression / Enfedaque Montes, Pablo (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions) ; Aulí Llinàs, Francesc (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions) ; Moure, Juan C (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
The fast compression of images is a requisite in many applications like TV production, teleconferencing, or digital cinema. Many of the algorithms employed in current image compression standards are inherently sequential. [...]
2017 - 10.1109/TPDS.2017.2657506
IEEE transactions on parallel and distributed systems, Vol. 28, issue 8 (Aug. 2017) , p. 2272-2284  
8.
14 p, 1.5 MB Implementation of the DWT in a GPU through a register-based strategy / Enfedaque Montes, Pablo (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions) ; Aulí Llinàs, Francesc (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions) ; Moure, Juan C (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
The release of the CUDA Kepler architecture in March 2012 has provided Nvidia GPUs with a larger register memory space and instructions for the communication of registers among threads. This facilitates a new programming strategy that utilizes registers for data sharing and reusing in detriment of the shared memory. [...]
2015 - 10.1109/TPDS.2014.2384047
IEEE transactions on parallel and distributed systems, Vol. 26 Issue 12 (December 2015) , p. 3394-3406  

Contributions to meetings and congresses 1 records found  
1.
10 p, 646.3 KB Thread-cooperative, bit-parallel computation of Levenshtein distance on GPU / Chacón, Alejandro (Universitat Autònoma de Barcelona) ; Marco-Sola, Santiago (Centre Nacional d'Anàlisi Genòmica)
Approximate string matching is a very important problem in computational biology; it requires the fast computation of string distance as one of its essential components. Myers' bit-parallel algorithm improves the classical dynamic programming approach to Levenshtein distance computation, and offers competitive performance on CPUs. [...]
2014 - 10.1145/2597652.2597677
ICS : International Conference on Supercomputing. Munic, Alemanya, : 2014  

Research literature 11 records found  1 - 10next  jump to record:
1.
10 p, 13.0 MB Enhancing data center performance with GPU-accelerated dynamic programming algorithms / Roca Serrano, Andreu ; Moure, Juan C, dir. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Universitat Autònoma de Barcelona. Escola d'Enginyeria
Data generation rates for problems involving dynamic programming (DP) algorithms have grown exponentially. The inability of classical CPU architectures to cope with the ever-increasing amount of data has led Data Processing Centers (DPCs) to incorporate accelerators that can perform thousands of operations in parallel. [...]
La quantitat de dades relacionades amb problemes d'algorismes de programació dinàmica (DP) ha crescut de manera exponencial. La incapacitat de les arquitectures clàssiques de CPU per fer front a la quantitat cada cop més gran de dades ha fet que els centres de processament de dades (DPC) incorporin acceleradors que poden realitzar milers d'operacions en paral·lel. [...]
La cantidad de datos relacionados con problemas de algoritmos de programación dinámica (DP) ha crecido de forma exponencial. La incapacidad de las arquitecturas clásicas de CPU para hacer frente a la cantidad cada vez mayor de datos ha hecho que los centros de procesamiento de datos (DPC) incorporen aceleradores que pueden realizar miles de operaciones en paralelo. [...]

2024
Enginyeria Informàtica [958]  
2.
14 p, 807.3 KB Descarga de kernels desde la CPU a la GPU / López Sevilla, Sergio ; Sikora, Anna, dir. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Universitat Autònoma de Barcelona. Escola d'Enginyeria
La computació d'alt rendiment (HPC) és la pràctica en què s'utilitzen clústers de processadors, aquest conjunt treballen en paral·lel per processar dades i fer càlculs complexos a velocitats altes. [...]
La computación de alto rendimiento (HPC) es la práctica en los que se utilizan clústeres de procesadores, este conjunto trabajan en paralelo para procesar datos y realizar cálculos complejos a velocidades altas. [...]
High-Performance Computing (HPC) is the practice in which computer clusters are utilized, and this ensemble operates in parallel to process data and perform complex calculations at high speeds. To harness the resources offered by these clusters, we have programming models such as OpenMP, OpenACC, CUDA, and OpenMP with GPU offloading. [...]

2024
Enginyeria Informàtica [958]  
3.
14 p, 1010.5 KB Desenvolupament de Micro-kernels per l'anàlisi i sintonització de rendiment sobre accel·leradores (GPGPUs) / Navarro Lorente, Laura ; César Galobardes, Eduardo, dir. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Universitat Autònoma de Barcelona. Escola d'Enginyeria
Aquest article presenta l'estudi i paral·lelització en acceleradores GPU de patrons basats en els problemes computacionals més habitualment utilitzats en el marc de la Computació d'Alt Rendiment. [...]
This article presents the study of patterns based on computational problems most commonly used within High Performance Computing and their parallelization in GPU accelerators. Different optimization techniques via OpenACC and CUDA have been used for GPU parallelization, followed by an analysis of the impact these techniques caused on the performance obtained on several problem sizes. [...]
Este artículo presenta el estudio y paralelización en aceleradoras GPU de patrones basados en los problemas computacionales más habitualmente utilizados en el marco de la Computación de Alto Rendimiento. [...]

2021
Enginyeria Informàtica [958]  
4.
9 p, 1.2 MB Anàlisis de paràmetres d'optimització d'aplicacions CUDA / Torras Aguilera, Roger ; Sikora, Anna, dir. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Universitat Autònoma de Barcelona. Escola d'Enginyeria
En els últims anys s'ha anat fent més important l'optimització dels recursos informàtics per aconseguir un millor rendiment. En aquest article estudiarem diferents paràmetres que podran ajudar a millorar les aplicacions CUDA obtenint una millor eficiència dels recursos de la GPU. [...]
In recent years, it has become increasingly important to optimize computer resources in order to achieve better performance. In this paper we study different parameters that can help CUDA applications to obtain a better efficiency of GPU resources. [...]
En los últimos años se ha ido haciendo más importante la optimización de los recursos informáticos para conseguir un mejor rendimiento. En este artículo estudiaremos diferentes parámetros que podrán ayudar a mejorar las aplicaciones CUDA obteniendo una mejor eficiencia de los recursos de la GPU. [...]

2021
Enginyeria Informàtica [958]  
5.
224 p, 8.4 MB Read mapping on heterogeneous systems : scalability strategies for bioinformatic primitives / Chacón, Alejandro ; Moure, Juan C, dir. ; Espinosa, Antonio, dir.
La seqüenciació genòmica és un component clau en nous avenços en medicina, i la seva democratització és un pas important per millorar l'accessibilitat per al pacient. Els beneficis implícits en el descobriment de noves variants genètiques són molt amplis, incloent des de la detecció precoç de càncer com la medicina personalitzada, passant pel disseny de fàrmacs i l'edició genòmica. [...]
La secuenciación genómica es un componente clave en nuevos avances en medicina, y su democratización es un paso importante hacia la accesibilidad para el paciente. Los beneficios implícitos en el descubrimiento de nuevas variantes genéticas son muy amplios, incluyendo desde la detección precoz de cáncer como la medicina personalizada, pasando por el diseño de fármaco y la edición genómica. [...]
Genomic sequencing is the key component of new advances in medicine, and its democratization is an important step in improving accessibility for the patient. The benefits involved in discovering new genomic variations are vast and include everything from early cancer detection to personalized medicine, drug design and genome editing. [...]

2021  
6.
84 p, 49.1 MB Embedded 3D Reconstruction for Autonomous Driving / Hernández Juárez, Daniel ; Moure, Juan C, dir. ; Vázquez Bermúdez, David, dir.
L'objectiu d'aquesta tesi és estudiar algoritmes de reconstrucció 3D adequats per a la conducció autònoma. Per fer-ho, necessitem implementacions i representacions ràpides de l'entorn 3D que tinguin en compte la informació geomètrica i semàntica. [...]
El objetivo de esta tesis es estudiar algoritmos de reconstrucción 3D aptos para la conducción autónoma. Para ello, necesitamos implementaciones y representaciones rápidas del entorno 3D que tengan en cuenta la información geométrica y semántica. [...]
The objective of this thesis is to study 3D reconstruction algorithms suitable for autonomous driving. In order to do so, we need fast implementations and representations of the 3D environment that take into account geometric and semantic information. [...]

2020  
7.
9 p, 405.6 KB Aceleración del algoritmo Wavefront Aligner para emparejamiento de secuencias genéticas / Hernández Chinappi, Ernesto ; Marco-Sola, Santiago, dir. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Moure, Juan C, dir. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Universitat Autònoma de Barcelona. Escola d'Enginyeria
El alineamiento de secuencias se define como la búsqueda de las diferencias que existen entre dos cadenas de caracteres: patrón y texto. Este trabajo utiliza técnicas de Ingeniería de Rendimiento para caracterizar, optimizar y paralelizar el algoritmo Wavefront Aligner de alineamiento de secuencias. [...]
L'alineament de seqüències es defineix com la recerca de les diferències entre dues cadenes de caràcters: patró i text. Aquest treball utilitza tècniques d'Enginyeria de Rendiment per a caracteritzar, optimitzar i paral·lelitzar l'algoritme Wavefront Aligner d'alineament de seqüències. [...]
Sequence alignment consists in searching for differences between two strings: pattern and text. The present work employs Performance Engineering techniques to characterize, optimize, and parallelize the Wavefront Alignment algorithm. [...]

2020
Enginyeria Informàtica [958]  
8.
13 p, 583.2 KB Accelerating Operational Earth System Models using GPUs : portability of NEMO diagnostics to GPU's / Palomas Martinez, Sergi ; Grau Sala, Ramon, dir. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Universitat Autònoma de Barcelona. Escola d'Enginyeria
Earth science models are widely used in meteorological institutions and universities for weather and climate prediction studies. The complexity of the chaotic equations used and the amount of data needed to achieve a good accuracy on the simulation demand a computational power only found in clusters. [...]
Els models de ciències de la terra són àmpliament utilitzats en institucions meteorològiques i universitats per estudis de predicció climàtica. La complexitat de les equacions caòtiques i la quantitat de dades necessària per aconseguir una predicció acurada per les simulacions requereix una potència de càlcul només assolible en clústers com per exemple el Marenostrum 4. [...]
Los modelos de ciencias de la tierra son ampliamente utilizados en instituciones meteorológicas y universidades para estudios de predicción climática. La complejidad de las ecuaciones caóticas y la cantidad de datos necesaria para conseguir una predicción precisa para las simulaciones requiere una potencia de cálculo sólo alcanzable en clústeres como el Marenostrum 4. [...]

2019-07-01
Enginyeria Informàtica [958]  
9.
13 p, 1.2 MB Implementación de redes neuronales y análisis de rendimiento para sistemas empotrados / Esteban Uribe, Sara ; Moure, Juan C, dir. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Universitat Autònoma de Barcelona. Escola d'Enginyeria
Dentro de unos años las carreteras empezarán a tener vehículos sin conductor para trasladar a personas. Este acontecimiento nos lleva a utilizar redes neuronales. En este proyecto se propone realizar la implementación de diferentes redes neuronales convolucionales en un sistema embebido para aplicar en un caso práctico real. [...]
In a few years, roads will begin to have vehicles without drivers to move people. This event leads us to use neural networks. In this project, we propose the implementation of different convolutional neural networks in an embedded system to be applied in a real practical case. [...]
D'aquí a uns anys les carreteres començaran a tenir vehicles sense conductor per traslladar a persones. Aquest esdeveniment ens porta a utilitzar xarxes neuronals. En aquest projecte es proposa realitzar la implementació de diferents xarxes neuronals convolucionals en un sistema encastat per aplicar en un cas pràctic real. [...]

2018-07-02
Enginyeria Informàtica [958]  
10.
5 p, 425.1 KB Reducing runtime of WindNinja's wind fields using accelerators / Tena Medina, Carles ; Cortés Fité, Ana, dir. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius) ; Universitat Autònoma de Barcelona. Escola d'Enginyeria
Forest fire is a natural disaster that every year causes lots of losses. Human beings have always tried to fight them to prevent people from their effects. Currently, simulation tools and high performance computing arise as a powerful tandem to aid forest fire management. [...]
Els incendis son un desastre natural que cada any causen moltes pèrdues. Els humans sempre han intentat lluitar contra ells prevenint a la gent dels seus efectes. Actualment, les eines de simulació i la Computació d'Altes Prestacions són un poderós tàndem per ajudar a la gestió dels incendis forestals. [...]
Los incendios son un desastre natural que cada año causan muchas pérdidas. Los humanos siempre han intentado luchar en contra de ellos previniendo a la gente de sus efectos. Actualmente, las herramientas de simulación y la Computación de Altas Prestaciones son un poderoso tándem para ayudar a la gestión de los incendios forestales. [...]

2015-06-30
Enginyeria Informàtica [958]  

Research literature : 11 records found   1 - 10next  jump to record:
Interested in being notified about new results for this query?
Set up a personal email alert or subscribe to the RSS feed.