Web of Science: 53 cites, Scopus: 74 cites, Google Scholar: cites
Slimmable Compressive Autoencoders for Practical Neural Image Compression
Yang, Fei (Centre de Visió per Computador)
Herranz, Luis (Universitat Autònoma de Barcelona)
Cheng, Yongmei (Northwestern Polytechnical University. School of Automation)
Mozerov, Mikhail (Centre de Visió per Computador)

Publicació: IEEE 2021
Descripció: 10 pàg.
Resum: Neural image compression leverages deep neural networks to outperform traditional image codecs in rate-distortion performance. However, the resulting models are also heavy, computationally demanding and generally optimized for a single rate, limiting their practical use. Focusing on practical image compression, we propose slimmable compressive autoencoders (SlimCAEs), where rate (R) and distortion (D) are jointly optimized for different capacities. Once trained, encoders and decoders can be executed at different capacities, leading to different rates and complexities. We show that a successful implementation of SlimCAEs requires suitable capacity-specific RD tradeoffs. Our experiments show that SlimCAEs are highly flexible models that provide excellent rate-distortion performance, variable rate, and dynamic adjustment of memory, computational cost and latency, thus addressing the main requirements of practical image compression.
Ajuts: Agencia Estatal de Investigación RTI2018-102285-A-I00
Ministerio de Ciencia e Innovación RYC2019-027020-I
Drets: Aquest material està protegit per drets d'autor i/o drets afins. Podeu utilitzar aquest material en funció del que permet la legislació de drets d'autor i drets afins d'aplicació al vostre cas. Per a d'altres usos heu d'obtenir permís del(s) titular(s) de drets.
Llengua: Anglès
Document: Capítol de llibre ; recerca ; Versió acceptada per publicar
Matèria: Auto encoders ; Encoders and decoders ; Flexible model ; Image codecs ; Images compression ; Performance ; Performance variables ; Practical use ; Rate limiting ; Single rate
Publicat a: 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2021, p. 4996-5005, ISBN 978-1-6654-4509-2

DOI: 10.1109/CVPR46437.2021.00496


Postprint
13 p, 8.4 MB

El registre apareix a les col·leccions:
Llibres i col·leccions > Capítols de llibres

 Registre creat el 2024-11-29, darrera modificació el 2025-12-10



   Favorit i Compartir