Segmentación semántica de imágenes satelitales multimodales
Diaz Laureano, Alvaro Javier
Ponsa Mussarra, Daniel, tut. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Segmentació Semàntica d'Imatges Satelitals Multimodals
Títol variant: Semantic Segmentation of Multimodal Satellite Images
Data: 2025
Resum: La segmentació semàntica d'imatges satel·litals és essencial per a tasques com l'anàlisi de la cobertura del sòl. Aquest treball explora l'impacte de la fusió de diferents modalitats de dades (RGB, VNIR, SWIR i DTM) en el rendiment de dues arquitectures de segmentació: U-Net i ST-UNet. Utilitzant el conjunt de dades multimodal Ticino, s'avaluen diverses configuracions d'entrada i estratègies de fusió. Els resultats mostren que la fusió intermèdia de RGB, VNIR, SWIR i DTM millora el rendiment en comparació amb l'ús exclusiu de RGB, mentre que ST-UNet destaca en la segmentació d'estructures petites, com ara edificis. No obstant això, el seu rendiment global no supera el de U-Net, en part a causa de limitacions en les dades i la manca d'optimització. Aquest estudi conclou que, per al conjunt de dades Ticino, una major complexitat, tant arquitectònica com modal, no implica necessàriament una millora respecte a models més simples.
Resum: La segmentación semántica de imágenes satelitales es esencial para tareas como el análisis de la cobertura terrestre. Este trabajo explora el impacto de la fusión de distintas modalidades de datos (RGB, VNIR, SWIR y DTM) en el rendimiento de dos arquitecturas de segmentación: U-Net y ST-UNet. Usando el conjunto de datos multimodal Ticino, se evalúan diferentes configuraciones de entrada y estrategias de fusión. Los resultados muestran que la fusión intermedia de RGB, VNIR, SWIR y DTM mejora el rendimiento frente al uso exclusivo de RGB, mientras que ST-UNet destaca en la segmentación de estructuras pequeñas, como edificaciones. Sin embargo, su rendimiento global no supera a U-Net, en parte debido a limitaciones en los datos y falta de optimización. Este estudio concluye que, para el conjunto de datos Ticino, una mayor complejidad, tanto arquitectónica como modal, no implica necesariamente una mejora frente a modelos más simples.
Resum: Semantic segmentation of satellite imagery is essential for tasks such as land cover analysis. This work explores the impact of fusing different data modalities (RGB, VNIR, SWIR, and DTM) on the performance of two segmentation architectures: U-Net and ST-UNet. Using the multimodal Ticino dataset, several input configurations and fusion strategies are evaluated. Results show that Middle Fusion of RGB, VNIR, SWIR and DTM improves performance compared to using RGB alone, while ST-UNet excels in segmenting small structures, such as buildings. However, its overall performance does not surpass that of U-Net, partly due to data limitations and lack of hyperparameter optimization. This study concludes that, for the Ticino dataset, greater architectural and modal complexity does not necessarily lead to better results compared to simpler models.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Castellà
Titulació: Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Àrea temàtica: Menció Computació
Matèria: Segmentació semàntica ; Imatges satel·litals ; Fusió de modalitats ; U-Net ; ST-UNet ; Segmentación semántica ; Imágenes satelitales ; Fusión de modalidades ; Semantic segmentation ; Satellite imagery ; Modality fusion



16 p, 2.2 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2025-07-17, darrera modificació el 2025-07-23



   Favorit i Compartir