Aprenentatge Computacional per a la Visió per Computador

Cita bibliográfica -- Enlace permanente: https://ddd.uab.cat/record/265312

Aprenentatge Computacional per a la Visió per Computador [43083]
Vanrell i Martorell, Maria Isabel
Baldrich i Caselles, Ramon
Vilariño Freire, Fernando
Karatzas, Dimosthenis
Rodriguez Lopez, Pau
Arias Bedmar, Guillem
Gomez Bigorda, Lluis
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Título variante:	Computer Learning for Computer Vision
Título variante:	Aprendizaje Computacional para la Visión por Computador
Fecha:	2022-23
Resumen:	Coordinador del mòdul: Dr. Ramon Baldrich Caselles L'objectiu d'aquest mòdul és introduir les tècniques d'aprenentatge automàtic per resoldre problemes de visió per ordinador. L'aprenentatge automàtic tracta de l'anàlisi automàtica de dades a gran escala. Avui en dia s'ajusta als conceptes bàsics de molts mètodes de visió per ordinador, especialment els relacionats amb el reconeixement visual o la classificació de patrons, on els "patrons" engloben imatges d'objectes mundials, escenes i seqüències de vídeo d'accions humanes, per citar-ne algunes. Aquest mòdul presenta els fonaments i les tècniques més importants per a la classificació de patrons visuals, centrats principalment en mètodes supervisats. També es tracten temes relacionats com els descriptors d'imatges i la reducció de dimensionalitat. En la mesura del possible, totes aquestes tècniques es proven i s'avaluen en un projecte pràctic sobre descripció d'escenes a partir d'imatges, en funció de les mètriques i procediments estàndards d'avaluació de rendiment com ara corbes de record de precisió i validació creuada de k. Els resultats d'aprenentatge són: (a) Distingiu els principals tipus de tècniques de ML per a la visió per ordinador: supervisat vs no supervisat, 1 (a) Distingiu els principals tipus de tècniques de ML per a la visió per ordinador: supervisat vs no supervisat, generatiu vs. discriminatori, espai de característiques original i nucli de vectors de característiques. (b) Conèixer els punts forts i febles dels diferents mètodes, en part après durant la resolució d'un problema de classificació depatrons reals. (c) Ser capaç d'utilitzar implementacions de mètodes existents i construir-les des de zero. El mòdul aprofundeix en dues aproximacions principals per introduir ML al problema de classificació d'imatges. Utilitzant: a) descripció de la imatge amb descriptors definits manualment, b) descripció de la imatge basat en dades. En el primer cas s'utilitza el Bag of Words, en el segon, l'enfocament de l'aprenentatge profund. El contingut de DL es desenvolupa àmpliament proporcionant tant les bases teòriques de les diferents parts de les modernes acriliteres de Neural Networs, com les bones pràctiques per aplicar-lo en aplicacions reals.
Resumen:	Module Coordinator: Dr. Ramon Baldrich Caselles The objective of this module is to introduce the Machine learning techniques for solving computer vision problems. Machine learning deals with the automatic analisys of large scale data. Nowadays it conforms the basics of many computer vision methods, specially those related to visual pattern recognition or classification, where 'patterns' encompasses images of world objects, scenes and video sequences of human actions, to name a few. This module presents the foundations and most important techniques for the classification of visual patterns, mainly focusing on supervised methods. Also, related topics like image descriptors and dimensionality reduction are addressed. As much as possible, all these techniques are tried and assessed on a practical project concerning scene description from pictures, toghether with the standard metrics and procedures for performance evaluation like precision-recall curves and k-fold cross-validation. The learning outcomes are: (a) Distinguish the main types of ML techniques for computer vision: supervised vs. unsupervised, generative vs. discriminative, original feature space vs. feature vector kernelization. 1 (b) Know the strong and weak points of the different methods, in part learned while solving a real pattern classification problem. (c) Being able to use existing method implementations and build them from scratch. The module goes in depth in two main approches to introduce ML into the image classification problem. Using: a) handcrafted image description, b) data driven image description. On the first case the Bag of Words is used, on the second one, the Deep Learning approach. The DL content is developed extensively providing both, thoretical basis of the different parts of modern Neural Networs acrhitecutres, and best practices to apply it on real applications.
Resumen:	Coordinador del módulo: Dr. Ramon Baldrich Caselles El objetivo de este módulo es presentar las técnicas de aprendizaje automático para resolver problemas de visión por computador. El aprendizaje automático se ocupa del análisis automático de datos a gran escala. Hoy en día, conforma los conceptos básicos de muchos métodos de visión por computadora, especialmente aquellos relacionados con el reconocimiento o la clasificación de patrones visuales, donde los 'patrones' abarcan imágenes de objetos del mundo, escenas y secuencias de video de acciones humanas, por nombrar algunos. Este módulo presenta los fundamentos y las técnicas más importantes para la clasificación de patrones visuales, centrándose principalmente en métodos supervisados. Además, se abordan temas relacionados como descriptores de imágenes y reducción de dimensionalidad. En la medida de lo posible, todas estas técnicas se prueban y evalúan en un proyecto práctico relacionado con la descripción de la escena a partir de imágenes, junto con las métricas y los procedimientos estándar para la evaluación del rendimiento, como las curvas de recuperación de precisión y la validación cruzada en k veces. Los resultados del aprendizaje son: (a) Distinga los principales tipos de técnicas de ML para la visión por computadora: supervisado versus no 1 (a) Distinga los principales tipos de técnicas de ML para la visión por computadora: supervisado versus no supervisado, generativo versus discriminativo, espacio de características originales versus kernelización de vectores de características. (b) Conozca los puntos fuertes y débiles de los diferentes métodos, en parte aprendidos mientras resuelve un problema real de clasificación de patrones. (c) Ser capaz de usar implementaciones de métodos existentes y construirlas desde cero. El módulo profundiza en dos enfoques principales para introducir ML en el problema de clasificación de imágenes. Usando: a) descripción de imagen hecha a mano, b) descripción de imagen basada en datos. En el primer caso se usa Bag of Words, en el segundo el enfoque de aprendizaje profundo. El contenido de DL se desarrolla, proporcionando tanto bases teóricas de las diferentes partes de los modernos sistemas de Neural Networs como las mejores prácticas para aplicarlo en aplicaciones reales.
Derechos:	Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, fins i tot amb finalitats comercials, sempre i quan es reconegui l'autoria de l'obra original.
Lengua:	Català, anglès, castellà
Titulación:	Visió per Computador / Computer Vision [4314099]
Plan de estudios:	Màster Universitari en Visió per Computador/Computer Vision [1172]
Documento:	Objecte d'aprenentatge