Contouring of arbitrarily-shaped text with Fourier Series
González i Fernández, Irene
Karatzas, Dimosthenis, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Título variante: Contorn de text en forma arbitrària mitjançant Fourier Series
Título variante: Contorno de texto en forma arbitraria mediante Fourier Series
Fecha: 2021
Resumen: To detect arbitrarily-shaped text, one must first design a text instance representation that enables a neural network to learn text variances. The most usual approach is to model the space that text occupies in an image via masks or contours of points, which have their clear deficits, such as non-continuity. A solution to this is to model these spaces as the inside of a curve, determined by its Fourier coefficients. This approach has the advantage of being able to represent highly-curved shapes as well as being able to do so with a small signature. We construct a neural network to estimate such Fourier series by calculating appropriate Fourier coefficients, which correspond to its signature.
Resumen: Per detectar text en formes arbitràries a una imatge, un ha de donar una representació de l'espai que aquest ocupa que permeti a una xarxa neuronal aprendre les variacions del text. Els enfocaments més comuns són donar una màscara de píxels on es troba el text o un contorn de punts que l'envoltin. Aquests dos enfocaments tenen els seus dèficits, com la manca de continuïtat. Una solució a això és modelar aquests espais com l'interior d'una corba tancada, determinada pels seus coeficients de Fourier. Aquest enfocament té el benefici de ser capaç de representar text en formes altament curvilínies, a la vegada de tenir una signatura molt lleugera. Construïm una xarxa neuronal per estimar aquestes sèries de Fourier, determinada pels seus coeficients de Fourier, que corresponen a la seva signatura.
Resumen: Para detectar texto en formas arbitrarias en una imagen, uno ha de dar con una representación del espacio ocupada que le permita a una red neuronal aprender las variaciones del texto. Los enfoques más son de dar una mascara de pixeles donde se encuentra el texto o un contorno de puntos que lo envuelvan. Estos dos enfoques tienen sus déficits, como la falta de continuidad. Una solución a esto es modelar estos espacios como el interior de una curva cerrada, determinada por sus coeficientes de Fourier. Este enfoque tiene el beneficio de ser capaz de representar texto en formas altamente curvilíneas, a la vez de tener una firma muy ligera. Construimos una red neuronal para estimar estas series de Fourier, determinada por sus coeficientes de Fourier, que corresponen a su firma.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Lengua: Anglès
Titulación: Grau en Enginyeria Informàtica [2502441]
Plan de estudios: Grau en Enginyeria Informàtica [958]
Documento: Treball final de grau ; Text
Área temática: Menció Computació
Materia: Fourier Series ; Neural networks ; Scene text detection ; Arbitrary text contouring ; Total-Text dataset ; Sèries de Fourier ; Xarxes neuronals ; Detecció de text en escena ; Contorn de text arbitrari ; Series de Fourier ; Redes neuronales ; Detección de texto en escena ; Contorno de texto arbitrario



7 p, 1.0 MB

El registro aparece en las colecciones:
Documentos de investigación > Trabajos de Fin de Grado > Escuela de Ingeniería. TFG

 Registro creado el 2021-07-26, última modificación el 2024-06-15



   Favorit i Compartir