Contouring of arbitrarily-shaped text with Fourier Series
González i Fernández, Irene
Karatzas, Dimosthenis, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title: Contorn de text en forma arbitrària mitjançant Fourier Series
Additional title: Contorno de texto en forma arbitraria mediante Fourier Series
Date: 2021
Abstract: To detect arbitrarily-shaped text, one must first design a text instance representation that enables a neural network to learn text variances. The most usual approach is to model the space that text occupies in an image via masks or contours of points, which have their clear deficits, such as non-continuity. A solution to this is to model these spaces as the inside of a curve, determined by its Fourier coefficients. This approach has the advantage of being able to represent highly-curved shapes as well as being able to do so with a small signature. We construct a neural network to estimate such Fourier series by calculating appropriate Fourier coefficients, which correspond to its signature.
Abstract: Per detectar text en formes arbitràries a una imatge, un ha de donar una representació de l'espai que aquest ocupa que permeti a una xarxa neuronal aprendre les variacions del text. Els enfocaments més comuns són donar una màscara de píxels on es troba el text o un contorn de punts que l'envoltin. Aquests dos enfocaments tenen els seus dèficits, com la manca de continuïtat. Una solució a això és modelar aquests espais com l'interior d'una corba tancada, determinada pels seus coeficients de Fourier. Aquest enfocament té el benefici de ser capaç de representar text en formes altament curvilínies, a la vegada de tenir una signatura molt lleugera. Construïm una xarxa neuronal per estimar aquestes sèries de Fourier, determinada pels seus coeficients de Fourier, que corresponen a la seva signatura.
Abstract: Para detectar texto en formas arbitrarias en una imagen, uno ha de dar con una representación del espacio ocupada que le permita a una red neuronal aprender las variaciones del texto. Los enfoques más son de dar una mascara de pixeles donde se encuentra el texto o un contorno de puntos que lo envuelvan. Estos dos enfoques tienen sus déficits, como la falta de continuidad. Una solución a esto es modelar estos espacios como el interior de una curva cerrada, determinada por sus coeficientes de Fourier. Este enfoque tiene el beneficio de ser capaz de representar texto en formas altamente curvilíneas, a la vez de tener una firma muy ligera. Construimos una red neuronal para estimar estas series de Fourier, determinada por sus coeficientes de Fourier, que corresponen a su firma.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Anglès
Studies: Grau en Enginyeria Informàtica [2502441]
Study plan: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Subject area: Menció Computació
Subject: Fourier Series ; Neural networks ; Scene text detection ; Arbitrary text contouring ; Total-Text dataset ; Sèries de Fourier ; Xarxes neuronals ; Detecció de text en escena ; Contorn de text arbitrari ; Series de Fourier ; Redes neuronales ; Detección de texto en escena ; Contorno de texto arbitrario



7 p, 1.0 MB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

 Record created 2021-07-26, last modified 2023-07-22



   Favorit i Compartir