SplitIt : efficient and effective OCR System
Navarro Hernando, Daniel
Espinosa, Antonio, dir. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Título variante: Splitit : Sistema OCR eficiente y efectivo
Fecha: 2022
Resumen: El projecte es basa en trobar un model de reconeixement de text en imatges que sigui capaç de llegir la informació continguda en imatges de tiquets preses amb telèfon mòbil per després poder ser desplegat amb una aplicació sencera. El projecte consta de la utilització i avaluació de les eines més comunes per resoldre aquest problema així com la investigació i avaluació dels models SOTA que resolen aquest problema avaluant la precisió i temps de resposta de les diferents solucions. Forma part del treball el desenvolupament d'un model que compleix amb els requisits de performance que imposa la aplicació que es desenvolupa paral·lelament amb el model, compensant les carències que tenen les altres solucions prèviament implementades dissenyant i implementat una solució feta a mida per el nostre problema.
Resumen: The project is based on finding a model of text recognition in images that follows the ability to get the information contained in images of tickets present with a mobile phone, but later it can be displayed with a simple application. The project consists of the use and evaluation of the most common ones to solve this problem with the investigation and evaluation of SOTA models that solve this problem, evaluating the precision and response times of the different solutions. Part of the work is the development of a model that complies with the performance requirements imposed by the application, which is developed in parallel with the model, compensating for the deficiencies that the other previously implemented solutions have, designing and implementing a tailored solution per our problem.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Lengua: Català
Titulación: Grau en Enginyeria de Dades [2503758]
Plan de estudios: Enginyeria de Dades [1394]
Documento: Treball final de grau ; Text
Materia: OCR ; Machine learning ; Visio per computador ; Visión por computador ; Aprendizaje computacional ; Computer vision



13 p, 1.6 MB

El registro aparece en las colecciones:
Documentos de investigación > Trabajos de Fin de Grado > Escuela de Ingeniería. TFG

 Registro creado el 2022-07-28, última modificación el 2024-02-16



   Favorit i Compartir