Improvement and expansion of a decoder module for an OCR system
Vázquez Junyent, Arnau
Valveny Llobet, Ernest, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Título variante: Millora i expansió d'un mòdul decodificador per un sistema OCR
Título variante: Mejora y expansión de un módulo decodificador para un sistema OCR
Fecha: 2020
Resumen: OCR systems, short for Optical Character Recognition, are becoming increasingly popular due to the increase in the digitalization of everything. Books, textbooks, magazines and several other paper-based documents are being transformed into an electronic version to be manipulated by a computer. As well, instant translation by image is becoming a reality with the booming technology of smartphones. Nonetheless, OCR systems are still not perfect. The real world contains a lot of extra information and noise that is very difficult for a current OCR system to clean completely, as well as the immensity of variables that take place in handwritten characters and paper-based documents. This project is meant to further improve a decoding module that uses a graph-based algorithm to predict optimal words, and attempts to increase its overall accuracy by using synthetic dataset generation for testing and applying improvements to the base algorithm.
Resumen: Els sistemes OCR, de l'anglès Optical Character Recognition, s'estàn popularitzant considerablement degut a l'augment en la digitalització del món. Llibres de lectura, llibres de text, revistes i altres documents impresos s'estàn transformant en versions digitals per a ser manipulades a través d'ordinadors. A més a més, la traducció instantània a través d'imatge s'està convertint en una realitat amb la tecnologia dels mòbils intel·ligents. No obstant, els sistemes OCR encara no són perfectes. El món real conté molta informació adicional i soroll que són molt complicats d'eliminar per a un sistema OCR actual, a més a més de la immensa quantitat de variables que trobem als caràcters manuscrits i als documents a paper. Aquest projecte millora un mòdul decodificador que fa servir un algorisme basat en grafs per a predir paraules òptimes, i millora els seus resultats utilitzant conjunts de dades generats sintèticament i aplicant modificacions per a millorar l'algorisme base.
Resumen: Los sistemas OCR, del inglés Optical Character Recognition, se están popularizando considerablemente debido al aumento en la digitalización del mundo. Libros de lectura, libros de texto, revistas y otros documentos impresos se están transformando en versiones digitales para ser manipuladas a través de ordenadores. Además, la traducción instantánea a través de imagen se está convirtiendo en una realidad con la tecnología de los móviles inteligentes. No obstante, los sistemas OCR aún no son perfectos. El mundo real contiene mucha información adicional y ruido que son muy complicados de eliminar para un sistema OCR actual, además de la inmensa cantidad de variables que encontramos en los caracteres manuscritos y los documentos a papel. Este proyecto mejora un módulo decodificador que utiliza un algoritmo basado en grafos para predecir palabras óptimas, y mejora sus resultados utilizando conjuntos de datos generados sintéticamente y aplicando modificaciones para mejorar el algoritmo base.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Lengua: Anglès
Titulación: Grau en Enginyeria Informàtica [2502441]
Plan de estudios: Enginyeria Informàtica [958]
Documento: Treball final de grau ; Text
Área temática: Menció Computació
Materia: Histograma probabilístic ; Histograma binari ; Bigrama ; OCR ; Decodificador ; Diccionari ; PHOC ; Graf ; Generació sintètica ; Histograma probabilístico ; Histograma binario ; Diccionario ; Grafo ; Generación sintética ; Probabilistic histogram ; Binary histogram ; Bigram ; Decoder ; Lexicon ; Graph ; Synthetic generation



9 p, 477.1 KB

El registro aparece en las colecciones:
Documentos de investigación > Trabajos de Fin de Grado > Escuela de Ingeniería. TFG

 Registro creado el 2020-09-02, última modificación el 2023-07-22



   Favorit i Compartir