Conversational Retrieval and Knowledge Modeling from Historical Documents
Font Solá, Paula
Lladós Canet, Josep, tut. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Cerca conversacional i estructuració del coneixement de documents històrics
Títol variant: Búsqueda conversacional y estructuración del conocimiento de documentos históricos
Data: 2025
Resum: Els documents històrics, tot i contenir una memòria valuosa, sovint són difícils d'accedir. En aquesta tesi presentem un sistema dissenyat per superar aquesta barrera. Comencem amb una transcripció d'alta precisió d'imatges a text escrit. Aquest text serveix de base per a un xat amb RAG que respon preguntes basant-se directament en el contingut. Paral·lelament, es construeix un graf de coneixement a partir de les interaccions de l'usuari, que reflecteix relacions complexes entre entitats i estructura el coneixement. En conjunt, el sistema modela el coneixement històric de manera accessible i fàcil d'utilitzar.
Resum: Los documentos históricos, aunque contienen una memoria històrica valiosa, a menudo son difíciles de acceder. En esta tesis presentamos un sistema diseñado para superar esta barrera. Comenzamos con una transcripción de alta precisión de imágenes a texto escrito. Este texto sirve de base para un chat con RAG que responde preguntas basándose directamente en el contenido. Paralelamente, se construye un grafo de conocimiento a partir de las interacciones del usuario, que refleja relaciones complejas entre entidades y estructura el conocimiento. En conjunto, el sistema modela el conocimiento histórico de manera accesible y fácil de usar.
Resum: Historical documents hold invaluable memory, yet their contents are often difficult to access. This thesis presents a system designed to bridge this gap. We start with high-accuracy transcription to convert images into machine-readable text. This corpus powers a conversational chatbot using Retrieval-Augmented Generation (RAG) to deliver precise, context-aware answers. Meanwhile, a Knowledge Graph is gradually built through user interactions, capturing complex relationships and organizing knowledge over time. Overall, our system models historical knowledge in an accessible, user-friendly way.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Anglès
Titulació: Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Àrea temàtica: Menció Computació
Matèria: Anàlisi de Documents Històrics ; Extracció d'Informació ; Transcripció de Documents ; Retrieval-Augmented Generation (RAG) ; Graf de Coneixement ; IA Conversacional ; Análisis de Documentos Históricos ; Extracción de Información ; Transcripción de Documentos ; Grafo de Conocimiento ; Historical Document Analysis ; Information Extraction ; Document Transcription ; Knowledge Graph ; Conversational AI



15 p, 28.5 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2025-07-17, darrera modificació el 2025-07-24



   Favorit i Compartir