Conversational Retrieval and Knowledge Modeling from Historical Documents
Font Solá, Paula
Lladós Canet, Josep, tut. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona.
Escola d'Enginyeria
| Additional title: |
Cerca conversacional i estructuració del coneixement de documents històrics |
| Additional title: |
Búsqueda conversacional y estructuración del conocimiento de documentos históricos |
| Date: |
2025 |
| Abstract: |
Els documents històrics, tot i contenir una memòria valuosa, sovint són difícils d'accedir. En aquesta tesi presentem un sistema dissenyat per superar aquesta barrera. Comencem amb una transcripció d'alta precisió d'imatges a text escrit. Aquest text serveix de base per a un xat amb RAG que respon preguntes basant-se directament en el contingut. Paral·lelament, es construeix un graf de coneixement a partir de les interaccions de l'usuari, que reflecteix relacions complexes entre entitats i estructura el coneixement. En conjunt, el sistema modela el coneixement històric de manera accessible i fàcil d'utilitzar. |
| Abstract: |
Los documentos históricos, aunque contienen una memoria històrica valiosa, a menudo son difíciles de acceder. En esta tesis presentamos un sistema diseñado para superar esta barrera. Comenzamos con una transcripción de alta precisión de imágenes a texto escrito. Este texto sirve de base para un chat con RAG que responde preguntas basándose directamente en el contenido. Paralelamente, se construye un grafo de conocimiento a partir de las interacciones del usuario, que refleja relaciones complejas entre entidades y estructura el conocimiento. En conjunto, el sistema modela el conocimiento histórico de manera accesible y fácil de usar. |
| Abstract: |
Historical documents hold invaluable memory, yet their contents are often difficult to access. This thesis presents a system designed to bridge this gap. We start with high-accuracy transcription to convert images into machine-readable text. This corpus powers a conversational chatbot using Retrieval-Augmented Generation (RAG) to deliver precise, context-aware answers. Meanwhile, a Knowledge Graph is gradually built through user interactions, capturing complex relationships and organizing knowledge over time. Overall, our system models historical knowledge in an accessible, user-friendly way. |
| Rights: |
Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.  |
| Language: |
Anglès |
| Studies: |
Enginyeria Informàtica [2502441] |
| Study plan: |
Enginyeria Informàtica [958] |
| Document: |
Treball final de grau ; Text |
| Subject area: |
Menció Computació |
| Subject: |
Anàlisi de Documents Històrics ;
Extracció d'Informació ;
Transcripció de Documents ;
Retrieval-Augmented Generation (RAG) ;
Graf de Coneixement ;
IA Conversacional ;
Análisis de Documentos Históricos ;
Extracción de Información ;
Transcripción de Documentos ;
Grafo de Conocimiento ;
Historical Document Analysis ;
Information Extraction ;
Document Transcription ;
Knowledge Graph ;
Conversational AI |
The record appears in these collections:
Research literature >
Bachelor's degree final project >
School of Engineering. TFG
Record created 2025-07-17, last modified 2025-07-24