Plataforma de cerca semàntica per a hemeroteques digitals
Quintana Carbelo, David
Rusiñol Sanabra, Marçal, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title: Semantic browser for digital newspaper libraries
Additional title: Plataforma de búsqueda semántica para hemerotecas digitales
Date: 2018-07-02
Abstract: En aquest projecte es proposa una plataforma de cerca semàntica per a hemeroteques digitals basat en un Named Entity Recognition o NER. En la nostra plataforma es podrà introduir diferents textos d'articles i aquesta informació s'enviarà al nostre servidor on es processarà el text introduït per extreure els noms de persones, organitzacions, localitats i altres noms d'interès. A partir d'aquesta informació podrem veure fàcilment aquestes entitats en el text per poder aconseguir així una cerca amb més profunditat a l'hemeroteca digital. En aquest projecte s'han desenvolupen cinc NER diferents i s'analitzen els seus resultats per determinar la seva eficiència respecte un arxiu de test i davant casos reals extrets a hemeroteques digitals.
Abstract: This project proposes a semantic search platform for digital newspaper libraries based on a Named Entity Recognition or NER. In our platform you can enter different articles texts and this information will be sent to our server where the text entered will be processed to extract the names of people, organizations, localities and miscellaneous. From this information we can easily see these entities in the text in order to be able to search with more depth in the digital archive. Five different NER have been developed in this project and their results are analysed to determine their efficiency with a test file and with real cases extracted from digital newspaper libraries.
Abstract: En este proyecto se propone una plataforma de búsqueda semántica para hemerotecas digitales basado en un Named Entity Recognition o NER. En nuestra plataforma se podrá introducir diferentes textos de artículos y esta información se enviará al nuestro servidor donde se procesará el texto introducido para extraer los nombres de personas, organizaciones, localidades y otros nombres de interés. A partir de esta información podremos ver fácilmente estas entidades en el texto para poder conseguir una búsqueda con mas profundidad en la hemeroteca digital. En este proyecto se han desarrollado cinco NER diferentes y se analizan sus resultados para determinar su eficiencia respecto un archivo de test y delante de casos reales extraídos de hemerotecas digitales.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Català
Studies: Grau en Enginyeria Informàtica [2502441]
Study plan: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Subject area: Menció Computació
Subject: Named Entity Recognition ; Token ; Entitat ; Etiqueta ; Sklearn-Crfsuite ; Cercador semàntic ; Hemeroteca digital ; Entidad ; Buscador semántico ; Entity ; Label ; Semantic browser ; Digital newspaper library



10 p, 1.1 MB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

 Record created 2018-10-24, last modified 2023-07-22



   Favorit i Compartir