Google Scholar: citations
Nuevas vías para la recuperación de información en corpus históricos : clasificación del vocabulario
Agujetas Ortiz, María (Universidad de Alcalá)
Sánchez-Prieto Borja, Pedro

Additional title: New techniques for information retrieval in historical corpora : vocabulary classification
Date: 2022
Abstract: El objetivo de este artículo es explorar la aplicación de modelos ontológicos en corpus diacronicos, ensayada en el subcorpus CN de CODEA; para ello, se ha procedido a la lematización interactiva y los lemas resultantes se han clasificado en una estructura jerárquica de tres niveles, próxima a las de las taxonomías. Los vínculos semánticos entre palabras vienen reforzados por su presencia, a veces, en más de un campo nocional. Se ha explorado también la navegación por raíces léxicas, estableciendo así asociaciones inmediatas entre palabras formalmente relacionadas. De esta manera, será posible la recuperación de información semántica, lo que constituirá un avance significativo respecto de las búsquedas meramente formales.
Abstract: The aim of this paper is to explore the application of ontological models in diachronic corpora. It has been tested in the CN subcorpora of CODEA. First of all, interactive lemmatisation has been carried out; the resulting lemmas have then been classified in a three-level hierarchical structure, similar to taxonomies. The semantic links between words are reinforced by their presence in more than one notional field. Navigation through lexical roots has also been explored, allowing the immediate associations are established between formally related words. In this way, the retrieval of semantic information will be possible, which will constitute significant progress compared with purely formal searches.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Castellà
Document: Article ; recerca ; Versió publicada
Subject: History of the spanish language ; Linguistic corpora ; Digital humanities ; Ontology ; Taxonomy ; Lexicology ; Historia de la lengua española ; Corpus lingüísticos ; Humanidades digitales ; Ontología ; Taxonomía ; Lexicología
Published in: Scriptum digital, Núm. 11 (2022) , p. 5-54 (Articles) , ISSN 2014-640X

Adreça original: https://raco.cat/index.php/scriptumdigital/article/view/412601
Adreça original: https://scriptum.uab.cat/scriptum/scriptum/article/view/v11-agujetas-sanchez-prieto
DOI: 10.5565/rev/scriptum.121


50 p, 798.8 KB

The record appears in these collections:
Articles > Published articles > Scriptum digital
Articles > Research articles

 Record created 2023-02-28, last modified 2024-02-17



   Favorit i Compartir