Google Scholar: cites
Nuevas vías para la recuperación de información en corpus históricos : clasificación del vocabulario
Agujetas Ortiz, María (Universidad de Alcalá)
Sánchez-Prieto Borja, Pedro

Títol variant: New techniques for information retrieval in historical corpora : vocabulary classification
Data: 2022
Resum: El objetivo de este artículo es explorar la aplicación de modelos ontológicos en corpus diacronicos, ensayada en el subcorpus CN de CODEA; para ello, se ha procedido a la lematización interactiva y los lemas resultantes se han clasificado en una estructura jerárquica de tres niveles, próxima a las de las taxonomías. Los vínculos semánticos entre palabras vienen reforzados por su presencia, a veces, en más de un campo nocional. Se ha explorado también la navegación por raíces léxicas, estableciendo así asociaciones inmediatas entre palabras formalmente relacionadas. De esta manera, será posible la recuperación de información semántica, lo que constituirá un avance significativo respecto de las búsquedas meramente formales.
Resum: The aim of this paper is to explore the application of ontological models in diachronic corpora. It has been tested in the CN subcorpora of CODEA. First of all, interactive lemmatisation has been carried out; the resulting lemmas have then been classified in a three-level hierarchical structure, similar to taxonomies. The semantic links between words are reinforced by their presence in more than one notional field. Navigation through lexical roots has also been explored, allowing the immediate associations are established between formally related words. In this way, the retrieval of semantic information will be possible, which will constitute significant progress compared with purely formal searches.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Llengua: Castellà
Document: Article ; recerca ; Versió publicada
Matèria: History of the spanish language ; Linguistic corpora ; Digital humanities ; Ontology ; Taxonomy ; Lexicology ; Historia de la lengua española ; Corpus lingüísticos ; Humanidades digitales ; Ontología ; Taxonomía ; Lexicología
Publicat a: Scriptum digital, Núm. 11 (2022) , p. 5-54 (Articles) , ISSN 2014-640X

Adreça original: https://raco.cat/index.php/scriptumdigital/article/view/412601
Adreça original: https://scriptum.uab.cat/scriptum/scriptum/article/view/v11-agujetas-sanchez-prieto
DOI: 10.5565/rev/scriptum.121


50 p, 798.8 KB

El registre apareix a les col·leccions:
Articles > Articles publicats > Scriptum digital
Articles > Articles de recerca

 Registre creat el 2023-02-28, darrera modificació el 2024-02-17



   Favorit i Compartir