Google Scholar: citas
Nuevas vías para la recuperación de información en corpus históricos : clasificación del vocabulario
Agujetas Ortiz, María (Universidad de Alcalá)
Sánchez-Prieto Borja, Pedro

Título variante: New techniques for information retrieval in historical corpora : vocabulary classification
Fecha: 2022
Resumen: El objetivo de este artículo es explorar la aplicación de modelos ontológicos en corpus diacronicos, ensayada en el subcorpus CN de CODEA; para ello, se ha procedido a la lematización interactiva y los lemas resultantes se han clasificado en una estructura jerárquica de tres niveles, próxima a las de las taxonomías. Los vínculos semánticos entre palabras vienen reforzados por su presencia, a veces, en más de un campo nocional. Se ha explorado también la navegación por raíces léxicas, estableciendo así asociaciones inmediatas entre palabras formalmente relacionadas. De esta manera, será posible la recuperación de información semántica, lo que constituirá un avance significativo respecto de las búsquedas meramente formales.
Resumen: The aim of this paper is to explore the application of ontological models in diachronic corpora. It has been tested in the CN subcorpora of CODEA. First of all, interactive lemmatisation has been carried out; the resulting lemmas have then been classified in a three-level hierarchical structure, similar to taxonomies. The semantic links between words are reinforced by their presence in more than one notional field. Navigation through lexical roots has also been explored, allowing the immediate associations are established between formally related words. In this way, the retrieval of semantic information will be possible, which will constitute significant progress compared with purely formal searches.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Lengua: Castellà
Documento: Article ; recerca ; Versió publicada
Materia: History of the spanish language ; Linguistic corpora ; Digital humanities ; Ontology ; Taxonomy ; Lexicology ; Historia de la lengua española ; Corpus lingüísticos ; Humanidades digitales ; Ontología ; Taxonomía ; Lexicología
Publicado en: Scriptum digital, Núm. 11 (2022) , p. 5-54 (Articles) , ISSN 2014-640X

Adreça original: https://raco.cat/index.php/scriptumdigital/article/view/412601
Adreça original: https://scriptum.uab.cat/scriptum/scriptum/article/view/v11-agujetas-sanchez-prieto
DOI: 10.5565/rev/scriptum.121


50 p, 798.8 KB

El registro aparece en las colecciones:
Artículos > Artículos publicados > Scriptum digital
Artículos > Artículos de investigación

 Registro creado el 2023-02-28, última modificación el 2024-02-17



   Favorit i Compartir