Procesamiento del lenguaje natural y fijación del texto. Experiencias en torno a la constitución de un corpus diacrónico de sonetos
Bermúdez Sabel, Helena (JinnTec)
Martínez Cantón, Clara Isabel (Universidad Nacional de Educación a Distancia (Espanya))
Ruiz Fabo, Pablo (Université de Strasbourg)

Títol variant: Natural Language Processing and Text Curation. Experiences within the Development of a Diachronic Sonnet Corpus
Publicació: Bellaterra : Universitat Autònoma de Barcelona. Servei de Publicacions, 2024
Resum: Esta contribución surge en el contexto de desarrollo del corpus de sonetos DISCO (Diachronic Spanish Sonnet Corpus), un corpus de 4530 sonetos en español compuestos entre el siglo xvi y el xx por autores de diversas procedencias (Europa, Latinoamérica y Filipinas). Este recurso contiene las anotaciones de diferentes fenómenos de versificación que han sido obtenidas a partir de técnicas del procesamiento del lenguaje natural (PLN). En este artículo presentamos cómo los resultados de la anotación automática pueden ser utilizados para detectar problemas de transmisión textual. Uno de los objetivos de esta contribución es el de proporcionar claves sobre posibles flujos de trabajo que, ayudándose de herramientas de PLN, permitan detectar posibles errores textuales, centrando así los esfuerzos de revisión manual en pasajes concretos.
Resum: We present work carried out within the development of DISCO, the Diachronic Spanish Sonnet Corpus project, which consists of 4,530 sonnets in Spanish from Europe, Latin America and the Philippines, including texts from the 15th to the 20th centuries. The resource offers versification annotations obtained automatically through tools based on Natural Language Processing (NLP). In this article, we present how automatic annotation results can be exploited to detect textual transmission errors. Drawing on our experience with DISCO, we present observations towards the creation of workflows assisted by NLP-based tools, which can help detect possible textual errors, thus allowing us to focus on specific passages for our manual correction effort.
Ajuts: Ministerio de Economía, Industria y Competitividad FFI2015-65093-P
Ministerio de Ciencia e Innovación PID2019-107928GB-I00
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, fins i tot amb finalitats comercials, sempre i quan es reconegui l'autoria de l'obra original. Creative Commons
Llengua: Castellà
Col·lecció: Studia Aurea Monográfica ; 9
Document: Capítol de llibre
Matèria: Corpus ; Soneto ; Procesamiento del lenguaje natural ; Anotación ; Edición digital ; Versificación sonnet ; Natural language processing ; Annotation ; Scholarly editing ; Versification
Publicat a: Editar el Siglo de Oro en la era digital, 2024, p. 161-174, ISBN 978-84-128138-3-8

Adreça original: https://monografies.uab.cat/monografies/catalog/view/sam009/210/302


14 p, 156.4 KB

El registre apareix a les col·leccions:
Llibres i col·leccions > Llibres > Studia aurea monográfica
Llibres i col·leccions > Capítols de llibres

 Registre creat el 2024-05-16, darrera modificació el 2024-05-20



   Favorit i Compartir