Títol variant: |
"Oralia diacrónica del español" : a new corpus of the modern age |
Data: |
2020 |
Resum: |
Transcurridas casi dos décadas desde la aparición de los grandes corpus históricos, la posibilidad de acceder a grandes bancos de datos de una forma rápida y sencilla se ha asumido ya como metodología habitual. No obstante, en los últimos años se ha ido imponiendo una mirada más exigente que ha derivado en la construcción de corpus históricos especializados de tamaño más reducido (Enrique-Arias 2009; Kabatek 2016). En este artículo se presenta el corpus Oralia diacrónica del español (ODE), compuesto por inventarios de bienes, declaraciones de testigos y certificaciones de cirujanos. Respecto a la metodología, las transcripciones de los manuscritos inéditos se procesan en la plataforma TEITOK (Janssen 2016), especialmente diseñada para tokenizar, normalizar y anotar textos en formato XML-TEI. El resultado final es un producto que combina la edición digital, la imagen facsimilar y el corpus lingüísticamente anotado, convirtiendo así a ODE en un recurso electrónico de utilidad para paleógrafos, filólogos, lingüistas e historiadores. |
Resum: |
Almost two decades after the appearance of big historical corpora, accessing large databases in a quick and easy way has already become part of the standard methodology. However, in recent years a more demanding approach has been imposed, which has led to the construction of smaller specialized historical corpora (Enrique-Arias 2009; Kabatek 2016). This article presents the corpus Oralia diacrónica del español (ODE), composed of inventories of goods, witness statements and surgeons' certifications. Regarding the methodology, transcriptions of unpublished manuscripts have been processed on the TEITOK platform (Janssen 2016), which is specially designed to tokenize, standardize and annotate texts in the XML-TEI format. The final result is a product that combines the digital edition, the facsimile image and the linguistically annotated corpus, making ODE, as such, a useful electronic resource for palaeographers, philologists,linguists and historians. |
Ajuts: |
Agencia Estatal de Investigación FEDER/UE/FFI2017-83400-P
|
Drets: |
Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. |
Llengua: |
Castellà |
Document: |
Article ; recerca ; Versió publicada |
Matèria: |
Electronic corpus design ;
16th-19th centuries ;
Corpus annotation ;
Historical dialectology ;
XML-TEI ;
Diseño de corpus electrónicos ;
Siglos xvi-xix ;
Anotación de corpus ;
Dialectología histórica |
Publicat a: |
Scriptum digital, Núm. 9 (2020) , p. 167-189 (Articles) , ISSN 2014-640X |