Desarrollo y explotación del "Corpus de Documentos Españoles Anteriores a 1700" (CODEA)
Sánchez-Prieto Borja, Pedro (Universidad de Alcalá)

Data: 2012
Resum: Este artículo tiene por objeto presentar el estado actual del "Corpus de Documentos Españoles Anteriores a 1700" (CODEA, http://www. textoshispanicos. es), elaborado por el "Grupo de Investigación de Textos para la Historia del Español" (GITHE) de la Universidad de Alcalá. El CODEA ofrece a día de hoy 1500 documentos de diferentes archivos, de todas las provincias peninsulares no bilingües de España, y de los ss. XII al XVII. La triple presentación (facsimilar, paleográfica y crítica) facilita su empleo en diversos ámbitos, de la paleografía a la sintaxis histórica. Se adelantan, además, los desarrollos previstos para un futuro inmediato, como la búsqueda por lemas, la presentación estadística directa de los resultados de las consultas y la visualización en forma de mapa de las respuestas a las búsquedas. Y se exponen las vías y posibilidades para su explotación lingüística en los diferentes niveles (grafía y fonética, sintaxis y léxico). El CODEA funda su utilidad en su característica de corpus «primario», en el que los elaboradores son responsables del proceso íntegro de edición de los textos que ofrecen.
Resum: This paper aims to present the current status of the "Corpus de Documentos Españoles Anteriores a 1700" (CODEA, http://www. textoshispanicos. es) prepared by the "Grupo de Investigación de Textos para la Historia del Español" (GITHE) of the University of Alcalá. CODEA offers 1500 documents from different archives produced in all of the non-bilingual peninsular provinces of Spain, spanning from the 12th to the 17th centuries. The triple presentation (facsimile, paleographic transcription and edition with normalized spelling) facilitates its use in various disciplines, from palaeography to historical syntax. In the paper we also present further developments that will be available in the near future, such as the possibility of conducting searches by lemmata, the presentation of results in statistical graphs, and the display of maps with the geographical distribution of the forms in the search results. Likewise the paper illustrates with various examples the potential of these developments for different types of linguistic analyses (spelling and phonetics, syntax and lexical studies). The most distinctive feature of CODEA is to be a «primary» corpus in which the authors provide the texts and are fully responsible for their editorial process.
Drets: Tots els drets reservats
Llengua: Castellà.
Document: article ; recerca ; publishedVersion
Matèria: Corpus lingüísticos ; Documentos archivísticos ; Historia de la lengua española ; Language corpora ; Archival documents ; History of the spanish language
Publicat a: Scriptum digital, Núm. 1 (2012) , p. 5-35 (Articles) , ISSN 2014-640X

Adreça alternativa: https://www.raco.cat/index.php/scriptumdigital/article/view/316410


31 p, 1.2 MB

El registre apareix a les col·leccions:
Articles > Articles publicats > Scriptum digital
Articles > Articles de recerca

 Registre creat el 2017-05-12, darrera modificació el 2020-04-20



   Favorit i Compartir