Desarrollo y explotación del &quot;Corpus de Documentos Españoles Anteriores a 1700&quot; (CODEA)

Sánchez-Prieto Borja, Pedro

doi:10.5565/rev/scriptum.31

Cita bibliográfica -- Enlace permanente: https://ddd.uab.cat/record/174532

Google Scholar: citas

Desarrollo y explotación del "Corpus de Documentos Españoles Anteriores a 1700" (CODEA)
Sánchez-Prieto Borja, Pedro

(Universidad de Alcalá)

Título variante:	Development and exploitation of the "Corpus of Spanish documents prior to 1700" (CODEA)
Fecha:	2012
Resumen:	Este artículo tiene por objeto presentar el estado actual del "Corpus de Documentos Españoles Anteriores a 1700" (CODEA, http://www. textoshispanicos. es), elaborado por el "Grupo de Investigación de Textos para la Historia del Español" (GITHE) de la Universidad de Alcalá. El CODEA ofrece a día de hoy 1500 documentos de diferentes archivos, de todas las provincias peninsulares no bilingües de España, y de los ss. XII al XVII. La triple presentación (facsimilar, paleográfica y crítica) facilita su empleo en diversos ámbitos, de la paleografía a la sintaxis histórica. Se adelantan, además, los desarrollos previstos para un futuro inmediato, como la búsqueda por lemas, la presentación estadística directa de los resultados de las consultas y la visualización en forma de mapa de las respuestas a las búsquedas. Y se exponen las vías y posibilidades para su explotación lingüística en los diferentes niveles (grafía y fonética, sintaxis y léxico). El CODEA funda su utilidad en su característica de corpus «primario», en el que los elaboradores son responsables del proceso íntegro de edición de los textos que ofrecen.
Resumen:	This paper aims to present the current status of the "Corpus de Documentos Españoles Anteriores a 1700" (CODEA, http://www. textoshispanicos. es) prepared by the "Grupo de Investigación de Textos para la Historia del Español" (GITHE) of the University of Alcalá. CODEA offers 1500 documents from different archives produced in all of the non-bilingual peninsular provinces of Spain, spanning from the 12th to the 17th centuries. The triple presentation (facsimile, paleographic transcription and edition with normalized spelling) facilitates its use in various disciplines, from palaeography to historical syntax. In the paper we also present further developments that will be available in the near future, such as the possibility of conducting searches by lemmata, the presentation of results in statistical graphs, and the display of maps with the geographical distribution of the forms in the search results. Likewise the paper illustrates with various examples the potential of these developments for different types of linguistic analyses (spelling and phonetics, syntax and lexical studies). The most distinctive feature of CODEA is to be a «primary» corpus in which the authors provide the texts and are fully responsible for their editorial process.
Derechos:	Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.
Lengua:	Castellà
Documento:	Article ; recerca ; Versió publicada
Materia:	Corpus lingüísticos ; Documentos archivísticos ; Historia de la lengua española ; Language corpora ; Archival documents ; History of the spanish language
Publicado en:	Scriptum digital, Núm. 1 (2012) , p. 5-35 (Articles) , ISSN 2014-640X

Adreça alternativa: https://raco.cat/index.php/scriptumdigital/article/view/316410
Adreça original: https://scriptum.uab.cat/scriptum/scriptum/article/view/v1-sanchez
DOI: 10.5565/rev/scriptum.31

31 p, 1.2 MB

El registro aparece en las colecciones:
Artículos > Artículos publicados > Scriptum digital
Artículos > Artículos de investigación

Registro creado el 2017-05-12, última modificación el 2024-04-11

Registros similares

Añadir a la cesta personal
Exportar como Citation, BibTeX, MARC, MARCXML, DC, EDM OpenAire4