On the definition of a prosodically balanced corpus : combining greedy algorithms with expert guided manipulation
Escudero, David (Universidad de Valladolid)
Aguilar, Lourdes (Universitat Autònoma de Barcelona)
Bonafonte, Antonio (Universitat Politècnica de Catalunya)
Garrido Almiñana, Juan María (Universitat Pompeu Fabra)

Títol variant: Hacia la definición de un corpus equilibrado prosódicamente : estrategia combinada de algoritmos voraces y manipulación de expertos
Data: 2009
Resum: Este artículo presenta el proceso de definición de un corpus de texto equilibrado en términos de atributos prosódicos. Se presenta formalmente la aplicación de algoritmos voraces y se discuten sus limitaciones. Además, se propone una guía de manipulación de textos que contribuye a mejorar considerablemente los resultados. El trabajo experimental constata este hecho con la aplicación de la metodología en diversos corpus de noticias radiofónicas en español.
Resum: This article reports the process of building a balanced text corpus taking into account prosodic features. We formalize the application of greedy algorithms for text selection and we discuss their limitations. We also defend an expert guideline for text manipulation that significantly improves the performance of the algorithms. The application of this methodology to a radio news corpus empirically supports the proposed strategy.
Ajuts: Ministerio de Ciencia e Innovación FFI2008-04982-C003-02
Ministerio de Ciencia e Innovación TEC2006-13694-C03
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, fins i tot amb finalitats comercials, sempre i quan es reconegui l'autoria de l'obra original. Creative Commons
Llengua: Anglès
Document: Article ; recerca ; Versió publicada
Matèria: Selección de subcorpus ; Algoritmos voraces ; Modelado prosódico ; Subcorpus selection ; Greedy algorithms ; Prosodic modelling
Publicat a: Procesamiento del lenguaje natural, Núm. 43 (2009) , p. 93-101, ISSN 1989-7553

Adreça original: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/15


9 p, 171.7 KB

El registre apareix a les col·leccions:
Articles > Articles de recerca
Articles > Articles publicats

 Registre creat el 2021-03-18, darrera modificació el 2022-07-06



   Favorit i Compartir