On the definition of a prosodically balaced corpuscombining greedy algorithms with expert guided manipulation

  1. Escudero Mancebo, David
  2. Aguilar, Lourdes
  3. Bonafonte Cávez, Antonio
  4. Garrido Almiñana, Juan María
Aldizkaria:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Argitalpen urtea: 2009

Zenbakia: 43

Orrialdeak: 93-101

Mota: Artikulua

Beste argitalpen batzuk: Procesamiento del lenguaje natural

Laburpena

Este artículo presenta el proceso de definición de un corpus de texto equilibrado en términos de atributos prosódicos. Se presenta formalmente la aplicación de algoritmos voraces y se discuten sus limitaciones. Además, se propone una guía de manipulación de textos que contribuye a mejorar considerablemente los resultados. El trabajo experimental constata este hecho con la aplicación de la metodología en diversos corpus de noticias radiofónicas en español.