La Recuperación de Información en español y la normalizacion de términos

  1. Alonso Berrocal, José Luis
  2. Rodríguez Vázquez de Aldana, Emilio
  3. García de Figuerola Paniagua, Luis Carlos
  4. Zazo Rodríguez, Ángel Francisco
Revue:
Inteligencia artificial: Revista Iberoamericana de Inteligencia Artificial

ISSN: 1137-3601 1988-3064

Année de publication: 2004

Volumen: 8

Número: 22

Pages: 135-145

Type: Article

D'autres publications dans: Inteligencia artificial: Revista Iberoamericana de Inteligencia Artificial

Résumé

La mayor parte de los Sistemas de Recuperacion de Informacion utilizan, de una forma u otra, recuentos de frecuencias de las palabras que aparecen en los documentos.Tales recuentos conllevan la necesidad de normalizar dichos terminos. Una simple normalizacion de caracteres (mayusculas/minusculas, acentos y otros diacriticos) parece insuficiente, ya que muchas palabras, por exion morfologica o derivacion, podrian ser agrupadas bajo una unica forma, al tener contenidos semanticos muy cercanos. Se analizan diversos algoritmos de normalizacion y se muestran los experimentos llevados a cabo para evaluar su eficacia.