Intensive use of lexicon and corpus for WSD

  1. Martí Antonín, María Antonia
  2. Vázquez Pérez, Sonia
  3. Montoyo Guijarro, Andrés
  4. Nica, Iulia
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2004

Número: 33

Páginas: 147-154

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

El artículo trata sobre el uso de información lingüística en la Desambiguación Semántica Automática (DSA). Proponemos un método de DSA basado en conocimiento y no supervisado, que requiere sólo un corpus amplio, previamente etiquetado a nivel morfológico, y muy poco conocimiento gramatical. El proceso de DSA se realiza a través de los patrones sintácticos en los que una ocurrencia ambigua aparece, en base a la hipótesis de "almost one sense per syntactic pattern". Esta integración nos permite extraer información paradigmática y sintagmática del corpus relacionada con la ocurrencia ambigua. Usamos variantes de la información de EuroWordNet asociada a los sentidos y dos algoritmos de DSA. Presentamos los resultados obtenidos en la aplicación del método sobre la tarea Spanish lexical sample de Senseval. La metodología es fácilmente transferible a otras lenguas