Aplicación informática para generación de reglas de asociación por conteo de frecuencias

  1. Almiñana, A.
  2. Escudero Bueno, Laureano Fernando
  3. Rabasa Dolado, Alejandro
  4. Rodríguez Diez, Juan José
  5. Santamaría Arana, Laureano
Libro:
XXX Congreso Nacional de Estadística e Investigación Operativa y de las IV Jornadas de Estadística Pública: actas

Editorial: Comité organizador del XXX Congreso Nacional de Estadística e Investigación Operativa y IV Jornadas de Estadística Pública

ISBN: 978-84-690-7249-3

Ano de publicación: 2007

Congreso: Congreso Nacional de Estadística e Investigación Operativa (30. 2007. Valladolid)

Tipo: Achega congreso

Resumo

En este trabajo se presenta una aplicaci´on inform´atica para la generaci´on de reglas de asociaci´on a partir del m´etodo de conteo de frecuencias y los conceptos asociados de soporte y confianza. La aplicaci´on (de car´acter gen´erico) es probada sobre datos de una red de riego, para generar reglas que describan el funcionamiento de la misma. Los datos recibidos son discretizados y posteriormente se lleva a cabo una proceso de conteo de frecuencias de aparici´on de estos valores para terminar elaborando un conjunto de reglas que ayuden a describir el comportamiento real, en ese periodo, de la red monitorizada. En los estudios descriptivos y predictivos, el tipo de an´alisis de datos m´as extendido es el conocido como `ýbasado en modelos�ý y el c´alculo de alguna variable se realiza en funci´on de una expresi´on aritm´etica o de un sistema de ecuaciones m´as o menos complejos, que plasman las restricciones f´ýsicas de la red y el comportamiento exacto de todas sus variables. Estos m´etodos han demostrado ser muy eficientes en la mayor´ýa de los contextos de aplicaci´on, pero son poco flexibles y muy vulnerables a anomal´ýas en el conjunto de datos. Un tipo de m´etodos alternativos, conocidos como `ým´etodos conducidos por los datos�ý, tratan de encontrar relaciones entre los datos, tendencias y asociaciones sin partir de ning´un conocimiento previo, y examinando exclusivamente los datos en s´ý. Estos m´etodos son menos dependientes del problema que pretenden resolver (es decir son m´etodos m´as generales, aplicables a diferentes marcos con ligeras modificaciones), igualmente eficientes en la mayor´ýa de los casos y menos susceptibles a los valores extremos o an´omalos en los conjuntos de datos. Concretamente, el m´etodo que se ofrece en este trabajo es conocido como Sistemas de Reglas de Asociaci´on. A partir de las reglas generadas se obtiene una descripci´on del funcionamiento de la red muy ajustado al comportamiento real.