Minería de datos sobre series temporales multivariableclasificación y clustering

  1. Prieto Izquierdo, Óscar Javier
Dirigida por:
  1. Carlos Javier Alonso González Director
  2. Juan José Rodríguez Diez Director

Universidad de defensa: Universidad de Valladolid

Fecha de defensa: 14 de abril de 2009

Tribunal:
  1. Antonio Bahamonde Rionda Presidente/a
  2. Quiliano Isaac Moro Sancho Secretario
  3. José Cristobal Riquelme Santos Vocal
  4. Cecilio Angulo Bahón Vocal
  5. Rafael Martínez Gasca Vocal

Tipo: Tesis

Teseo: 214181 DIALNET

Resumen

El desarrollo de técnicas de minería de datos sobre datos de naturaleza temporal es un área de investigación en pleno apogeo, debido tanto a la cantidad de datos de este tipo relacionados con problemas de interés para la comunidad de minería de datos, como a la importancia que estas técnicas pueden tener para su aplicación en la solución de problemas reales; algunos ejemplos de estos problemas pueden aparecer en la economía, la medicina, la industria, etcétera, El presente trabajo se centra en el estudio y propuesta de técnicas de minería de datos sobre series temporales multivariable. Las tareas consideradas son las de clasificación y clustering. Para la tarea de clasificación uno de los objetivos es el de comprobar si la descomposición del problema multivariable en problemas univariable supone una mejora en la tasa de acierto de los clasificadores que abordan el problema multivariable de manera directa. Para llevar a cabo esta propuesta se utilizan técnicas de combinación de clasificadores (ensembles). Esta técnica utiliza clasificadores univariable en un primer nivel para luego combinar las salidas de cada uno de ellos en un nivel superior. Esta propuesta se basa en la técnica de combinación de clasificadores Stacking [Wolpert92]. Para la tarea de clustering el objetivo era el de estudiar el funcionamiento de los algoritmos clásicos para su uso con series multivariable. Para llevar a cabo dicho estudio fue necesaria la adaptación de algunos de los algoritmos considerados para que fuera posible su aplicación junto con técnicas específicas de las series temporales como Alineamiento Dinámico Temporal (DTW). Para ambas tareas también se planteaba como objetivo comparar los resultados del uso de medidas de disimilitud propias de las series temporales, como DTW, con los resultados obtenidos al utilizar las características extraídas propuestas en [Rodriguez04]. Se ha realizado un estudio experimental de distintas configuraciones de los métodos de clasificación y clustering considerados. Para la tarea de clasificación el método propuesto ha obtenido tasas de acierto más altas que los métodos con los que se ha comparado en seis de los ocho conjunto de datos tenidos en cuenta. En clustering se ha observado que los métodos jerárquicos aglomerativos son los que mejores índices de Rand ajustado obtienen en líneas generales. [Wolpert92] Wolpert,D.H. Stacked generalization. Neural Networks, 1992, 5, 241-259 [Rodriguez04] Rodríguez Diez, J.J. Técnicas de Aprendizaje Automático para la Clasificación de Series. Tesis Doctoral. Departamento de Informática. Universidad de Valladolid, 2004