Metodología para el diseño conceptual de almacenes de datos

  1. Zepeda Sánchez, Leopoldo Zenaido
Zuzendaria:
  1. Matilde Celma Giménez Zuzendaria

Defentsa unibertsitatea: Universitat Politècnica de València

Fecha de defensa: 2008(e)ko ekaina-(a)k 26

Epaimahaia:
  1. Oscar Pastor López Presidentea
  2. Vicente Pelechano Ferragud Idazkaria
  3. Francisco José García Peñalvo Kidea
  4. Paloma Martínez Fernández Kidea
  5. H. Decker Kidea

Mota: Tesia

Laburpena

A partir de la introducción del modelo de datos multidimensional como formalismo de modelado para Almacenes de Datos (ADs), se han realizado distintas propuestas metodológicas para capturar la estructura del AD a nivel conceptual. Las soluciones propuestas parten de diferentes aspectos de diseño: los requisitos de usuario, el análisis del esquema de la base de datos operacional o una combinación de ambos (técnicas mixtas). Model Driven Architecture (MDA) es un nuevo estándar para el desarrollo de sistemas dirigido por modelos. MDA propone tres puntos de vista: Computation Independent Model (CIM), Platform Independent Model (PIM) and Platform Specific Model (PSM). Esta tesis, se enmarca en el área del diseño de ADs con MDA (una metodología para el diseño conceptual de ADs). Este método, es empleado con una metodología compuesta y consiste de tres fases. La primera fase, esta dedicada a examinar el esquema ER de la base de datos operacional, generando los esquemas multidimensionales candidatos para el AD. La solución a esta fase, se ha abordado en el contexto de MDA para esto, hemos definido un conjunto de reglas de transformación entre el PIM Entidad Relación (ER) y el PIM On-Line Analytical Processing (OLAP). En la segunda fase, los requisitos de usuario son recogidos por medio de entrevistas. El propósito de las entrevistas es obtener información acerca de las necesidades de análisis de los usuarios. Como base para esta fase, adaptamos un método de elicitación de requisitos basado en metas. La tercera fase, contrasta la información obtenida en la segunda fase, con los esquemas multidimensional candidatos formados en la primera fase generando así, la mejor solución (soportada por las bases datos operacionales) que mejor reflejan los requisitos de usuario.