Hierarchical self-refining consensus architectures and soft consensus functions for robust multimedia clustering

  1. Sevillano Domínguez, Xavier
unter der Leitung von:
  1. Joan Claudi Socoró Carrié Doktorvater/Doktormutter
  2. Francesc Alías Doktorvater/Doktormutter

Universität der Verteidigung: Universitat Ramon Llull

Fecha de defensa: 08 von Juni von 2009

Gericht:
  1. Paolo Rosso Präsident/in
  2. Ester Bernadó Mansilla Sekretär/in
  3. Jordi Turmo Vocal
  4. Aristides Gionis Vocal
  5. Juan José Rodríguez Diez Vocal

Art: Dissertation

Teseo: 249502 DIALNET

Zusammenfassung

Al segmentar de forma no supervisada una colección de datos, el usuario debe tomar múltiples decisiones qué algoritmo aplicar, cómo representar los objetos, en cuantos grupos agrupar éstos, entre otras que condicionan, en gran medida, la calidad de la partición resultante, Desgraciadamente, la naturaleza no supervisada del problema hace difícil (cuando no imposible) tomar estas decisiones de manera fundamentada, a no ser que se disponga de cierto conocimiento del dominio. En un intento por combatir estas incertidumbres, esta tesis propone una aproximación al problema que minimiza, intencionadamente, la toma de decisiones por parte del usuario. Al contrario, se alienta el uso de tantos sistemas de clasificación no supervisada como sea posible, combinándolos con el fin de obtener la partición final de los datos (o partición de consenso). Cuanto más similar sea ésta a la partición de máxima calidad ofrecida por los sistemas de clasificación sujetos a combinación, mayor será el grado de robustez respecto a las indeterminaciones inherentes a la clasificación no supervisada. No obstante, la combinación indiscriminada de clasificadores no supervisados plantea dos dificultades principales, que son i) el incremento de la complejidad computacional del proceso de combinación, hasta el punto que su ejecución puede ser inviable si el número de sistemas a combinar es excesivo, y ii) la obtención de particiones de consenso de baja calidad debida a la inclusión de sistemas de clasificación pobres. Con el objetivo de luchar contra estos problemas, esta tesis introduce las arquitecturas de consenso jerárquicas auto-refinables como vía para la obtención de particiones de consenso de buena calidad con bajo coste computacional, tal como confirman los numerosos experimentos realizados. Con la intención de exportar esta estrategia de clasificación no supervisada robusta a un marco generalista, se propone un conjunto de funciones de consenso basadas en votación para la combinación de clasificadores difusos. Diversos experimentos demuestran que sus prestaciones son comparables o superiores a buena parte del estado del arte. Nuestras propuestas son aplicables de forma natural a la clasificación robusta de datos multimodales i) un problema de interés actual dada la ubicuidad de la multimedia ii), ya que la existencia de múltiples modalidades plantea indeterminaciones adicionales que dificultan la obtención de particiones robustas. La base de nuestra propuesta es la creación de conjuntos de particiones multimodales, lo que permite el uso natural y simultáneo de técnicas de fusión de modalidades temprana y tardía, dando pie a una aproximación genérica y eficiente a la clasificación multimedia cuyos resultados se analizan a lo largo de múltiples experimentos.