Cooperative game theory tools in coalitional control networks

Muros Ponce, Francisco Javier

Cooperative game theory tools in coalitional control networks

Muros Ponce, Francisco Javier

Supervised by:

José María Maestre Torreblanca Director
Encarnación Algaba Durán Director
Eduardo Fernández Camacho Director

Defence university: Universidad de Sevilla

Fecha de defensa: 19 September 2017

Committee:

Carlos Bordóns Alba Chair
Teodoro Rafael Álamo Cantarero Secretary
Jean Derks Committee member
C. Ocampo-Martínez Committee member
Stefano Moretti Committee member

Type: Thesis

Teseo: 473379 DIALNET Idus editor

Abstract

En los últimos años ha habido un creciente interés de la comunidad científica en la búsqueda y gestión de sistemas de control distribuidos, principalmente en un contexto de control predictivo. La idea básica de estos esquemas consiste en dividir el sistema global en varios subsistemas más pequeños, cada uno gobernado por un controlador local o agente diferente, que puede o no compartir información con el resto. Todos los agentes están organizados en vecindades o coaliciones, existiendo comunicación únicamente entre agentes que pertenezcan a una misma coalición. Típicamente, dichas coaliciones se establecen de forma estática, es decir, cada agente siempre pertenece a la misma coalición independientemente del instante temporal. Sin embargo, recientemente está teniendo una gran difusión un tipo particular de control distribuido que considera una evolución dinámica de las coaliciones, de forma que la composición de agentes de cada una de ellas pueda variar en el tiempo. Mediante esta técnica, conocida como control coalicional, se logra alcanzar un compromiso entre prestaciones de control y coste de comunicación. Si analizamos el problema desde un punto de vista matemático, la teoría de juegos, rama que estudia situaciones de conflicto y cooperación a las que se les denomina juegos, es el marco más apropiado para estudiar todos los fenómenos que surgen de la interacción entre agentes que toman decisiones de forma individual o cooperando. En concreto, serán de especial interés los juegos cooperativos, donde cada jugador puede hacer sacrificios en su propio beneficio para favorecer el bien común. En cualquier caso, todos los jugadores buscan optimizar el pago que reciben del juego, medido en una cierta escala de utilidad, que puede referirse a un beneficio o un coste. Asimismo, la teoría de grafos también será utilizada en esta tesis, pues la red de comunicaciones entre los agentes del sistema de control se modelará con un grafo no dirigido, utilizando diversas medidas de centralidad para aportar información de los jugadores. Una primera tarea llevada a cabo en esta tesis ha sido definir un juego cooperativo de utilidad transferible apropiado para trabajar con sistemas de control coalicionales, llamado juego coalicional. Dicho juego, donde se han considerado como jugadores a los enlaces de comunicación existentes entre los agentes, nos proporciona el coste total que le supone al sistema cada posible coalición de enlaces o topología de red. Una vez fijadoel juego, el objetivo fundamental de esta tesis consiste en explotar las propiedades de diversas herramientas de teoría de juegos cooperativos que actúan como reglas de pago de dicho juego. En particular,a lo largo de la tesis se han considerado los valores de Shapley, posición, Banzhaf y las soluciones de poder de Harsanyi, con el fin de: medir/analizar características de los agentes y enlaces, considerarespecificaciones/restricciones sobre los mismos en el esquema de control, proveer vías alternativas de cálculo, detectar jugadores críticos en la red, o realizar un particionado del sistema. Es destacable que esta tesis pretende representar un puente de unión entre las disciplinas de control distribuido y teoría de juegos cooperativos, de forma que pueda estar dirigida a expertos en ambos campos. Ciertamente, este trabajo tiene un enfoque eminentemente teórico, alcanzando por tanto otros objetivos adicionales planteados, tales como: introducir propiedades asociadas a las herramientas empleadas, comparar analíticamente dichas herramientas, presentar resultados que garanticen la estabilidad del sistema, o combatir el problema de explosión combinacional inherente a sistemas de gran escala, con el fin de poder aplicar los resultados teóricos al diseño e implementación de sistemas reales. En ese sentido,numerosos ejemplos de simulación ilustran la viabilidad de todos los resultados alcanzados en esta tesis.