Título: Mean field game theory: consensus, leader-follower and major-minor agent systems
Autores: Nourian Aval Noghabi, Mojtaba
Fecha: 2013
Publicador: McGill University - MCGILL
Fuente:
Tipo: Electronic Thesis or Dissertation
Tema: Engineering - Electronics and Electrical
Descripción: This thesis focuses on Mean Field Game (MFG) theory with applications to consensus, flocking, leader-follower and major-minor agent systems. The MFG methodology addresses a class of dynamic games with a large number of minor agents in which each agent interacts with the average or so-called mean field effect of other agents via couplings in their individual dynamics and cost functions. A minor agent is an agent which, asymptotically as the population size goes to infinity, has a negligible influence on the overall system while the overall population's effect on it is significant. The thesis is presented in three main parts.The first part consists of applications of the MFG methodology to large population consensus and flocking behaviour. In these formulations each agent seeks to minimize its individual quadratic discounted or long time average (i.e., ergodic) cost functions involving the mean of the states of all other agents. The resulting MFG control strategies steer each agent's state toward the initial state population mean, and by applying these decentralized strategies, the system reaches mean-consensus asymptotically as time and population size go to infinity.The second part is concerned with the extension of the mean field linear-quadratic-Gaussian (MF LQG) framework so as to model the collective system dynamics which include large population of leaders and followers, and an unknown (to the followers) reference trajectory for the leaders. The cost of each leader is based on a trade-off between moving toward the reference trajectory and staying near leaders' own centroid. On the other hand, followers react by tracking a convex combination of their own centroid and the centroid of the leaders. The MF LQG equations characterizing the Nash equilibrium for infinite population systems are derived, and under appropriate conditions, they have a unique solution leading to decentralized control laws. The computation of the followers' mean field control laws requires knowledge of the complete reference trajectory which is in general not known to the followers but is estimated by a likelihood ratio based adaptation scheme based on noisy observations taken by the followers on a random sample of leaders. The final part focuses on large population dynamic games with nonlinear stochastic dynamical systems involving agents of the following mixed types: (i) a major agent, and (ii) a large population of minor agents. The major and minor agents are coupled via both: (i) their individual nonlinear stochastic dynamics of controlled McKean-Vlasov type, and (ii) their individual finite time horizon nonlinear cost functions. A distinct feature of MFG problems with mixed agents is that even asymptotically (as the population size approaches infinity) the noise process of the major agent causes random fluctuation of the mean field behaviour of the minor agents. To deal with this, a stochastic mean field system is formulated in contrast to the deterministic mean field system employed in standard MFG problems.
Cette thèse se concentre sur la théorie des jeux à population importante (en Anglais, Mean Field Games (MFG)) avec des applications aux systèms de consensus, flocage, chef-suiveur et aux systèmes d'agents majeure-mineure. La méthodologie MFG aborde une classe de jeux dynamiques avec un grand nombre d'agents mineures dans laquelle chaque agent interagit avec l'effet du champ moyen des autres agents par l'intermédiaire d'accouplements dans leurs dynamiques individuelles et des fonctions de coût. Un agent mineur est un agent qui a une influence négligeable sur l'ensemble du système, mais sur lequel la population globale a un effet significatif. Cette thèse est présentée en trois parties principales. La première partie developpe des applications de la méthodologie MFG au consensus d'une population importante et le comportement de flocage. Dans ces formulations, chaque agent cherche à minimiser ses coûts quadratiques individuels, soit escomptés, soit moyennés en temps (c'est-à-dire ergodique), impliquant la moyenne des états de tous les autres agents. Les stratégies résultant de contrôle MFG orientent l'état de chaque agent vers la moyenne de la population initiale, et en appliquant ces stratégies décentraliseés, le systéme atteint un consensus moyen asymptotiquement en temps et en population. La deuxième partie s'intéresse à l'extension du cadre des jeux à population importante linéaire-quadratique-Gaussienne (MF LQG) pour modéliser la dynamique du système collective qui comprennent une grande population de chefs et de suiveurs, et une trajectoire de référence pour les chefs qui est inconnue aux suiveurs. Le coût de chaque chef est basé sur un compromis entre le déplacement vers la trajectoire de référence et de rester près du centre de gravité propre des chefs. D'autre part, les suiveurs réagissent en faisant le suivi d'une combinaison convexe de leur centre de gravité propre et celui des chefs. Les équations MF LQG qui caractérisent l'équilibre de Nash pour les systèmes de population infinie sont dérivées, et, étant donnédes conditions appropriées, ils ont des solutions uniques qui menent aux lois de contrôle décentralisées. Les calculs des lois de contrôle MFG des suiveurs nécessitent la connaissance complète de la trajectoire de référence qui n'est pas généralement connue aux suiveurs, mais qui est estimée par un rapport de vraisemblance, basé sur des observations bruitées d'un échantillon aléatoire des chefs. La dernière partie se concentre sur les jeux dynamiques des populations importantes avec des systèmes dynamiques stochastiques non-linéaires impliquant des agents mixtes suivants: (i) un agent majeur, et (ii) une grande population d'agents mineurs. Les agents majeurs et mineurs sont couplés par ces deux: (i) leurs propres dynamiques stochastiques non-linéaires et contrôlées de type McKean-Vlasov, et (ii) leurs fonctions de coûts individuelles non-linéaires à horizon de temps fini. Une caractéristique distincte des problèmes MFG avec des agents mixtes est que, même asymptotiquement (lorsque la taille de la population tend vers l'infini), le processus de bruit de l'agent majeur provoque une fluctuation aléatoire du comportement du champ moyen des agents mineurs. Pour faire face à cela, un système stochastique à champ moyen est introduite comme extension du système déterministe de champ moyen des problèmes de MFG standard.
Idioma: en