Título: Learning of rational behavior in repeated auctions with entry and monitoring fees
Autores: Danak, Amir
Fecha: 2013
Publicador: McGill University - MCGILL
Fuente:
Tipo: Electronic Thesis or Dissertation
Tema: Engineering - Electronics and Electrical
Descripción: This thesis studies the dynamics of decision-making in a repeated auction game used as a basis for designing distributed resource management and task assignment mechanisms. We study the problem of coordinating a group of independent agents in a dynamic environment where individuals make sequential decisions based on their ever-changing knowledge set. We extend the auction-based coordination paradigm presented in previous works to implement long-term desired operational state of the multi-agent system. We model the agent coordination problem as a non-cooperative repeated game and propose its outcome as agents taking strategic actions conditional on their private information, their previous actions, and their beliefs about current state of the system. We present heuristic methodology as a means to find optimal bidding strategies in games with unknown parameters, i.e. when agents do not have any prior knowledge of their opponents and their preferences. We propose approximately optimal strategies as zeros of a differential operator which maps the bidding function space into a real vector space in games where additional details are known about the environment. We describe the decision-making in each stage of the game as the sequential stochastic approximation of the equilibrium strategies, and accordingly improve practical features such as robustness and stability of the proposed strategies. We consider the cost of monitoring the bidding history and submitting sequential bids and propose efficient bidding as attending stages that can improve one's overall performance in the game and staying out when one does not believe it can win the auctioned item. We specialize the proposed solutions for applications in persistent surveillance, online advertising, and distributed computing systems and compare their performance with those commonly used in practice.
Cette thése étudie la dynamique de prise de décision dans un jeu d'enchères répétées. Ce dernier est utilisé comme base pour la conception de gestion des ressources distribuées ainsi que dans les mécanismes d'affectation des taches. Notre problème porte sur la coordination d'un groupe d'agent indépendant dans un environnement dynamique dans lesquels les individus prennent des décisions séquentielles en fonction de leur état de connaissance en constante évolution. Nous étendons le paradigme de coordination des enchères, présentes lors de travaux antérieurs, afin de mettre en œuvre l'état opérationnel désire à long terme du système multi-agent. Nous modélisons le problème de coordination comme un jeu non coopératif répète et proposons ses résultats comme étant des agents, capable de prendre de prendre des mesures stratégiques selon les informations privées détenues, leur précédentes actions, ainsi que leur croyances sur l'état actuel du système. Nous présentons la méthodologie heuristique comme étant un moyen permettant de trouver des stratégies optimales d'appel d'offres dans les jeux a paramètres inconnus, à savoir lorsque les agents n'ont connaissance ni de leurs adversaire ni de leurs préférences. Nous proposons des stratégies optimales d'environ comme zéros d'un opérateur différentiel qui associe l'espace des fonctions d'appel d'offres dans un espace vectoriel réel dans des jeux ou les détails ajoutes sont connus de l'environnement. Nous décrivons la prise de décision à chaque étape des jeux comme étant des approximations séquentielles stochastique des stratégies d'équilibre, et ainsi améliorer les caractéristiques pratiques telles que la robustesse et la stabilité des stratégies proposes. Nous prenons en compte le cout de la surveillance, l'historique des enchères, les séquences des enchères soumises, et proposons des enchères efficientes en tant que participant pouvant améliorer la performance globale du jeu, et évitant de participer lorsque l'on ne croit pas aux chances de réussite. Nous spécialisons les solutions proposes pour des applications dans la surveillance constante, la publicité en ligne, et les systèmes informatiques distribues et ainsi comparer leur performance avec celles utilisées en pratique.
Idioma: en