Metabuscador

Inicio Atrás
Título:	Aprendizaje de selección de acciones en un mundo simple pero impredecible
Autores:	Rojas Sergio A. ; Universidad Distrital Francisco José de Caldas Martínez José J. ; Universidad Nacional de Colombia
Fecha:	2002-04-01
Publicador:	Ingeniería e investigación
Fuente:
Tipo:
Tema:	Ingeniería de sistemas Aprendizaje por refuerzo; Aprendizaje Q; Agentes autónomos; Animats Reinforcement learning; Q learning; Autonomous agents
Descripción:	Uno de los principales problemas estudiados en la simulación de agentes artificiales autónomos es el de la selección de acciones: un mecanismo que le permita al sistema escoger la acción más apropiada para la situación en que se encuentre, de tal forma que maximice su medida de éxito. El aprendizaje por refuerzo representa un enfoque atractivo para atacar este problema, ya que se basa en la búsqueda de señales de premio y la evasión de señales de castigo mediante un proceso de ensayo y error. En este artículo presentamos al PAISA 1, una criatura artificial que aprende a comportarse (seleccionar acciones) utilizando una técnica de aprendizaje por refuerzo (aprendizaje Q) para optimizar la cantidad de comida que puede encontrar en un mundo impredecible, aunque con un espacio estado-acción pequeño. One of the main problems studied in simulation of artificial autonomous agents is the action-selection: a mechanism that allows the system to choice the more suitable action for the specific situation where it is located, in such a way that maximises his success measure. The reinforcement learning represents an attractive approach to attack this problem, cause it is based in the searching of awards signals and the refusing of punishments by a trial and error process. In this paper we present the PAISA 1, an artificial creature that learns to behave (that is, action-selection) using a reinforcement learning technique known as Q-learning, to optimise the amount of food that he can find in an unpredictable world, although in a small state-action space.
Idioma:	Español

1 Aplicación del método de elementos naturales a problemas estructurales,Natural elements’ methods applied to structural problems por González Torres Libardo Andrés ,Garzón Alvarado Diego Alexander ,Roa Garzón Máximo Alejandro	6 Ensayos de biodegradabilidad anaerobia de efluentes cerveceros con lodo granular y lodo floculento,Anaerobic biodegradability essays from brewery wastewater using granular and flocculent sludges por Collazos Chávez C J ,Díaz Báez M C
2 The performance of relational and object-relational SQL queries when using Oracle,Desempeño de consultas SQL relacionales y objeto-relacionales en Oracle por Moreno Arboleda Francisco Javier ,Ospina Romero Guillermo ,Larios Restrepo Rafael	7 Alternativas de modificación del método de Somogyi-Nelson para la determinación de azúcares reductores a partir de sus posibilidades químicas,Alternatives for modifying the Somogyi-Nelson method for determining reducing sugars by using their thermical possibilities por González Blair Gloria Helena ,Castellanos Domínguez Óscar Fernando
3 Creatividad en los Sistemas,Creativity in Computer Systems por Torres Soler Luis Carlos	8 Prospectiva de la producción de oleoquímicos derivados del aceite de palma y de palmiste en Colombia,Prospective study for the production of oleochemicals derivates from palm and palm kernel oil in Colombia por Jaimes Moreno Diana Ibeth ,Romero Pineda Carlos Alexander ,Narváez Rincón Paulo César
4 Evaluación de un método para la determinación de humedad en un medio poroso empleando ultrasonido,Evaluation of a method to measure water content in porous media by employing ultrasound por Sáenz Cruz Luis Leonardo ,Gómez Acero Édgar	9 Estudio granulométrico y su aplicación a los procesos industriales de residuos de corcho y corcho de baja calidad,Study granulometric and their application to the industrial processes of cork residuals and cork of low quality por Macías García Antonio ,Hernández Jiménez Ángel ,Hernández Santiago Javier
5 Estudio del comportamiento de cables amarrados con prensacables,Study of the behavior of tied cables with clips por Takeuchi Tam Caori Patricia	10 Comportamiento estructural de la guadua angustifolia. Uniones en Guadua.,Structural behavior of the guadua angustifolia. Connections in Guadua. por Takeuchi Tam Caori Patricia