Mi DSpace
Usuario
Contraseña
Please use this identifier to cite or link to this item: http://hdl.handle.net/UCSP/15401
Title: (Delta) - radius IVRL: paradigma de integración de aprendizaje por refuerzo en sistemas multi-agente
Authors: Camargo Monroy, Jesús Alejandro
metadata.dc.contributor.advisor: Barrios Aranibar, Dennis
Keywords: Sistema Multi-Agente;Communication model;Reinforcement Learning;Independent Learning
Issue Date: 2016
Publisher: Universidad Católica San Pablo
Abstract: Los sistemas multi-agente han mostrado, por su propia naturaleza, permitir resolver problemas que requieren coordinaci´on y/o cooperaci´on, ello por cuanto permiten representar de forma natural dichas situaciones. Sin embargo, existen algunos problemas relacionados a su representaci´on formal y en consecuencia a su aplicacio´n. El estudio de los modelos formales actuales ha dejado al descubierto algunas de las falencias respecto a su representacio´n y aplicaci´on; con un fallido sistema de comunicaci´on como el problema mayor comu´nmente encontrado. Estando al tanto de este problema proponemos : δ-radius Communication Model, una representacio´n formal para la comunicaci´on en sistemas multi-agente. Los paradigmas dominantes de aprendizaje en el a´rea son Independent Learning e Influence Value Reinforcement Learning. Polos opuestos en relacio´n a la influencia de los agentes respecto a sus compan˜eros. Independent Learning busca establecer un sistema libre de influencia; mientras tanto, Influence Value Reinforcement Learning presenta un escenario en el cual los agentes son influenciados por todos sus compan˜eros en un entorno compartido. Basa´ndonos en ambos extremos, una vista unificada de ambos paradigmas es definida: δ-radius Influence Value Reinforcement Learnig. La visio´n unificada ha de permitir el desarrollo de sistemas intermedios, en los cuales se pueda definir limitaciones expl´ıcitas a la comunicacio´n mediante una nocio´n de distancia entre los agentes y teniendo como limitante a δ, una variable que determinara la distancia ma´xima bajo la cual es posible establecer comunicaci´on entre dos agentes. M´as aun, los resultados de los experimentos desarrollados han demostrado que los sistemas intermedios han de tener una menor complejidad algor´ıtmica y una mejor capacidad de convergencia.
URI: http://repositorio.ucsp.edu.pe/handle/UCSP/15401
Appears in Collections:Tesis Postgrado - Maestría en Ciencia de la Computación

Files in This Item:
File Description SizeFormat 
CAMARGO_MONROY_JES_PAR.pdf6.79 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.