Aprendizaje por refuerzo profundo para la negociación en control predictivo distribuido cooperativo de sistemas multivariables

Aponte, O.E.; Vega, P.; Francisco, M.

Título

dc.contributor	Otros	es_ES
dc.contributor.author	Aponte, O.E.
dc.contributor.author	Vega, P.
dc.contributor.author	Francisco, M.
dc.contributor.other	Otros	es_ES
dc.date	2022
dc.date.accessioned	2023-06-19T06:39:02Z
dc.date.available	2023-06-19T06:39:02Z
dc.identifier.citation	Aponte, O.E., Vega, P., Francisco, M. (2022). Aprendizaje por refuerzo profundo para la negociación en control predictivo distribuido cooperativo de sistemas multivariables. XVII Simposio CEA de Control Inteligente: Reunión anual del grupo de Control Inteligente del comité español de automática (CEA). Libro de Actas, León, 27-29 de junio de 2022. 11-16	es_ES
dc.identifier.isbn	978-84-18490-65-1	es_ES
dc.identifier.uri	http://hdl.handle.net/10612/16790
dc.description.abstract	[ES] En este trabajo se propone una solución novedosa del uso de redes neuronales con aprendizaje por refuerzo, como una opción válida en la negociación de agentes de controladores jerárquicos distribuidos. El método propuesto se implementa en la capa superior de una arquitectura de control jerárquico constituido en sus niveles más bajos por un control distribuido basado en modelos locales y procesos de negociación con lógica difusa. La ventaja de la propuesta es que no requiere el uso de modelos en la negociación y facilita la minimización de cualquier índice de comportamiento dinámico y la especificación de restricciones. Concretamente, se utiliza un agente de gradiente de políticas (PG) del aprendizaje por refuerzo para el entrenamiento del proceso de consenso entre los agentes. El algoritmo se aplica con éxito a un sistema de nivel compuesto por ocho tanques interconectados muy difícil de controlar por su naturaleza no lineal y la alta interacción existente entre sus subsistemas.	es_ES
dc.description.abstract	[EN] In this work, a novel solution of the use of neural networks with reinforcement learning is proposed, as a valid option in the negotiation of distributed hierarchical controller agents. The proposed method is implemented in the upper layer of a hierarchical control architecture constituted in its lower levels by a distributed control based on local models and fuzzy logic negotiation processes. The advantage of the proposal is that it does not require the use of models in the negotiation and facilitates the minimization of any dynamic behaviour index and the specification of constraints. Specifically, in this work, a reinforcement learning policy gradient (PG) algorithm is used to train the consensus process between agents. The resulting algorithm is successfully applied to a level system made up of eight interconnected tanks, which is very difficult to control due to its non-linear nature and the high level of interaction between its subsystems.	es_ES
dc.language	spa	es_ES
dc.publisher	Universidad de León	es_ES
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 Internacional	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Ingeniería de sistemas	es_ES
dc.subject.other	Redes neuronales	es_ES
dc.subject.other	Aprendizaje por refuerzo	es_ES
dc.subject.other	Control distribuido predictivo basado en modelos	es_ES
dc.subject.other	Sistemas multiagente	es_ES
dc.title	Aprendizaje por refuerzo profundo para la negociación en control predictivo distribuido cooperativo de sistemas multivariables	es_ES
dc.title.alternative	Deep reinforcement learning for negotiation in cooperative distributed predictive control of complex systems	es_ES
dc.type	info:eu-repo/semantics/conferenceProceedings	es_ES
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es_ES
dc.page.initial	11	es_ES
dc.page.final	16	es_ES
dc.subject.unesco	1207.14 Formulación de Sistemas	es_ES

Ficheros en el ítem

Nombre:: Aprendizaje_Refuerzo_Profundo_ ...
Tamaño:: 941.3 xmlui.dri2xhtml.METS-1.0.size-kilobytes
Formato:: application/pdf

Visualizar/Abrir

Este ítem aparece en la(s) siguiente(s) colección(ones)

XVII Simposio CEA de Control Inteligente [29]

Mostrar el registro sencillo del ítem

Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional