Mostrar el registro sencillo del ítem
dc.contributor | Otros | es_ES |
dc.contributor.author | Aponte, O.E. | |
dc.contributor.author | Vega, P. | |
dc.contributor.author | Francisco, M. | |
dc.contributor.other | Otros | es_ES |
dc.date | 2022 | |
dc.date.accessioned | 2023-06-19T06:39:02Z | |
dc.date.available | 2023-06-19T06:39:02Z | |
dc.identifier.citation | Aponte, O.E., Vega, P., Francisco, M. (2022). Aprendizaje por refuerzo profundo para la negociación en control predictivo distribuido cooperativo de sistemas multivariables. XVII Simposio CEA de Control Inteligente: Reunión anual del grupo de Control Inteligente del comité español de automática (CEA). Libro de Actas, León, 27-29 de junio de 2022. 11-16 | es_ES |
dc.identifier.isbn | 978-84-18490-65-1 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10612/16790 | |
dc.description.abstract | [ES] En este trabajo se propone una solución novedosa del uso de redes neuronales con aprendizaje por refuerzo, como una opción válida en la negociación de agentes de controladores jerárquicos distribuidos. El método propuesto se implementa en la capa superior de una arquitectura de control jerárquico constituido en sus niveles más bajos por un control distribuido basado en modelos locales y procesos de negociación con lógica difusa. La ventaja de la propuesta es que no requiere el uso de modelos en la negociación y facilita la minimización de cualquier índice de comportamiento dinámico y la especificación de restricciones. Concretamente, se utiliza un agente de gradiente de políticas (PG) del aprendizaje por refuerzo para el entrenamiento del proceso de consenso entre los agentes. El algoritmo se aplica con éxito a un sistema de nivel compuesto por ocho tanques interconectados muy difícil de controlar por su naturaleza no lineal y la alta interacción existente entre sus subsistemas. | es_ES |
dc.description.abstract | [EN] In this work, a novel solution of the use of neural networks with reinforcement learning is proposed, as a valid option in the negotiation of distributed hierarchical controller agents. The proposed method is implemented in the upper layer of a hierarchical control architecture constituted in its lower levels by a distributed control based on local models and fuzzy logic negotiation processes. The advantage of the proposal is that it does not require the use of models in the negotiation and facilitates the minimization of any dynamic behaviour index and the specification of constraints. Specifically, in this work, a reinforcement learning policy gradient (PG) algorithm is used to train the consensus process between agents. The resulting algorithm is successfully applied to a level system made up of eight interconnected tanks, which is very difficult to control due to its non-linear nature and the high level of interaction between its subsystems. | es_ES |
dc.language | spa | es_ES |
dc.publisher | Universidad de León | es_ES |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Ingeniería de sistemas | es_ES |
dc.subject.other | Redes neuronales | es_ES |
dc.subject.other | Aprendizaje por refuerzo | es_ES |
dc.subject.other | Control distribuido predictivo basado en modelos | es_ES |
dc.subject.other | Sistemas multiagente | es_ES |
dc.title | Aprendizaje por refuerzo profundo para la negociación en control predictivo distribuido cooperativo de sistemas multivariables | es_ES |
dc.title.alternative | Deep reinforcement learning for negotiation in cooperative distributed predictive control of complex systems | es_ES |
dc.type | info:eu-repo/semantics/conferenceProceedings | es_ES |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | es_ES |
dc.page.initial | 11 | es_ES |
dc.page.final | 16 | es_ES |
dc.subject.unesco | 1207.14 Formulación de Sistemas | es_ES |