Autor der Publikation

Efficient policy detecting and reusing for non-stationarity in Markov games.

, , , , , , und . Auton. Agents Multi Agent Syst., 35 (1): 2 (2021)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

PLEASE: Palm Leaf Search for POMDPs with Large Observation Spaces., , , , und . SOCS, Seite 238-239. AAAI Press, (2015)FHHOP: A Factored Hybrid Heuristic Online Planning Algorithm for Large POMDPs., und . UAI, Seite 934-943. AUAI Press, (2012)Weighted Double Q-learning., , und . IJCAI, Seite 3455-3461. ijcai.org, (2017)Monte-Carlo Tree Search for Policy Optimization., , , und . CoRR, (2019)Model-Based Offline Weighted Policy Optimization (Student Abstract)., , und . AAAI, Seite 16392-16393. AAAI Press, (2023)Generalizable Task Representation Learning for Offline Meta-Reinforcement Learning with Data Limitations., , , und . AAAI, Seite 17132-17140. AAAI Press, (2024)Efficient policy detecting and reusing for non-stationarity in Markov games., , , , , , und . Auton. Agents Multi Agent Syst., 35 (1): 2 (2021)Efficient Multiagent Policy Optimization Based on Weighted Estimators in Stochastic Cooperative Environments., , , , und . J. Comput. Sci. Technol., 35 (2): 268-280 (2020)Attention-Guided Contrastive Role Representations for Multi-agent Reinforcement Learning., , , , , und . ICLR, OpenReview.net, (2024)ACT: Empowering Decision Transformer with Dynamic Programming via Advantage Conditioning., , , , , und . AAAI, Seite 12127-12135. AAAI Press, (2024)