group :: uw_ss19_ml

Lesezeichen (verstecken)4
Anzeige
alles
nur Lesezeichen
Lesezeichen pro Seite
5
10
20
50
100
sortieren nach
hinzugefügt am
Titel
RSS
BibTeX
XML

1Faulty Reward Functions in the Wild
https://openai.com/blog/faulty-reward-functions/
vor 5 Jahren von @lanteunis
alle anzeigen
reinforcement_learning
rl
DRLAlgoComparison
reinforcement_learningrlDRLAlgoComparison
KopierenLöschen
- Community-Eintrag
- Versionsverlauf dieses Eintrags
1notebooks/Q Learning and Deep Q Network.ipynb at master · shakedzy/notebooks · GitHub
https://github.com/shakedzy/notebooks/blob/master/q_learning_and_dqn/Q%20Learning%20and%20Deep%20Q%20Network.ipynb
vor 5 Jahren von @e.fischer
alle anzeigen
reinforcement_learning
basics
tutorial
reinforcement_learningbasicstutorial
KopierenLöschen
- Community-Eintrag
- Versionsverlauf dieses Eintrags
1Policy Gradients in a Nutshell – Towards Data Science
This article aims to provide a concise yet comprehensive introduction to one of the most important class of control algorithms in Reinforcement Learning - Policy Gradients. I will discuss these…
vor 6 Jahren von @dallmann
alle anzeigen
reinforcement_learning
policy_gradients
reinforcement_learningpolicy_gradients
KopierenLöschen
- Community-Eintrag
- Versionsverlauf dieses Eintrags
5Guest Post (Part I): Demystifying Deep Reinforcement Learning
http://www.nervanasys.com/demystifying-deep-reinforcement-learning/
vor 9 Jahren von @dallmann
alle anzeigen
reinforcement_learning
deep_learning
reinforcement_learningdeep_learning
KopierenLöschen
- Community-Eintrag
- Versionsverlauf dieses Eintrags

⟨⟨
⟨
1
⟩
⟩⟩

Publikationen (verstecken)29
Anzeige
alles
nur Publikationen
Publikationen pro Seite
5
10
20
50
100
sortieren nach
hinzugefügt am
Titel
Autor
Erscheinungsdatum
Eintragstyp
Hilfe für erweiterte Sortierung...
RSS
BibTeX
RDF
mehr...

1Improving RTS Game AI by Supervised Policy Learning, Tactical Search, and Deep Reinforcement Learning
N. Barriga, M. Stanescu, F. Besoain, und M. Buro. IEEE Computational Intelligence Magazine, (2019)
vor 5 Jahren von @lanteunis
alle anzeigen
DQN
TotalWar
reinforcement_learning
DRLAlgoComparison
DQNTotalWarreinforcement_learningDRLAlgoComparison
KopierenLöschenDiese Publikation zur Ablage hinzufügen
1Dota 2 with Large Scale Deep Reinforcement Learning
C. Berner, G. Brockman, B. Chan, V. Cheung, P. Debiak, C. Dennison, D. Farhi, Q. Fischer, S. Hashme, C. Hesse und 15 andere Autor(en). ArXiv, (2019)
vor 5 Jahren von @lanteunis
alle anzeigen
reinforcement_learning
DRLAlgoComparison
Dota2
PPO
reinforcement_learningDRLAlgoComparisonDota2PPO
KopierenLöschenDiese Publikation zur Ablage hinzufügen
2Reinforcement Learning in Multi-agent Games: Open AI Gym Diplomacy Environment
D. Cruz, J. Cruz, und H. Lopes Cardoso. Progress in Artificial Intelligence, Seite 49--60. Cham, Springer International Publishing, (2019)
vor 5 Jahren von @lanteunis
alle anzeigen
reinforcement_learning
environment
ACKTR
multi_agent
PPO
reinforcement_learningenvironmentACKTRmulti_agentPPO
KopierenLöschenDiese Publikation zur Ablage hinzufügen
1Distributed Deep Reinforcement Learning: Learn how to play Atari games in 21 minutes
I. Adamski, R. Adamski, T. Grel, A. Jędrych, K. Kaczmarek, und H. Michalewski. (2018)cite arxiv:1801.02852.
vor 5 Jahren von @lanteunis
alle anzeigen
A3C
BA3C
reinforcement_learning
atari
DRLAlgoComparison
A3CBA3Creinforcement_learningatariDRLAlgoComparison
KopierenLöschenDiese Publikation zur Ablage hinzufügen
1On Multi-Agent Learning in Team Sports Games
Y. Zhao, I. Borovikov, J. Rupert, C. Somers, und A. Beirami. (2019)cite arxiv:1906.10124Comment: Presented at ICML 2019 Workshop on Imitation, Intent, and Interaction (I3). arXiv admin note: substantial text overlap with arXiv:1903.10545.
vor 5 Jahren von @lanteunis
alle anzeigen
dqn
reinforcement_learning
PPO
dqnreinforcement_learningPPO
KopierenLöschenDiese Publikation zur Ablage hinzufügen
2Optimal Use of Experience in First Person Shooter Environments
M. Aitchison. 2019 IEEE Conference on Games (CoG), Seite 1-4. (August 2019)cite arxiv:1906.09734.
vor 5 Jahren von @lanteunis
alle anzeigen
dqn
reinforcement_learning
doom
dqnreinforcement_learningdoom
KopierenLöschenDiese Publikation zur Ablage hinzufügen
2Deep Reinforcement Learning for Playing 2.5D Fighting Games
Y. Li, H. Chang, Y. Lin, P. Wu, und Y. Wang. 2018 25th IEEE International Conference on Image Processing (ICIP), Seite 3778-3782. (Oktober 2018)cite arxiv:1805.02070Comment: ICIP 2018.
vor 5 Jahren von @lanteunis
alle anzeigen
A3C
FightingGame
reinforcement_learning
A3CFightingGamereinforcement_learning
KopierenLöschenDiese Publikation zur Ablage hinzufügen
1The Reactor: A fast and sample-efficient Actor-Critic agent for Reinforcement Learning
A. Gruslys, W. Dabney, M. Azar, B. Piot, M. Bellemare, und R. Munos. ICLR, (2017)cite arxiv:1704.04651.
vor 5 Jahren von @lanteunis
alle anzeigen
reinforcement_learning
DRLAlgoComparison
reinforcement_learningDRLAlgoComparison
KopierenLöschenDiese Publikation zur Ablage hinzufügen
1Emergent Tool Use From Multi-Agent Autocurricula
B. Baker, I. Kanitscheider, T. Markov, Y. Wu, G. Powell, B. McGrew, und I. Mordatch. (2019)cite arxiv:1909.07528.
vor 5 Jahren von @lanteunis
alle anzeigen
reinforcement_learning
DRLAlgoComparison
PPO
reinforcement_learningDRLAlgoComparisonPPO
KopierenLöschenDiese Publikation zur Ablage hinzufügen
4Learning from Delayed Rewards
C. Watkins. Publication, (1989)
vor 5 Jahren von @lanteunis
alle anzeigen
reinforcement_learning
Q-Learning
DRLAlgoComparison
reinforcement_learningQ-LearningDRLAlgoComparison
KopierenLöschenDiese Publikation zur Ablage hinzufügen
13Q-learning
C. Watkins, und P. Dayan. Machine Learning, 8 (3): 279--292 (01.05.1992)
vor 5 Jahren von @lanteunis
alle anzeigen
reinforcement_learning
DRLAlgoComparison
q-learning
reinforcement_learningDRLAlgoComparisonq-learning
KopierenLöschenDiese Publikation zur Ablage hinzufügen
4Proximal Policy Optimization Algorithms.
J. Schulman, F. Wolski, P. Dhariwal, A. Radford, und O. Klimov. CoRR, (2017)
vor 5 Jahren von @lanteunis
alle anzeigen
reinforcement_learning
DRLAlgoComparison
ppo
reinforcement_learningDRLAlgoComparisonppo
KopierenLöschenDiese Publikation zur Ablage hinzufügen
3Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation
Y. Wu, E. Mansimov, R. Grosse, S. Liao, und J. Ba. NIPS, Seite 5279-5288. (2017)
vor 5 Jahren von @lanteunis
alle anzeigen
reinforcement_learning
acktr
DRLAlgoComparison
reinforcement_learningacktrDRLAlgoComparison
KopierenLöschenDiese Publikation zur Ablage hinzufügen
2Sample Efficient Actor-Critic with Experience Replay.
Z. Wang, V. Bapst, N. Heess, V. Mnih, R. Munos, K. Kavukcuoglu, und N. de Freitas. CoRR, (2016)
vor 5 Jahren von @lanteunis
alle anzeigen
reinforcement_learning
acer
DRLAlgoComparison
reinforcement_learningacerDRLAlgoComparison
KopierenLöschenDiese Publikation zur Ablage hinzufügen
7Asynchronous Methods for Deep Reinforcement Learning.
V. Mnih, A. Badia, M. Mirza, A. Graves, T. Lillicrap, T. Harley, D. Silver, und K. Kavukcuoglu. CoRR, (2016)
vor 5 Jahren von @lanteunis
alle anzeigen
a3c
reinforcement_learning
DRLAlgoComparison
actor_critic
a3creinforcement_learningDRLAlgoComparisonactor_critic
KopierenLöschenDiese Publikation zur Ablage hinzufügen
3Trust Region Policy Optimization.
J. Schulman, S. Levine, P. Abbeel, M. Jordan, und P. Moritz. ICML, Volume 37 von JMLR Workshop and Conference Proceedings, Seite 1889-1897. JMLR.org, (2015)
vor 5 Jahren von @lanteunis
alle anzeigen
reinforcement_learning
DRLAlgoComparison
reinforcement_learningDRLAlgoComparison
KopierenLöschenDiese Publikation zur Ablage hinzufügen
1Toward Simulating Environments in Reinforcement Learning Based Recommendations.
X. Zhao, L. Xia, Z. Ding, D. Yin, und J. Tang. CoRR, (2019)
vor 5 Jahren von @e.fischer
alle anzeigen
gan
reinforcement_learning
recommendation
ganreinforcement_learningrecommendation
KopierenLöschenDiese Publikation zur Ablage hinzufügen
2A hybrid web recommender system based on Q-learning.
N. Taghipour, und A. Kardan. SAC, Seite 1164-1168. ACM, (2008)
vor 5 Jahren von @e.fischer
alle anzeigen
reinforcement_learning
recommendation
q_learning
reinforcement_learningrecommendationq_learning
KopierenLöschenDiese Publikation zur Ablage hinzufügen
3Addressing function approximation error in actor-critic methods
S. Fujimoto, H. van Hoof, und D. Meger. arXiv preprint arXiv:1802.09477, (2018)
vor 5 Jahren von @e.fischer
alle anzeigen
reinforcement_learning
actor_critic
reinforcement_learningactor_critic
KopierenLöschenDiese Publikation zur Ablage hinzufügen
5Policy Gradient Methods for Reinforcement Learning with Function Approximation
R. Sutton, D. McAllester, S. Singh, und Y. Mansour. Proceedings of the 12th International Conference on Neural Information Processing Systems, Seite 1057--1063. Cambridge, MA, USA, MIT Press, (1999)
vor 5 Jahren von @e.fischer
alle anzeigen
reinforcement_learning
thema
reserved
policy_gradient
reinforcement_learningthemareservedpolicy_gradient
KopierenLöschenDiese Publikation zur Ablage hinzufügen

⟨⟨
⟨
1
2
⟩
⟩⟩

BibSonomy

Lesezeichen (verstecken)4
Anzeige
alles
nur Lesezeichen
Lesezeichen pro Seite
5
10
20
50
100
sortieren nach
hinzugefügt am
Titel
RSS
BibTeX
XML

1Faulty Reward Functions in the Wild

1notebooks/Q Learning and Deep Q Network.ipynb at master · shakedzy/notebooks · GitHub

1Policy Gradients in a Nutshell – Towards Data Science

5Guest Post (Part I): Demystifying Deep Reinforcement Learning

Publikationen (verstecken)29
Anzeige
alles
nur Publikationen
Publikationen pro Seite
5
10
20
50
100
sortieren nach
hinzugefügt am
Titel
Autor
Erscheinungsdatum
Eintragstyp
Hilfe für erweiterte Sortierung...
RSS
BibTeX
RDF
mehr...

1Improving RTS Game AI by Supervised Policy Learning, Tactical Search, and Deep Reinforcement Learning

1Dota 2 with Large Scale Deep Reinforcement Learning

2Reinforcement Learning in Multi-agent Games: Open AI Gym Diplomacy Environment

1Distributed Deep Reinforcement Learning: Learn how to play Atari games in 21 minutes

1On Multi-Agent Learning in Team Sports Games

2Optimal Use of Experience in First Person Shooter Environments

2Deep Reinforcement Learning for Playing 2.5D Fighting Games

1The Reactor: A fast and sample-efficient Actor-Critic agent for Reinforcement Learning

1Emergent Tool Use From Multi-Agent Autocurricula

4Learning from Delayed Rewards

13Q-learning

4Proximal Policy Optimization Algorithms.

3Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation

2Sample Efficient Actor-Critic with Experience Replay.

7Asynchronous Methods for Deep Reinforcement Learning.

3Trust Region Policy Optimization.

1Toward Simulating Environments in Reinforcement Learning Based Recommendations.

2A hybrid web recommender system based on Q-learning.

3Addressing function approximation error in actor-critic methods

5Policy Gradient Methods for Reinforcement Learning with Function Approximation

uw_ss19_ml

Stöbern

Verwandte Tags

Tags

Lesezeichen (verstecken)4 Anzeigeallesnur LesezeichenLesezeichen pro Seite5102050100 sortieren nachhinzugefügt amTitel RSSBibTeXXML

Publikationen (verstecken)29 Anzeigeallesnur PublikationenPublikationen pro Seite5102050100 sortieren nachhinzugefügt amTitelAutorErscheinungsdatumEintragstypHilfe für erweiterte Sortierung... RSSBibTeXRDFmehr...

uw_ss19_ml

Stöbern

Verwandte Tags

Tags

Lesezeichen (verstecken)4
Anzeige
alles
nur Lesezeichen
Lesezeichen pro Seite
5
10
20
50
100
sortieren nach
hinzugefügt am
Titel
RSS
BibTeX
XML

Publikationen (verstecken)29
Anzeige
alles
nur Publikationen
Publikationen pro Seite
5
10
20
50
100
sortieren nach
hinzugefügt am
Titel
Autor
Erscheinungsdatum
Eintragstyp
Hilfe für erweiterte Sortierung...
RSS
BibTeX
RDF
mehr...