Q-learning

Zusammenfassung

Q-learning (Watkins, 1989) is a simple way for agents to learn how to act optimally in controlled Markovian domains. It amounts to an incremental method for dynamic programming which imposes limited computational demands. It works by successively improving its evaluations of the quality of particular actions at particular states.

BibTeX-Schlüssel: Watkins1992
Eintragstyp: article
Jahr: 1992
Monat: may
Tag: 01
Zeitschrift: Machine Learning
Nummer: 3
Seiten: 279--292
Band: 8
issn: 1573-0565
DOI: 10.1007/BF00992698
URL: https://doi.org/10.1007/BF00992698

Nutzer

Kommentare und Rezensionenanzeigen / verbergen

Bitte melden Sie sich an um selbst Rezensionen oder Kommentare zu erstellen.

BibSonomy

Zusammenfassung

Tags

Nutzer

Kommentare und Rezensionenanzeigen / verbergen

Zitieren Sie diese Publikation

Mehr Zitationsstile

Suchen auf