%0 %0 Journal Article %A Baxter, J.; Bartlett, P. & Weaver, L. %D 2001 %T Experiments with Infinite-Horizon, Policy- Gradient Estimation %E %B Journal of Artificial Intelligence Research %C %I %V 15 %6 %N %P 351--381 %& %Y %S %7 %8 %9 %? %! %Z %@ %( %) %* %L %M %1 %2 %3 article %4 %# %$ %F baxter2001a %K daanbib, gradients, policy %X %Z %U %+ %^ %0 %0 Conference Proceedings %A Peters, J. & Schaal, S. %D 2006 %T Policy gradient methods for robotics %E %B {Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)} %C Beijing, China %I %V %6 %N %P %& %Y %S %7 %8 %9 %? %! %Z %@ %( %) %* %L %M %1 %2 %3 inproceedings %4 %# %$ %F Peters:2006fk %K daanbib, gradients, learning, policy, reinforcement, robotics %X %Z %U %+ %^ %0 %0 Report %A Suganthan, P. N.; Hansen, N.; Liang, J. J.; Deb, K.; Chen, Y. P.; Auger, A. & Tiwari, S. %D 2005 %T Problem Definitions and Evaluation Criteria for the CEC 2005 Special Session on Real-Parameter Optimization %E %B %C Singapore %I Nanyang Technological University %V %6 %N %P %& %Y %S %7 %8 %9 %? %! %Z %@ %( %) %* %L %M %1 %2 %3 techreport %4 %# %$ %F benchmarkset %K cec2005, criteria, daanbib, evaluation, fitness, function, test %X %Z %U %+ %^