Reinforcement Learning › Methods ›

Policy Learning

2068 directly classified papers

Papers per year

Papers

Addressing Function Approximation Error in Actor-Critic Methods ICML 2018

Clipped Action Policy Gradient ICML 2018

Feedback-Based Tree Search for Reinforcement Learning ICML 2018

Policy Optimization with Demonstrations ICML 2018

Deep Reinforcement Learning in Continuous Action Spaces: a Case Study in the Game of Simulated Curling ICML 2018

Dual Policy Iteration NIPS 2018

Non-delusional Q-learning and value-iteration NIPS 2018

Balanced Policy Evaluation and Learning NIPS 2018

Learning Abstract Options NIPS 2018

Memory Augmented Policy Optimization for Program Synthesis and Semantic Parsing NIPS 2018

Configurable Markov Decision Processes ICML 2018

Smoothed Action Value Functions for Learning Gaussian Policies ICML 2018

Stochastic Variance-Reduced Policy Gradient ICML 2018

PIPPS: Flexible Model-Based Policy Search Robust to the Curse of Chaos ICML 2018

An Inference-Based Policy Gradient Method for Learning Options ICML 2018

Convergent Tree Backup and Retrace with Function Approximation ICML 2018

Learning to Explore via Meta-Policy Gradient ICML 2018

Policy Optimization as Wasserstein Gradient Flows ICML 2018

Improving Reinforcement Learning with Confidence-Based Demonstrations IJCAI 2017

Bridging the Gap Between Value and Policy Based Reinforcement Learning NIPS 2017

Cold-Start Reinforcement Learning with Softmax Policy Gradient NIPS 2017

Adaptive Batch Size for Safe Policy Gradients NIPS 2017

Compatible Reward Inverse Reinforcement Learning NIPS 2017

Is the Bellman residual a bad proxy? NIPS 2017

Policy Gradient With Value Function Approximation For Collective Multiagent Planning NIPS 2017