policy gradient

518 papers

Explore in graph

Also known as

SPG A3C CPGA DPG VPG PG

Co-occurring keywords

reinforcement learning (4122) variance reduction (520) deep reinforcement learning (903) continuous control (246) sample efficiency (469) markov decision process (788) policy optimization (630) sample complexity (1158) off-policy learning (227) multi-agent reinforcement learning (534)

Papers

Statistically Efficient Off-Policy Policy Gradients ICML 2020

Asynchronous Coagent Networks ICML 2020

Fast computation of Nash Equilibria in Imperfect Information Games ICML 2020

Learning to Score Behaviors for Guided Policy Optimization ICML 2020

Stabilizing Transformers for Reinforcement Learning ICML 2020

Deep Reinforcement Learning with Robust and Smooth Policy ICML 2020

Safe Policy Learning for Continuous Control CORL 2020

Differentiable Meta-Learning of Bandit Policies NIPS 2020

Discovering Reinforcement Learning Algorithms NIPS 2020

Learning Guidance Rewards with Trajectory-space Smoothing NIPS 2020

Learning 2-opt Heuristics for the Traveling Salesman Problem via Deep Reinforcement Learning ACML 2020

Sample Complexity of Estimating the Policy Gradient for Nearly Deterministic Dynamical Systems AISTATS 2020

Experimental design for MRI by greedy policy search NIPS 2020

BRPO: Batch Residual Policy Optimization IJCAI 2020

How to Learn a Useful Critic? Model-based Action-Gradient-Estimator Policy Optimization NIPS 2020

Expected Policy Gradients for Reinforcement Learning JMLR 2020

A Finite-Time Analysis of Two Time-Scale Actor-Critic Methods NIPS 2020

Meta-Gradient Reinforcement Learning with an Objective Discovered Online NIPS 2020

I4R: Promoting Deep Reinforcement Learning by the Indicator for Expressive Representations IJCAI 2020

Variance Reduction for Evolution Strategies via Structured Control Variates AISTATS 2020

Reinforcement Learning When All Actions Are Not Always Available AAAI 2020

Lifelong Policy Gradient Learning of Factored Policies for Faster Training Without Forgetting NIPS 2020

DISK: Learning local features with policy gradient NIPS 2020

Conditional Importance Sampling for Off-Policy Learning AISTATS 2020

Only Relevant Information Matters: Filtering Out Noisy Samples To Boost RL IJCAI 2020