policy gradient

518 papers

Explore in graph

Also known as

SPG A3C CPGA DPG VPG PG

Co-occurring keywords

reinforcement learning (4122) variance reduction (520) deep reinforcement learning (903) continuous control (246) sample efficiency (469) markov decision process (788) policy optimization (630) sample complexity (1158) off-policy learning (227) multi-agent reinforcement learning (534)

Papers

Off-Policy Proximal Policy Optimization AAAI 2023

A Fair Incentive Scheme for Community Health Workers AAAI 2023

Improving Generalization in Visual Reinforcement Learning via Conflict-aware Gradient Agreement Augmentation ICCV 2023

Actor-Critic based Improper Reinforcement Learning ICML 2022

Understanding Policy Gradient Algorithms: A Sensitivity-Based Approach ICML 2022

Model-free Policy Learning with Reward Gradients AISTATS 2022

Policy Gradient Method For Robust Reinforcement Learning ICML 2022

A Temporal-Difference Approach to Policy Gradient Estimation ICML 2022

An Alternate Policy Gradient Estimator for Softmax Policies AISTATS 2022

Biased Gradient Estimate with Drastic Variance Reduction for Meta Reinforcement Learning ICML 2022

Cliff Diving: Exploring Reward Surfaces in Reinforcement Learning Environments ICML 2022

Policy Learning and Evaluation with Randomized Quasi-Monte Carlo AISTATS 2022

Do Differentiable Simulators Give Better Policy Gradients? ICML 2022

Plan Better Amid Conservatism: Offline Multi-Agent Reinforcement Learning with Actor Rectification ICML 2022

A general class of surrogate functions for stable and efficient reinforcement learning AISTATS 2022

Optimal Estimation of Policy Gradient via Double Fitted Iteration ICML 2022

Convergence of Policy Gradient for Entropy Regularized MDPs with Neural Network Approximation in the Mean-Field Regime ICML 2022

Sample-based Distributional Policy Gradient L4DC 2022

PAGE-PG: A Simple and Loopless Variance-Reduced Policy Gradient Method with Probabilistic Gradient Estimation ICML 2022

Revisiting Some Common Practices in Cooperative Multi-Agent Reinforcement Learning ICML 2022

Independent Policy Gradient for Large-Scale Markov Potential Games: Sharper Rates, Function Approximation, and Game-Agnostic Convergence ICML 2022

Sample and Communication-Efficient Decentralized Actor-Critic Algorithms with Finite-Time Analysis ICML 2022

Towards an Understanding of Default Policies in Multitask Policy Optimization AISTATS 2022

On the Hidden Biases of Policy Mirror Ascent in Continuous Action Spaces ICML 2022

Theoretical Guarantees of Fictitious Discount Algorithms for Episodic Reinforcement Learning and Global Convergence of Policy Gradient Methods AAAI 2022