Reinforcement Learning › Methods ›

Policy Learning

2068 directly classified papers

Papers per year

Papers

Procedure Planning in Instructional Videos via Contextual Modeling and Model-Based Policy Learning ICCV 2021

CAG-QIL: Context-Aware Actionness Grouping via Q Imitation Learning for Online Temporal Action Localization ICCV 2021

Cautious Bayesian Optimization for Efficient and Scalable Policy Search L4DC 2021

Causal Confusion Reduction for Robust Multi-Domain Dialogue Policy INTERSPEECH 2021

Reward is enough for convex MDPs NIPS 2021

Neural optimal feedback control with local learning rules NIPS 2021

Exploring Dynamic Selection of Branch Expansion Orders for Code Generation IJCNLP 2021

Skill Discovery for Exploration and Planning using Deep Skill Graphs ICML 2021

TempoRL: Learning When to Act ICML 2021

Variational Empowerment as Representation Learning for Goal-Conditioned Reinforcement Learning ICML 2021

Beyond Variance Reduction: Understanding the True Impact of Baselines on Policy Optimization ICML 2021

First-Order Methods for Wasserstein Distributionally Robust MDP ICML 2021

Phasic Policy Gradient ICML 2021

Demonstration-Conditioned Reinforcement Learning for Few-Shot Imitation ICML 2021

Kernel-Based Reinforcement Learning: A Finite-Time Analysis ICML 2021

Bilinear Classes: A Structural Framework for Provable Generalization in RL ICML 2021

Reinforcement Learning Under Moral Uncertainty ICML 2021

Confidence-Budget Matching for Sequential Budgeted Learning ICML 2021

Provably Correct Optimization and Exploration with Non-linear Policies ICML 2021

PsiPhi-Learning: Reinforcement Learning with Demonstrations using Successor Features and Inverse Temporal Difference Learning ICML 2021

On Proximal Policy Optimization’s Heavy-tailed Gradients ICML 2021

Decentralized Single-Timescale Actor-Critic on Zero-Sum Two-Player Stochastic Games ICML 2021

Muesli: Combining Improvements in Policy Optimization ICML 2021

Randomized Exploration in Reinforcement Learning with General Value Function Approximation ICML 2021

Inverse Decision Modeling: Learning Interpretable Representations of Behavior ICML 2021