Reinforcement Learning › Methods ›

Deep RL

3861 directly classified papers

Papers per year

Papers

Evaluating Rewards for Question Generation Models NAACL 2019

Non-Asymptotic Gap-Dependent Regret Bounds for Tabular MDPs NIPS 2019

Provably Efficient Q-Learning with Low Switching Cost NIPS 2019

Characterizing the Exact Behaviors of Temporal Difference Learning Algorithms Using Markov Jump Linear System Theory NIPS 2019

Deep Reactive Policies for Planning in Stochastic Nonlinear Domains AAAI 2019

Optimizing Discount and Reputation Trade-Offs in E-Commerce Systems: Characterization and Online Learning AAAI 2019

Deep Reinforcement Learning via Past-Success Directed Exploration AAAI 2019

ELF OpenGo: an analysis and open reimplementation of AlphaZero ICML 2019

Action Robust Reinforcement Learning and Applications in Continuous Control ICML 2019

Making Deep Q-learning methods robust to time discretization ICML 2019

Dynamic Weights in Multi-Objective Deep Reinforcement Learning ICML 2019

Aspect Sentiment Classification Towards Question-Answering with Reinforced Bidirectional Attention Network ACL 2019

Rewarding Smatch: Transition-Based AMR Parsing with Reinforcement Learning ACL 2019

A Hierarchical Reinforced Sequence Operation Method for Unsupervised Text Style Transfer ACL 2019

What Should I Ask? Using Conversationally Informative Rewards for Goal-oriented Visual Dialog. ACL 2019

Guided Dialog Policy Learning: Reward Estimation for Multi-Domain Task-Oriented Dialog EMNLP 2019

Recommendation as a Communication Game: Self-Supervised Bot-Play for Goal-oriented Dialogue EMNLP 2019

VIREL: A Variational Inference Framework for Reinforcement Learning NIPS 2019

A Meta-MDP Approach to Exploration for Lifelong Reinforcement Learning NIPS 2019

When to use parametric models in reinforcement learning? NIPS 2019

Correlation Priors for Reinforcement Learning NIPS 2019

Provably Efficient Q-learning with Function Approximation via Distribution Shift Error Checking Oracle NIPS 2019

Budgeted Reinforcement Learning in Continuous State Space NIPS 2019

Large Scale Markov Decision Processes with Changing Rewards NIPS 2019

Variance Reduced Policy Evaluation with Smooth Function Approximation NIPS 2019