Reinforcement Learning › Methods ›

Deep RL

3861 directly classified papers

Papers per year

Papers

Feedback-Based Tree Search for Reinforcement Learning ICML 2018

Regret Minimization for Partially Observable Deep Reinforcement Learning ICML 2018

Continual Reinforcement Learning with Complex Synapses ICML 2018

Hierarchical Imitation and Reinforcement Learning ICML 2018

Deep Reinforcement Learning in Continuous Action Spaces: a Case Study in the Game of Simulated Curling ICML 2018

Risk-Constrained Reinforcement Learning with Percentile Risk Criteria JMLR 2018

RLlib: Abstractions for Distributed Reinforcement Learning ICML 2018

Learning Environmental Calibration Actions for Policy Self-Evolution IJCAI 2018

Smoothed Action Value Functions for Learning Gaussian Policies ICML 2018

Environment Upgrade Reinforcement Learning for Non-Differentiable Multi-Stage Pipelines CVPR 2018

Time Limits in Reinforcement Learning ICML 2018

Data-Efficient Reinforcement Learning with Probabilistic Model Predictive Control AISTATS 2018

Linear Stochastic Approximation: How Far Does Constant Step-Size and Iterate Averaging Go? AISTATS 2018

Actor-Critic Fictitious Play in Simultaneous Move Multistage Games AISTATS 2018

An Analysis of Categorical Distributional Reinforcement Learning AISTATS 2018

Reinforcement Learning with Function-Valued Action Spaces for Partial Differential Equation Control ICML 2018

Self-Imitation Learning ICML 2018

BanditSum: Extractive Summarization as a Contextual Bandit EMNLP 2018

A Unified Approach for Multi-step Temporal-Difference Learning with Eligibility Traces in Reinforcement Learning IJCAI 2018

Using a Deep Learning Dialogue Research Toolkit in a Multilingual Multidomain Practical Application IJCAI 2018

Towards Sample Efficient Reinforcement Learning IJCAI 2018

Improving Reinforcement Learning with Human Input IJCAI 2018

On Q-learning Convergence for Non-Markov Decision Processes IJCAI 2018

A Finite Time Analysis of Temporal Difference Learning With Linear Function Approximation COLT 2018

Policy Optimization with Second-Order Advantage Information IJCAI 2018