Reinforcement Learning › Methods ›

Deep RL

3861 directly classified papers

Papers per year

Papers

Speeding up Reinforcement Learning-based Information Extraction Training using Asynchronous Methods EMNLP 2017

Agent-Aware Dropout DQN for Safe and Efficient On-line Dialogue Policy Learning EMNLP 2017

Composite Task-Completion Dialogue Policy Learning via Hierarchical Deep Reinforcement Learning EMNLP 2017

Mapping Instructions and Visual Observations to Actions with Reinforcement Learning EMNLP 2017

An Empirical Analysis of Multiple-Turn Reasoning Strategies in Reading Comprehension Tasks IJCNLP 2017

Reinforced Video Captioning with Entailment Rewards EMNLP 2017

Learning how to Active Learn: A Deep Reinforcement Learning Approach EMNLP 2017

Sentence Simplification with Deep Reinforcement Learning EMNLP 2017

Learning to Diagnose: Assimilating Clinical Narratives using Deep Reinforcement Learning IJCNLP 2017

Reinforcement mechanism design IJCAI 2017

Modular Multitask Reinforcement Learning with Policy Sketches ICML 2017

Averaged-DQN: Variance Reduction and Stabilization for Deep Reinforcement Learning ICML 2017

Improving Stochastic Policy Gradients in Continuous Control with Deep Reinforcement Learning using the Beta Distribution ICML 2017

Stabilising Experience Replay for Deep Multi-Agent Reinforcement Learning ICML 2017

Reinforcement Learning with Deep Energy-Based Policies ICML 2017

Contextual Decision Processes with low Bellman rank are PAC-Learnable ICML 2017

Why is Posterior Sampling Better than Optimism for Reinforcement Learning? ICML 2017

Count-Based Exploration with Neural Density Models ICML 2017

Curiosity-driven Exploration by Self-supervised Prediction ICML 2017

Robust Adversarial Reinforcement Learning ICML 2017

Accelerating Stochastic Composition Optimization JMLR 2017

Hierarchical Reinforcement Learning with Parameters CORL 2017

Mutual Alignment Transfer Learning CORL 2017

Learning End-to-end Multimodal Sensor Policies for Autonomous Navigation CORL 2017

Optimizing Long-term Predictions for Model-based Policy Search CORL 2017