reinforcement learning

4122 papers

Explore in graph

Also known as

RLVR HARL GRPO RL PPO REINFORCE RFT DRL RL NULL LQR RLHF

Co-occurring keywords

large language model (12755) policy learning (699) markov decision process (788) policy gradient (518) policy optimization (630) deep reinforcement learning (903) multi-agent system (1743) imitation learning (741) regret bound (1918) language model (4573)

Papers

Practical Nonisotropic Monte Carlo Sampling in High Dimensions via Determinantal Point Processes AISTATS 2020

Value Preserving State-Action Abstractions AISTATS 2020

Sample Complexity of Estimating the Policy Gradient for Nearly Deterministic Dynamical Systems AISTATS 2020

Explicit Mean-Square Error Bounds for Monte-Carlo and Linear Stochastic Approximation AISTATS 2020

A Distributional Analysis of Sampling-Based Reinforcement Learning Algorithms AISTATS 2020

Task-Completion Dialogue Policy Learning via Monte Carlo Tree Search with Dueling Network EMNLP 2020

Don’t Read Too Much Into It: Adaptive Computation for Open-Domain Question Answering EMNLP 2020

Dynamic Context Selection for Document-level Neural Machine Translation via Reinforcement Learning EMNLP 2020

Multi-document Summarization with Maximal Marginal Relevance-guided Reinforcement Learning EMNLP 2020

Expected Policy Gradients for Reinforcement Learning JMLR 2020

AI-Toolbox: A C++ library for Reinforcement Learning and Planning (with Python Bindings) JMLR 2020

Importance Sampling Techniques for Policy Optimization JMLR 2020

Visual Reaction: Learning to Play Catch With Your Drone CVPR 2020

Severity-Aware Semantic Segmentation With Reinforced Wasserstein Training CVPR 2020

A Reinforcement Learning Approach to Strategic Belief Revelation with Social Influence AAAI 2020

Explainable Agency in Reinforcement Learning Agents AAAI 2020

Unpaired Image Enhancement Featuring Reinforcement-Learning-Controlled Image Editing Software AAAI 2020

Deep Reinforcement Learning for Active Human Pose Estimation AAAI 2020

Joint Entity and Relation Extraction with a Hybrid Transformer and Reinforcement Learning Based Model AAAI 2020

Attractive or Faithful? Popularity-Reinforced Learning for Inspired Headline Generation AAAI 2020

AvgOut: A Simple Output-Probability Measure to Eliminate Dull Responses AAAI 2020

What Makes A Good Story? Designing Composite Rewards for Visual Storytelling AAAI 2020

Improving Neural Relation Extraction with Positive and Unlabeled Learning AAAI 2020

Sequence Generation with Optimal-Transport-Enhanced Reinforcement Learning AAAI 2020

Learning from Easy to Complex: Adaptive Multi-Curricula Learning for Neural Dialogue Generation AAAI 2020