reinforcement learning

4122 papers

Explore in graph

Also known as

RLVR HARL GRPO RL PPO REINFORCE RFT DRL RL NULL LQR RLHF

Co-occurring keywords

large language model (12755) policy learning (699) markov decision process (788) policy gradient (518) policy optimization (630) deep reinforcement learning (903) multi-agent system (1743) imitation learning (741) regret bound (1918) language model (4573)

Papers

Leveraging Discourse Rewards for Document-Level Neural Machine Translation COLING 2020

Answer-driven Deep Question Generation based on Reinforcement Learning COLING 2020

HateGAN: Adversarial Generative-Based Data Augmentation for Hate Speech Detection COLING 2020

Interactive Question Clarification in Dialogue via Reinforcement Learning COLING 2020

Warren at SemEval-2020 Task 4: ALBERT and Multi-Task Learning for Commonsense Validation COLING 2020

A Berry Picking Robot With A Hybrid Soft-Rigid Arm: Design and Task Space Control RSS 2020

Data Valuation using Reinforcement Learning ICML 2020

Loss Function Search for Face Recognition ICML 2020

Enhanced POET: Open-ended Reinforcement Learning through Unbounded Invention of Learning Challenges and their Solutions ICML 2020

Clinician-in-the-Loop Decision Making: Reinforcement Learning with Near-Optimal Set-Valued Policies ICML 2020

Reinforcement Learning for Integer Programming: Learning to Cut ICML 2020

Adaptive Estimator Selection for Off-Policy Evaluation ICML 2020

Reinforcement Learning for Molecular Design Guided by Quantum Mechanics ICML 2020

Sample Factory: Egocentric 3D Control from Pixels at 100000 FPS with Asynchronous Reinforcement Learning ICML 2020

Learning Selection Strategies in Buchberger’s Algorithm ICML 2020

Stabilizing Transformers for Reinforcement Learning ICML 2020

Learning with Good Feature Representations in Bandits and in RL with a Generative Model ICML 2020

CoMic: Complementary Task Learning & Mimicry for Reusable Skills ICML 2020

Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential Advertising ICML 2020

Leveraging Procedural Generation to Benchmark Reinforcement Learning ICML 2020

Description Based Text Classification with Reinforcement Learning ICML 2020

Discount Factor as a Regularizer in Reinforcement Learning ICML 2020

History-Gradient Aided Batch Size Adaptation for Variance Reduced Algorithms ICML 2020

Designing Optimal Dynamic Treatment Regimes: A Causal Reinforcement Learning Approach ICML 2020

Unknown mixing times in apprenticeship and reinforcement learning UAI 2020