reinforcement learning

4122 papers

Explore in graph

Also known as

RLVR HARL GRPO RL PPO REINFORCE RFT DRL RL NULL LQR RLHF

Co-occurring keywords

large language model (12755) policy learning (699) markov decision process (788) policy gradient (518) policy optimization (630) deep reinforcement learning (903) multi-agent system (1743) imitation learning (741) regret bound (1918) language model (4573)

Papers

Online Nonstochastic Model-Free Reinforcement Learning NIPS 2023

q-Learning in Continuous Time JMLR 2023

Information Design in Multi-Agent Reinforcement Learning NIPS 2023

Fast Bellman Updates for Wasserstein Distributionally Robust MDPs NIPS 2023

Belief Projection-Based Reinforcement Learning for Environments with Delayed Feedback NIPS 2023

Learning Score-based Grasping Primitive for Human-assisting Dexterous Grasping NIPS 2023

Diverse Conventions for Human-AI Collaboration NIPS 2023

Prioritizing Samples in Reinforcement Learning with Reducible Loss NIPS 2023

Policy Optimization in a Noisy Neighborhood: On Return Landscapes in Continuous Control NIPS 2023

Continual Learning for Instruction Following from Realtime Feedback NIPS 2023

SustainGym: Reinforcement Learning Environments for Sustainable Energy Systems NIPS 2023

Guiding Large Language Models via Directional Stimulus Prompting NIPS 2023

One Cannot Stand for Everyone! Leveraging Multiple User Simulators to train Task-oriented Dialogue Systems ACL 2023

Dynamic Inference With Grounding Based Vision and Language Models CVPR 2023

Explore to Generalize in Zero-Shot RL NIPS 2023

Breadcrumbs to the Goal: Goal-Conditioned Exploration from Human-in-the-Loop Feedback NIPS 2023

Learning from Active Human Involvement through Proxy Value Propagation NIPS 2023

skrl: Modular and Flexible Library for Reinforcement Learning JMLR 2023

State2Explanation: Concept-Based Explanations to Benefit Agent Learning and User Understanding NIPS 2023

DPOK: Reinforcement Learning for Fine-tuning Text-to-Image Diffusion Models NIPS 2023

Representation Learning in Deep RL via Discrete Information Bottleneck AISTATS 2023

Provably Efficient Reinforcement Learning via Surprise Bound AISTATS 2023

Reinforcement Learning with Fast and Forgetful Memory NIPS 2023

Switching to Discriminative Image Captioning by Relieving a Bottleneck of Reinforcement Learning WACV 2023

Reinforcement Learning Enables Real-Time Planning and Control of Agile Maneuvers for Soft Robot Arms CORL 2023