reinforcement learning

4122 papers

Explore in graph

Also known as

RLVR HARL GRPO RL PPO REINFORCE RFT DRL RL NULL LQR RLHF

Co-occurring keywords

large language model (12755) policy learning (699) markov decision process (788) policy gradient (518) policy optimization (630) deep reinforcement learning (903) multi-agent system (1743) imitation learning (741) regret bound (1918) language model (4573)

Papers

Interpretable and Explainable Logical Policies via Neurally Guided Symbolic Abstraction NIPS 2023

Compositional Policy Learning in Stochastic Control Systems with Formal Guarantees NIPS 2023

Learning from Visual Observation via Offline Pretrained State-to-Go Transformer NIPS 2023

Yes, this Way! Learning to Ground Referring Expressions into Actions with Intra-episodic Feedback from Supportive Teachers ACL 2023

Creating Multi-Level Skill Hierarchies in Reinforcement Learning NIPS 2023

Efficient RL with Impaired Observability: Learning to Act with Delayed and Missing State Observations NIPS 2023

Action Inference by Maximising Evidence: Zero-Shot Imitation from Observation with World Models NIPS 2023

TaskMet: Task-driven Metric Learning for Model Learning NIPS 2023

Enhancing Educational Dialogues: A Reinforcement Learning Approach for Generating AI Teacher Responses ACL 2023

Iteratively Learn Diverse Strategies with State Distance Information NIPS 2023

Hierarchical Adaptive Value Estimation for Multi-modal Visual Reinforcement Learning NIPS 2023

Winner Takes It All: Training Performant RL Populations for Combinatorial Optimization NIPS 2023

Adjustable Robust Reinforcement Learning for Online 3D Bin Packing NIPS 2023

PAL to Lend a Helping Hand: Towards Building an Emotion Adaptive Polite and Empathetic Counseling Conversational Agent ACL 2023

Hard Sample Aware Prompt-Tuning ACL 2023

Efficient Potential-based Exploration in Reinforcement Learning using Inverse Dynamic Bisimulation Metric NIPS 2023

Towards Benchmarking and Improving the Temporal Reasoning Capability of Large Language Models ACL 2023

Can Pre-Trained Text-to-Image Models Generate Visual Goals for Reinforcement Learning? NIPS 2023

Dynamics Generalisation in Reinforcement Learning via Adaptive Context-Aware Policies NIPS 2023

Reinforcement Learning with Stepwise Fairness Constraints AISTATS 2023

Unsupervised Keyphrase Extraction by Learning Neural Keyphrase Set Function ACL 2023

Uncertainty Estimation for Safety-critical Scene Segmentation via Fine-grained Reward Maximization NIPS 2023

Temporal Extrapolation and Knowledge Transfer for Lifelong Temporal Knowledge Graph Reasoning EMNLP 2023

Contrastive Modules with Temporal Attention for Multi-Task Reinforcement Learning NIPS 2023

Learning to Modulate pre-trained Models in RL NIPS 2023