conftrace_

offline reinforcement learning

492 papers

Explore in graph

Also known as

OFFLINE RL ORL RL

Co-occurring keywords

policy optimization (630) policy learning (699) model-based reinforcement learning (415) value function (294) sample complexity (1158) deep reinforcement learning (903) imitation learning (741) distribution shift (711) markov decision process (788) reinforcement learning (4122)

Papers

Foundations of Multi-Agent Learning in Dynamic Environments: Where Reinforcement Learning Meets Strategic Decision-Making AAAI 2025

Unearthing Gems from Stones: Policy Optimization with Negative Sample Augmentation for LLM Reasoning EMNLP 2025

Distribution-Free Uncertainty Quantification in Mechanical Ventilation Treatment: A Conformal Deep Q-Learning Framework AAAI 2025

Simulation-Free Hierarchical Latent Policy Planning for Proactive Dialogues AAAI 2025

Offline Multitask Representation Learning for Reinforcement Learning NIPS 2024

Online Reinforcement Learning-Based Pedagogical Planning for Narrative-Centered Learning Environments AAAI 2024

Constrained Latent Action Policies for Model-Based Offline Reinforcement Learning NIPS 2024

Zero-Shot Reinforcement Learning from Low Quality Data NIPS 2024

Exploiting Action Impact Regularity and Exogenous State Variables for Offline Reinforcement Learning (Abstract Reprint) AAAI 2024

An Implicit Trust Region Approach to Behavior Regularized Offline Reinforcement Learning AAAI 2024

Deterministic Uncertainty Propagation for Improved Model-Based Offline Reinforcement Learning NIPS 2024

A Perspective of Q-value Estimation on Offline-to-Online Reinforcement Learning AAAI 2024

Optimistic Model Rollouts for Pessimistic Offline Policy Optimization AAAI 2024

Learning Versatile Skills with Curriculum Masking NIPS 2024

DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning NIPS 2024

Minimax Optimal and Computationally Efficient Algorithms for Distributionally Robust Offline Reinforcement Learning NIPS 2024

OCEAN-MBRL: Offline Conservative Exploration for Model-Based Offline Reinforcement Learning AAAI 2024

The Edge-of-Reach Problem in Offline Model-Based Reinforcement Learning NIPS 2024

MetaReflection: Learning Instructions for Language Agents using Past Reflections EMNLP 2024

Federated Ensemble-Directed Offline Reinforcement Learning NIPS 2024

Worst-Case Offline Reinforcement Learning with Arbitrary Data Support NIPS 2024

Neural Network Approximation for Pessimistic Offline Reinforcement Learning AAAI 2024

Offline Primal-Dual Reinforcement Learning for Linear MDPs AISTATS 2024

GTA: Generative Trajectory Augmentation with Guidance for Offline Reinforcement Learning NIPS 2024

Parameterized Projected Bellman Operator AAAI 2024