conftrace_

offline reinforcement learning

492 papers

Explore in graph

Also known as

OFFLINE RL ORL

Co-occurring keywords

policy optimization (630) policy learning (699) model-based reinforcement learning (415) value function (294) sample complexity (1158) deep reinforcement learning (903) imitation learning (741) distribution shift (711) markov decision process (788) reinforcement learning (4122)

Papers

Learning Goal-Conditioned Policies Offline with Self-Supervised Reward Shaping CORL 2022

Latent Plans for Task-Agnostic Offline Reinforcement Learning CORL 2022

Offline reinforcement learning under value and density-ratio realizability: The power of gaps UAI 2022

Conservative Offline Distributional Reinforcement Learning NIPS 2021

PerSim: Data-Efficient Offline Reinforcement Learning with Heterogeneous Agents via Personalized Simulators NIPS 2021

Pessimism Meets Invariance: Provably Efficient Offline Mean-Field Multi-Agent RL NIPS 2021

Nearly Horizon-Free Offline Reinforcement Learning NIPS 2021

Decision Transformer: Reinforcement Learning via Sequence Modeling NIPS 2021

Provable Benefits of Actor-Critic Methods for Offline Reinforcement Learning NIPS 2021

Towards Hyperparameter-free Policy Selection for Offline Reinforcement Learning NIPS 2021

Offline Reinforcement Learning from Human Feedback in Real-World Sequence-to-Sequence Tasks IJCNLP 2021

Offline Reinforcement Learning from Images with Latent Space Models L4DC 2021

BRAC+: Improved Behavior Regularized Actor Critic for Offline Reinforcement Learning ACML 2021

Finite-Sample Regret Bound for Distributionally Robust Offline Tabular Reinforcement Learning AISTATS 2021

Near-Optimal Provable Uniform Convergence in Offline Policy Evaluation for Reinforcement Learning AISTATS 2021

A General Offline Reinforcement Learning Framework for Interactive Recommendation AAAI 2021

Representation Matters: Offline Pretraining for Sequential Decision Making ICML 2021

Uncertainty Weighted Actor-Critic for Offline Reinforcement Learning ICML 2021

Multi-Objective SPIBB: Seldonian Offline Policy Improvement with Safety Constraints in Finite MDPs NIPS 2021

Instabilities of Offline RL with Pre-Trained Neural Representation ICML 2021

Is Pessimism Provably Efficient for Offline RL? ICML 2021

Offline Reinforcement Learning with Reverse Model-based Imagination NIPS 2021

COMBO: Conservative Offline Model-Based Policy Optimization NIPS 2021

Online and Offline Reinforcement Learning by Planning with a Learned Model NIPS 2021

Policy Finetuning: Bridging Sample-Efficient Offline and Online Reinforcement Learning NIPS 2021